如何解决如何编写一个算法,根据假名读数为日本汉字生成假名读数
我目前正在编写日语单词和汉字的多语言在线词典。我目前的问题是为表达式、句子和单词中的汉字组合生成假名。我在每种情况下都有假名和汉字读法(分开),但我没有可靠的算法来工作,它根据假名读法为每个汉字组合生成读数。
我不需要每个汉字的准确读数,根据我拥有的数据,这显然是不可能的,但应该可以确定所有汉字复合物的读数,因为我有假名的完整句子/单词/表达。
我有:
kanji = 私は学生です
kana = わたしはがくせいです
我想自动分配
私到わたし
和
学生到がくせい。
我尝试遍历汉字字符串并检查假名和汉字之间的字符是否“改变”,然后查找直到假名字符串中的这个位置。这种方法适用于所有没有汉字后跟平假名音节的句子,平假名音节与汉字阅读结束时相同。
我的另一个想法是替换假名中汉字串中的所有平假名化合物,并将左侧的假名化合物作为汉字的读数。这显然不适用于每种情况。
我怎样才能写出这样一个算法,在任何情况下都适用?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。