微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Tartar 语言和 UTF-8

如何解决Tartar 语言和 UTF-8

我正在开展一个项目,该项目包括将拉丁符号转换为相应的西里尔字母。我说的是俄罗斯许多国家之一使用的鞑靼语。我尝试在 UTF-8 中找到这些符号,但到目前为止都失败了。我唯一需要的是用于牙垢符号的 UTF 代码。其中有6个。 谢谢!!

解决方法

我不确定您指的是哪六个。

来自Wikipedia

鞑靼斯坦使用的官方西里尔文版本的鞑靼字母 包含 39 个字母:

А Ә Б В Г Д Е (Ё) Ж Җ З И Й К Л М Н Ң О Ө П Р С Т У Ү Ф Х Һ Ц Ч Ш Щ Ы Ь Э Ю Я

Unicode 代码点:

U+0410 А
U+04D8 Ә
U+0411 Б
U+0412 В
U+0413 Г
U+0414 Д
U+0415 Е
U+0401 Ё
U+0416 Ж
U+0496 Җ
U+0417 З
U+0418 И
U+0419 Й
U+041A К
U+041B Л
U+041C М
U+041D Н
U+04A2 Ң
U+041E О
U+04E8 Ө
U+041F П
U+0420 Р
U+0421 С
U+0422 Т
U+0423 У
U+04AE Ү
U+0424 Ф
U+0425 Х
U+04BA Һ
U+0426 Ц
U+0427 Ч
U+0428 Ш
U+0429 Щ
U+042A Ъ
U+042B Ы
U+042C Ь
U+042D Э
U+042E Ю
U+042F Я
,

Tatar 使用西里尔字母,因此您可能需要检查以下块:

  • U+0400 - U+04FF(基础)
  • U+0500 - U+052F(补充)
  • U+2DE0 - U+2DFF(扩展 A)
  • U+A640 - U+A69F(扩展 B)
  • U+1C80 - U+1C8F(扩展 C)。

Unicode 通用语言环境数据存储库(请参阅 tt)具有以下数据:

<characters>
    <exemplarCharacters>[а ә б в г д е ё ж җ з и й к л м н ң о ө п р с т у ү ф х һ ц ч ш щ ъ ы ь э ю я]</exemplarCharacters>
    <exemplarCharacters type="auxiliary" draft="contributed">[ғ қ]</exemplarCharacters>
    <exemplarCharacters type="index" draft="contributed">[А Ә Б В Г Д Е Ё Ж Җ З И Й К Л М Н Ң О Ө П Р С Т У Ү Ф Х Һ Ц Ч Ш Щ Ъ Ы Ь Э Ю Я]</exemplarCharacters>
    <exemplarCharacters type="numbers" draft="contributed">↑↑↑</exemplarCharacters>
    <exemplarCharacters type="punctuation" draft="contributed">[\- ‐ ‑ – —,; \: ! ? . … ' ‘ ’ &quot; “ ” ( ) \[ \] § @ * / \&amp; # ′ ″]</exemplarCharacters>
</characters>

如你所见,内容不多,而且有些数据是draft=contributed,所以还是草稿。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。