微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

c# – 计算特殊的UTF-8字符

我正在寻找一种方法来计算由多个角色组成的特殊角色,但在网上找不到解决方案!

对于例如我想数字串“வாழைப்பழம”.它实际上由6个泰米尔字符组成,但在这种情况下,当我们使用常规方法查找长度时,它的9个字符.我想知道泰米尔是唯一会导致此问题的编码,如果有解决方案的话.我目前正在尝试在C#中找到解决方案.

提前谢谢=)

解决方法

使用 StringInfo.LengthInTextElements
var text = "வாழைப்பழம";
Console.WriteLine(text.Length);                               // 9
Console.WriteLine(new StringInfo(text).LengthInTextElements); // 6

有关此行为的说明可以在String.Length的文档中找到:

The Length property returns the number of Char objects in this instance,not the number of Unicode characters. The reason is that a Unicode character might be represented by more than one Char. Use the System.Globalization.StringInfo class to work with each Unicode character instead of each Char.

原文地址:https://www.jb51.cc/csharp/97265.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐