将扩展ASCII转换为UTF8

如何解决将扩展ASCII转换为UTF8

我被要求解决文件中的编码问题。 预期使用UTF8,但实际上使用扩展ASCII。

结果是一个文件,其内容如下:

巴西利亚; Eletrônicos eInformáticaCâmeras eAcessóriosmásica

实际上应该是:

巴西利亚电子信箱卡梅拉斯州Acessóriosmúsica

我用以下代码解决了它:

private static string FixEncodingIssues(string str)
        {
            string fixedStr = str;

            foreach (keyvaluePair<string,string> pair in encodingErrosDic)
                fixedStr = fixedStr.Replace(pair.Key,pair.Value);
            
            return fixedStr;
        }

        private static Dictionary<string,string> encodingErrosDic = new Dictionary<string,string>()
        {
            { "Ã","Ã" },{ "Ã\x81","Á" },{ "À","À" },{ "Â","Â" },{ "Ä","Ä" },{ "Ã…","Å" },{ "Ç","Ç" },{ "È","È" },{ "É","É" },{ "Ê","Ê" },{ "Ë","Ë" },{ "ÃŒ","Ì" },{ "Ã\x8D","Í" },{ "ÃŽ","Î" },{ "Ã\x8F","Ï" },{ "Ã\x90","Ð" },{ "Ñ","Ñ" },{ "Ã’","Ò"},{ "Ó","Ó" },{ "Ô","Ô" },{ "Õ","Õ" },{ "Ö","Ö" },{ "×","×" },{ "Ø","Ø" },{ "Ù","Ù" },{ "Ú","Ú" },{ "Û","Û" },{ "Ãœ","Ü" },{ "Ã\x9D","Ý" },{ "Ã\xA0","à" },{ "á","á" },{ "â","â" },{ "ã","ã" },{ "ä","ä" },{ "Ã¥","å" },{ "æ","æ" },{ "ç","ç" },{ "è","è" },{ "é","é" },{ "ê","ê"},{ "ë","ë" },{ "ì","ì" },{ "î","î" },{ "ï","ï" },{ "Ã\xAD","í" },{ "ð","ð" },{ "ñ","ñ" },{ "ò","ò" },{ "ó","ó" },{ "ô","ô" },{ "õ","õ" },{ "ö","ö" },{ "ø","ø" },{ "ù","ù" },{ "ú","ú" },{ "û","û" },{ "ü","ü" },{ "ý","ý" }
        };

我想知道是否有更好的方法解决此问题。我觉得我的解决方案太粗糙了,不适用于字典中未列出的字节。我想知道是否有一个更干净的解决方案,不涉及列出所有扩展案例,并用等效的UTF8值替换它们。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?