如何解决从latin1西里尔字母字符串中删除黑色菱形问号,然后转换为UTF
有 MysqL DB 和 latin1 编码。无法将数据库编码转换为 UTF8 。假设这是事实。
一张表中的某些数据包含使用表格插入并存储为latin1的西里尔字母。
这是它的表示形式:
подтверждение региÑтрации - Ñчёт за коммунальные уÑлуÐ
$ string =“подтверждениерегистрации-счётзакоммунальныеуслу。”
当我这样做
mb_convert_encoding($string,"latin1","latin1")
与当前$string
变量具有相同的值。 Unicode符号如何在latin1字符串中显示?
问题是从字符串中删除UNICODE替换符号�。我尝试过:
preg_replace('@\x{FFFD}@u','',$string)
但是结果为空。如果将其转换为Unicode,我得到的结果与数据库表示相同
utf8_encode($string) // подÑвеÑждение ÑегиÑÑÑаÑии - ÑÑÑÑ Ð·Ð° коммÑналÑнÑе ÑÑлÑÐ
因此我想通过保存西里尔字母表示形式并将其转换为 utf ,并删除 Unicode替换符号。
我尝试了很多转换,但没有任何帮助。 如果您尝试使用preg_replace删除黑色菱形问号-它将起作用,因为该值是从xdebug复制而来的,不再与我相同。我认为也许这串坏了。但是不知道如何解决它。
最后,我可以说,我读了很多关于latin1 Cyrillic到utf8转换的stackoverflow问题。在这种情况下,它们都没有帮助。字符串可能真的坏了。仍然认为有一种解决方法。
任何帮助表示赞赏。谢谢
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。