如何解决如何标记来自不同语言或不同 unicode 块的字符串,以便它在浏览器中正确呈现?
我在 VSC 中创建了一个 HTML 文件。它在页面顶部附近有一串孟加拉语。
在 Chrome 中打开时,有时(看似随机)孟加拉语突然呈现为中文和问号:
"爨踶�爨��爨�爨伍�爨��爨��爨�爨�..."
原文字符串是孟加拉语:
“একবারস্বামীজিট্রেনেকরেযাচ্ছিলেন,তিনিসন্যাসীদেরগেরুয়া......”
奇怪的是,即使是标准字母也会被损坏,来自:
"Ēkbár sbámīji ṭrēnē karē yácchilēn,tini sanyasi's"
到:
"���kb叩r sb叩m朝ji 耕�r�n� kar� y叩cchil�n,tini sanyasi�s
即使没有进行任何更改,稍后它也可能会正确打开!这似乎取决于缓存。如果我在同一个字符串中的孟加拉语之前包含一个英语句子,整个事情就会完美呈现。如果我使用在线编译器(使用相同的 chrome 浏览器),它也会完美呈现(不更改 HTML 中的任何内容)。
是否有一些方法可以标记孟加拉语 unicode 块并将字母表包含在我的 HTML 缓存中以确保不会发生这种情况?
解决方法
DanieD 已正确指出问题已通过指示 utf-8 编码的元标记解决。
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。