我正在处理来自问卷的SPSS数据,该问卷必须来自M $Word. Word会自动将连字符更改为长连字符,并转换为无法正确显示的字符,即“ – ”变为“ú”.
我的问题:WINDOWS-1252字符集中的utf8ToInt()相当于什么?
utf8ToInt("A") [1] 65
当我使用自己的数据执行此操作时,出现错误:
x <- str_sub(levels(sd$j1)[1],7,7) print(x) [1] "ú" utf8ToInt(x) Error in utf8ToInt(x) : invalid UTF-8 string
但是,x的内容在grep和gsub表达式中完全可用.
> Sys.getlocale() [1] "LC_COLLATE=English_United Kingdom.1252;LC_CTYPE=English_United Kingdom.1252;LC_MONETARY=English_United Kingdom.1252;LC_NUMERIC=C;LC_TIME=English_United Kingdom.1252"
如果通过read.spss form package foreign加载SPSS sav文件,则可以通过指定编码来轻松导入具有正确编码的数据帧:
read.spss("foo.sav",reencode="CP1252")
原文地址:https://www.jb51.cc/windows/365025.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。