如何解决如何将位代码解码为表情符号 python pandas
如何将pandas中一行的每个文本的位码解码为表情符号,研究案例情感分析
文字 | 情感 |
---|---|
\xf0\x9f\x8e\xb6 la la la...嗯嗯\xf0\x9f\x8e\xa7 "Semua diam,semua bisu"\n"Kita coba tanya sama rumput yg bergoyang" \xe2\x99\ xab\xe2\x99\xab\xe2\x99\xab\xe2\x99\xaa\xe2\x99\xaa\xe2\x99\xaa' | 正面 |
Cerita silat lae \xf0\x9f\x98\x80 semacam wejangan | 否定 |
sewot..\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 dukung dia terus | 正面 |
kunyuk!!!!\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 kuy gaslah | 否定 |
aku sudah mengalaminya \xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 tetiba muncul grub wa | 否定 |
g\n\nlagi bosan huft \xf0\x9f\x98\xaa | 否定 |
我想要的样子:
文字 | 情感 |
---|---|
?啦啦啦...嗯嗯?“Semua diam,semua bisu”\n“Kita coba tanya sama rumput yg bergoyang”♫♫♫♪♪♪' | 正面 |
Cerita silat lae ? semacam wejangan | 否定 |
sewot...??? dukung dia terus | 正面 |
kunyuk!!!!??? kuy gaslah | 否定 |
aku sudah mengalaminya ???? tetiba muncul grub wa | 否定 |
lagi bosan huft ? | 否定 |
我已经尝试过了,但是文本字段中的内容注释都变成了 NaN enter image description here
我没有想法了。任何帮助将不胜感激
解决方法
在将源转换为数据框时应用 encoding
参数。
示例硬编码文本:
import io
import pandas as pd
data_string='''
Text Sentimen
\xf0\x9f\x8e\xb6 la la la...hm hmm \xf0\x9f\x8e\xa7 "Semua diam,semua bisu" "Kita coba tanya sama rumput yg bergoyang" \xe2\x99\xab\xe2\x99\xab\xe2\x99\xab\xe2\x99\xaa\xe2\x99\xaa\xe2\x99\xaa' Positif
Cerita silat lae \xf0\x9f\x98\x80 semacam wejangan Negatif
sewot..\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 dukung dia terus Positif
kunyuk!!!!\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 kuy gaslah Negatif
aku sudah mengalaminya \xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82\xf0\x9f\x98\x82 tetiba muncul grub wa Negatif
g lagi bosan huft \xf0\x9f\x98\xaa Negatif
'''.encode('latin1').decode('utf-8')
df = pd.read_csv( io.StringIO(data_string),sep="\t",encoding='utf-8')
print(df)
输出:.\SO\67060643.py
Text Sentimen
0 ? la la la...hm hmm ? "Semua diam,semua bisu"... Positif
1 Cerita silat lae ? semacam wejangan Negatif
2 sewot..??? dukung dia terus Positif
3 kunyuk!!!!??? kuy gaslah Negatif
4 aku sudah mengalaminya ???? tetiba muncul grub wa Negatif
5 g lagi bosan huft ? Negatif
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。