如何解决如何使用scikit-learn将word_count列添加到dataFrame?
我正在尝试对亚马逊数据进行情感分析。所以,我从读取数据开始
data = pd.read_csv("amazon_baby.csv")
---name---|------review-----|----rating----|
__________|_________________|______________|
| | |
| | |
| | |
___________________________________________|
---name---|------review-----|----rating----|----word_count----|
__________|_________________|______________|__________________|
| | | |
| | | |
| | | |
______________________________________________________________|
我使用以下代码
from sklearn.feature_extraction.text import CountVectorizer
vectorizer = CountVectorizer()
data['word_count'] = vectorizer.fit_transform(data['review'])
data.head()
虽然我希望看到单元格包含如下输出:
[{'recommend': 1.0,'disappointed': 1.0,'wise': 1.0,'love': 1.0,'it': 3.0,'planet': 1.0,'and': 3.0,'bags': 1.0,'wipes': 1.0,'highly': 1.0,'not': 2.0,'early': 1.0,'came': 1.0,'i': 1.0,'does': 1.0,'my': 2.0,'was': 1.0,'Now': 1.0,'wipe': 1.0,'holder': 1.0,'leak': 1.0,'keps': 1.0,'osocozy': 1.0,'moist': 1.0}]
(0,60077)\t1\n (0,24510)\t1\n (0,66612)...
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。