微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用NLTK和beautifulsoup的情感分析

如何解决使用NLTK和beautifulsoup的情感分析

我正在做一个个人项目,我正在考虑使用 NLTK 和 Vader 进行情绪分析来比较总统演讲。

我能够用漂亮的汤找到乔治华盛顿的演讲之一,我设法把演讲放在了一个列表中。但在那之后,我不确定走得更远的最佳方式。从文本文件中读取文件似乎是典型的,但我有包含列表的括号,这使它变得困难。我不确定是否应该将网络抓取的语音存储在文件中,或者只是从列表中工作。或者,也许我应该已经将演讲放入数据框中?我不太确定。

from bs4 import BeautifulSoup
import requests
import spacy
import pandas as pd

page_link = 'https://www.ourdocuments.gov/doc.PHP?flash=false&doc=11&page=transcript'
page_response = requests.get(page_link,timeout=5)
page_content = BeautifulSoup(page_response.content,"html.parser")

textContent = []
for i in range(0,7):
    paragraphs = page_content.find_all("p")[i].text
    textContent.append(paragraphs)

toWrite = open('washington.txt','w')
line = textContent
toWrite.write(str(line))
toWrite.close()

任何帮助或指示将不胜感激。

解决方法

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。