微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在负面情绪情绪分析中添加“-”号

如何解决在负面情绪情绪分析中添加“-”号

我正在创建用于股票市场分析的情绪分析代码。这是代码的核心:

import flair
flair_sentiment = flair.models.TextClassifier.load('en-sentiment')
columns = ['ticker','date','time','headline']
parsed_and_scored_news = pd.DataFrame(parsed_news,columns=columns)
sentiment = []
for head in parsed_and_scored_news['headline']:
    s = flair.data.Sentence(head)
    flair_sentiment.predict(s)
    total_sentiment = s.labels
    sentiment.append(total_sentiment)
    scores_df = pd.DataFrame(sentiment)
    parsed_and_scored_news = parsed_and_scored_news.join(scores_df,rsuffix='_right')
    
# Convert the date column from string to datetime
parsed_and_scored_news['date'] = pd.to_datetime(parsed_and_scored_news.date).dt.dateparsed_and_scored_news.head()

产生以下输出

    ticker     date      time              headline                                    0
0   AMZN    2021-03-26  02:37PM Tech stocks are going to do vey well going for...   POSITIVE (0.9986)
1   AMZN    2021-03-26  01:17PM Amazon mocked idea its drivers urinated in bot...   NEGATIVE (0.9855)
2   AMZN    2021-03-26  01:11PM ThredUp CEO on IPO day: Dont tax resale and Am...   NEGATIVE (0.6743)
3   AMZN    2021-03-26  12:54PM Why this retailer is seeing a triple-digit sal...   POSITIVE (0.9597)
4   AMZN    2021-03-26  12:07PM How to secure your smart home camera                POSITIVE (0.9981)
        

因为我想将数据输入到机器学习模型中,所以我需要分数是数字。我知道使用 probability = sentence.labels[0].score 只给我们分数,但这意味着没有办法将一个陈述是肯定的还是否定的进行分类。有没有办法在归类为负面的分数后面添加一个“-”(否定)符号。例如 - NEGATIVE (0.9855) = -9855。这将确保信息既是数字又是有用的。

解决方法

这段代码对我有用:

sentiment = []
sentiment_score =[]
for head in parsed_and_scored_news['headline']:
    s = flair.data.Sentence(head)
    flair_sentiment.predict(s)
    total_sentiment = s.labels[0].value
    total_sentiment_score = s.labels[0].score
    sentiment.append(total_sentiment)
    sentiment_score.append(total_sentiment_score)
scores_df = pd.DataFrame(sentiment)
scores_df_1 = pd.DataFrame(sentiment_score)
parsed_and_scored_news = parsed_and_scored_news.join(scores_df,rsuffix='_right')
parsed_and_scored_news = parsed_and_scored_news.join(scores_df_1,rsuffix='_right')

st = parsed_and_scored_news['0_right'].tolist()
count = -1
for item in parsed_and_scored_news['0']:
    count = count+1
    if item == 'NEGATIVE':
        lst[count] = 0-lst[count]
    
scores_final = pd.DataFrame(lst)
parsed_and_scored_news = parsed_and_scored_news.join(scores_final,rsuffix='_final')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?