微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

放弃 calss 值的问题并在呼吸管标签包中收到结果

如何解决放弃 calss 值的问题并在呼吸管标签包中收到结果

我正在使用 Snorkel Labeling Package 以编程方式标记我的未标记训练数据。我像https://www.snorkel.org/use-cases/01-spam-tutorial

你应该写几个标签函数,比如:

from textblob import TextBlob

@labeling_function()
def lf_sent_blob(x):
    sent = TextBlob(x.text).sentiment.polarity 
    if sent>0:
        return positive
    elif sent<0:
        return negative
    else:
        #return neutral
        return ABSTAIN

然后定义标签函数列表并将其应用于未标记的数据,如下所示:

from snorkel.labeling.model import LabelModel
from snorkel.labeling import PandasLFApplier
from snorkel.labeling import LFAnalysis

lfs = [lf_sent_emoji,lf_has_special,lf_has_capital,lf_not_ABSTAIN_v2,lf_not_ABSTAIN_v1,lf_sent_blob]
# Apply the LFs to the unlabeled training data
applier = PandasLFApplier(lfs)
L_train = applier.apply(df)
# here you analyze your labels
LFAnalysis(L=L_train,lfs=lfs).lf_summary()

这是我的问题,如果一开始我定义类标签值如下,分析结果是有意义的。例如,lf_sent_blob 标签函数标签覆盖范围或标签极性是有意义的。例如 Polarity 根据标签矩阵中的证据推断每个 LF 的极性。

positive = 1
negative = 0
ABSTAIN = -1 # -1 should be reserved for abstain!?

enter image description here

但是,当我将其更改为对我来说更有意义的内容时:

positive = 1
negative = -1
ABSTAIN = 0 

我收到的结果不正确

enter image description here

这是我的问题,如果所有员工都有意义,那么 -1 整数值是否保留给浮潜中的 ABSTAIN 课程?!!!如果是的话,为什么他们没有在他们的教程或文档中提到它?!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。