微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

有没有办法使用 flair nlp 获得单词或字符集的实际向量嵌入?即天赋嵌入

如何解决有没有办法使用 flair nlp 获得单词或字符集的实际向量嵌入?即天赋嵌入

基本上,我正在尝试使用自定义天赋语言模型将单词或句子嵌入向量中。这是可能的还是只有在使用 flair NER 模型时才能使用 fair 嵌入?

当使用嵌入 .embed() 函数时,我收到类似“[Sentence: "pain" [− Tokens: 1]]”的输出 因为我正在寻找连续数字的向量。

谢谢。

解决方法

我很困惑,因为有一个 official tutorial on word embeddings by the flair authors themselves,它似乎正好涵盖了这个主题。我想问题在于您将 .embed() 中已处理的句子对象与所述对象的实际 .embedding 属性混淆了。

在任何情况下,您都可以像这样简单地迭代单个标记的词嵌入(取自上述教程):

from flair.embeddings import WordEmbeddings
from flair.data import Sentence

# init embedding
glove_embedding = WordEmbeddings('glove')

# create sentence.
sentence = Sentence('The grass is green .')

# embed a sentence using glove.
glove_embedding.embed(sentence)

# now check out the embedded tokens.
for token in sentence:
    print(token)
    print(token.embedding)

我对天赋不够熟悉,不知道您是否可以将其应用于任意字符序列,但它对我来说适用于令牌。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。