微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Java 斯坦福 NLP:语音标签的一部分?

如何解决Java 斯坦福 NLP:语音标签的一部分?

宾州树库项目。查看词性标记ps。

JJ是形容词。NNS是名词,复数。VBP 是动词现在时。RB是副词。

那是给英语的。对于中国人来说,它是 Penn Chinese Treebank。对于德语,它是 NEGRA 语料库。

  1. CC 协调连词
  2. CD 基数
  3. DT 确定器
  4. EX Existential there
  5. FW 外来词
  6. IN 介词或从属连词
  7. JJ形容词
  8. JJR 形容词,比较级
  9. JJS 形容词,最高级
  10. LS 列表项标记
  11. MD模态
  12. NN 名词,单数或质量
  13. NNS 名词,复数
  14. NNP 专有名词,单数
  15. NNPS 专有名词,复数
  16. PDT 预定义器
  17. POS 所有格结尾
  18. PRP人称代词
  19. PRP$ 所有格代词
  20. RB 副词
  21. RBR 副词,比较
  22. RBS 副词,最高级
  23. 反相粒子
  24. 符号
  25. 呃感叹词
  26. VB 动词,基本形式
  27. VBD 动词,过去式
  28. VBG 动词、动名词或现在分词
  29. VBN 动词,过去分词
  30. VBP 动词,非第三人称单数现在时
  31. VBZ 动词,第三人称单数现在时
  32. WDT Wh确定器
  33. WP Wh 颅代词
  34. WP$ 所有格代词
  35. WRB 头颅副词

解决方法

在这里演示的斯坦福 NLP给出了这样的输出:

Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.

词性标签是什么意思?我找不到正式的名单。是斯坦福自己的系统,还是他们使用通用标签?(JJ例如,什么是?)

此外,例如,当我遍历句子、寻找名词时,我最终会做一些事情,比如检查 tag 是否为.contains('N').
这感觉很弱。有没有更好的方法来以编程方式搜索某个词性?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。