如何解决Java 斯坦福 NLP:语音标签的一部分?
JJ是形容词。NNS是名词,复数。VBP 是动词现在时。RB是副词。
那是给英语的。对于中国人来说,它是 Penn Chinese Treebank。对于德语,它是 NEGRA 语料库。
- CC 协调连词
- CD 基数
- DT 确定器
- EX Existential there
- FW 外来词
- IN 介词或从属连词
- JJ形容词
- JJR 形容词,比较级
- JJS 形容词,最高级
- LS 列表项标记
- MD模态
- NN 名词,单数或质量
- NNS 名词,复数
- NNP 专有名词,单数
- NNPS 专有名词,复数
- PDT 预定义器
- POS 所有格结尾
- PRP人称代词
- PRP$ 所有格代词
- RB 副词
- RBR 副词,比较
- RBS 副词,最高级
- 反相粒子
- 符号
- 到
- 呃感叹词
- VB 动词,基本形式
- VBD 动词,过去式
- VBG 动词、动名词或现在分词
- VBN 动词,过去分词
- VBP 动词,非第三人称单数现在时
- VBZ 动词,第三人称单数现在时
- WDT Wh确定器
- WP Wh 颅代词
- WP$ 所有格代词
- WRB 头颅副词
解决方法
在这里演示的斯坦福 NLP给出了这样的输出:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
词性标签是什么意思?我找不到正式的名单。是斯坦福自己的系统,还是他们使用通用标签?(JJ
例如,什么是?)
此外,例如,当我遍历句子、寻找名词时,我最终会做一些事情,比如检查 tag 是否为.contains('N')
.
这感觉很弱。有没有更好的方法来以编程方式搜索某个词性?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。