我在网页上做一些文本挖掘.目前我正在使用Java,但也许有更合适的语言来做我想要的.
我想做的一些事情的例子:
根据字母,数字,字母数字,符号等部分(字母,数字,符号等)确定单词的字符类型(有更多类型).
根据统计数据发现停用词.
根据统计数据和一些逻辑,发现一些语法类(动词,名词,介词,联合).
我正在考虑使用Prolog和R(我对这些语言不太了解),但我不知道它们是否对此有用,或者可能是另一种语言更合适.
我可以用哪个?也欢迎Java的好libs.
解决方法:
Python.!
他们在这个区域有一个HELL-LottA图书馆.
但是,我对prologue和R ……一无所知,但是在文本挖掘中,py肯定比java好,而且AI的东西……
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。