如何解决获取一维稀疏矩阵的'non-null'len
执行TF-IDF实验,得到一维稀疏矩阵矢量输出,该输出对应于每个句子的tfidf得分。密集输出如下:
[0,0.1349,0.4278,...]
我想执行其他归一化操作,以找出我在文档中的哪组句子中最有意义的。为此,我需要:
- 稀疏矩阵的总和:我通过
.sum()
获得
- 稀疏矩阵中非空值的数量,即其'非空长度'
关于第二点,我知道我可以用todense()
转换稀疏矩阵,然后用np.where()
执行一些Numpy操作并访问.shape[0]
。
但是,为了优化我的代码,我想保留尽可能少的稀疏矩阵和运算。有什么办法吗?
感谢您的帮助!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。