微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用Python 3.8.x二进制编码而不是UTF-8编码的Whoosh 2.7?

如何解决使用Python 3.8.x二进制编码而不是UTF-8编码的Whoosh 2.7?

我事先向社区表示了另一个编码/解码问题。

我在Python 3.8中使用latest Whoosh version,2.7.4,

当前,我正在尝试为文档数据库建立索引。将第一个文档添加到索引后, 我使用搜索器词典方法进行了一个简单的测试,以检出新的索引项,只是注意到尽管我对索引编写器的所有输入都是unicode,但所有令牌都以字节字符串形式返回。在彻底搜索文档和讨论之后,我仍然没有找到如何为架构字段指定所需的字符串格式。

在思考了这个问题之后,我认为唯一的影响可能是对输出检查的影响,我可以将其解码回utf-8,希望即使对查询使用unicode输入,也不会影响查询/搜索结果。即使我感觉自己缺少某些东西,并且将来可能会不好用Whoosh,但有人能在这个问题上大放光彩吗?

提前谢谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。