AI 驱动的语义搜索应用 txtai 已发布 5.3 版本,此版本添加了嵌入引导和提示驱动的搜索,以及多种训练语言模型的方法。
提示驱动的搜索是 txtai 中会话搜索的一大进步,它可以将复杂的提示传递给 txtai ,以自定义返回搜索结果的方式。另外,现在支持从头开始培训语言模型。支持屏蔽语言建模 (MLM)、因果语言建模 (CLM) 和替换标记检测(ELECTRA 风格),同属微型模型工作的一部分。
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。
新功能
将语言建模任务添加到 HFTrainer ( #403 )
添加语言建模示例笔记本(#408 )
将常见问题解答部分添加到文档 ( #413 )
添加用于 LLM 的嵌入引导和提示驱动搜索的笔记本 ( #418 )
改进
标准化 BM25 和 TF-IDF 分数(#401 )
如果在 Google Colab 中运行,请添加注释以重新启动内核 - 谢谢@hsm207!( #410 )
提取器管道 2.0 ( #417 )
使文本参数对于应用程序中的提取器管道是可选的(#420 )
Bug修复
修复 ORDER BY 区分大小写的问题(#405 )
更新公告:https://github.com/neuml/txtai/releases/tag/v5.3.0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。