技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

ruby-on-rails – 从Rails应用程序(Word,PDF,Excel等)搜索附件

时间：2020-09-06分类：Ruby作者：编程之家

我给Stack Overflow的第一篇帖子请你温柔！我即将为客户启动一个新的 Ruby on Rails(3.1)项目.他们的要求之一是有一个搜索引擎,它将索引大约2,000个文档,这些文档是PDF,Word,Excel和HTML的混合.

我本来希望使用思考 – 狮身人面像或Texticle(在https://www.ruby-toolbox.com/categories/rails_search.html最受欢迎),但据我所知：

> Texticle需要Postgresql.我在使用MysqL.
> thinking-sphinx不会索引文件系统上的文件.
>即使我将附件保存到数据库中,思考 – sphinx仍然无法正常工作,因为它需要纯文本(根据http://groups.google.com/group/thinking-sphinx/browse_thread/thread/69cdc1c8e1c096ff)

所以我有两个选择：

>选择其他搜索工具
>尝试将附件的纯文本版本提取到数据库中,以便思考sphinx进行阅读

你推荐哪种方法？

如果它是一个不同的搜索工具,哪一个？我的要求是非常基本的,所以我真的很喜欢一个很容易设置的,并且有很多文档,示例和教程！

如果它正在提取,你能推荐常用文件类型的提取器,如PDF,Excel和HTML吗？

感谢大家.非常感谢您的帮助.

解决方法

好吧,我以前没有做过二进制文件索引,但显然Solr支持它看 Indexing files with SPHINX/ultrasphinx和
http://wiki.apache.org/solr/ExtractingRequestHandler Solr有很多可用的宝石,太阳黑子似乎是一个受欢迎的宝石 http://outoftime.github.com/sunspot/虽然太阳黑子似乎没有内置支持Solr Cells,但似乎有一些工作进入它 https://github.com/tomasc/sunspot_cell那里可能有更好的选择,但这应该给你一个很好的起点.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：ruby-on-rails – 如何防止force_s 下一篇：ruby-on-rails – 使用许多基于关联

相关推荐

ruby on rails validates

validates:conclusion,:presence=>true,:inclusion=>{:in=>[0,1]}validates:email,:presence=>true,:length=>{:minimum=>3,:maximum=>254},:uniqueness=>true,:email=>truevalidates:ending_order,

作者：编程之家时间：2022-10-09

redis 集群搭建

一、redis集群搭建redis3.0以前，提供了Sentinel工具来监控各Master的状态，如果Master异常，则会做主从切换，将Slave作为master，将master做为slave。其配置也较复杂，且表现一般。redis3.0以后已经支持集群容错功能，并且非常简单1.1素材准备centos7（集群搭建，至少三个master。需

作者：编程之家时间：2022-10-09

如何让ruby中的ri起作用

分享一下我老师大神的人工智能教程。零基础！通俗易懂！风趣幽默！还带黄段子！希望你也加入到我们人工智能的队伍中来！https://blog.csdn.net/jiangjunshow 不知道大家是否注意到，全新安装ruby之后，无论是在windows或是linux还是macosX下使用rix

作者：编程之家时间：2022-10-09

ruby方法名之命名方式

上一篇博文 ruby传参之引用类型里边定义了一个方法名 modify_my_object!，这个方法名是以!结尾，在ruby的对象里边是用于表达修改本身的意思。比如String#gsub，返回的是一个新的字符串对象；而String#gsub!，返回的是自身已经被修改的对象。不止!这样的特殊字符可以命名，ruby

作者：编程之家时间：2022-10-09

一编程与编程语言什么是编程语言？能够被计算机所识别的表达方式即编程语言,语言是沟通的介质，而编程语言是程序员与计算机沟通的介质。什么是编程？编程即程序员根据需求把自己的思想流程按照某种编程语言的语法风格编写下来，产出的结果就是包含一堆字符的文件。二编程语言分

作者：编程之家时间：2022-10-09

雷林鹏分享：Ruby 类和对象

Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编程语言的特性包括：数据封装数据抽象多态性继承这些特性将在面向对象的Ruby中进行讨论。一个面向对象的程序，涉及到的类和对象。类是个别对象创建的蓝图。在面向对象的术语中，您

作者：编程之家时间：2022-10-09

1.ruby的标签<ruby>漢<rp>(<p><rt>han<t><rp>)<p>字<rp>(<p><rt>zi<t><rp>)<p><uby>

作者：编程之家时间：2022-10-09

Redis安装及单机集群搭建总结(多节点搭建集群和单机集群大同小异)

1、软件安装1.安装包是个压缩包-->解压到/homeedis_tar下命令如下： tar-zxvf./../-C/homeedis_tar2.安装c++环境yum-yinstallgcc-c++（注：redis底层源码是c++）3.解压后需要源码编译进入到redis-3.0.0后执行make4.编译完后开始安装需要指定一个安装路径

作者：编程之家时间：2022-10-09

sass(scss的安装

1.sass基于Ruby语言开发而成，因此安装sass前需要安装Ruby。（注:mac下自带Ruby无需在安装Ruby!）window下安装SASS首先需要安装Ruby，先从官网下载Ruby并安装。安装过程中请注意勾选AddRubyexecutablestoyourPATH添加到系统环境变量。ruby官网：https:/ubyinstaller.org/downloa

作者：编程之家时间：2022-10-09

从0使用Ruby on Rails打造企业级RESTful API项目实战之我的云音乐

本节对我们项目实现的功能和知识点做一个简单的介绍，因为是RESTfulAPI项目，所以对于后端来说基本上没有什么UI界面可展示，那我们就在关键的点，使用客户端（Android）实现的效果图。课程简介这是一门企业级项目实战课程，目的是从0使用Rails开发一个企业级RESTfulAPI项目；他不能让你年薪30

作者：编程之家时间：2022-10-09

小编推荐

苹果市值2025年有望达4万亿美元