微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

ruby-on-rails – 有没有办法检查Ruby变量是否包含二进制数据?

我使用的是 Ruby 2.4和Rails 5.我有一个名为“content”的变体的文件内容.内容可能包含PDF文件,Word文件或HTML文件等数据.有没有办法判断变量是否包含二进制数据?最终,我想知道这是否是PDf,Microsoft Office或其他类型的OpenOffice文件.这个答案 – Rails: possible to check if a string is binary? – 表示我可以检查变量的编码
content.encoding

它会产生

ASCII-8BIT

在二进制数据的情况下,我注意到存在变量中的HTML内容也可能返回“ASCII-8BIT”作为content.encoding的情况,因此使用“content.encoding”不是一个万无一失的方法告诉我,如果我有二进制数据.这样做是否存在,如果是这样,那是什么呢?

解决方法

如果您的真实问题不是关于二进制数据本身,而是关于确定数据的文件类型,我建议您查看 ruby-filemagic gem,这将为您提供更加可靠的信息.该gem是libmagic库上的一个简单的包装器,它是类Unix系统的标准配置.该库通过扫描文件内容并将其与各种文件类型中的一组已知的“魔术”模式进行匹配.

字符串缓冲区的示例用法(例如从数据库读取的数据):

require "ruby-filemagic"

content = File.read("/.../sample.pdf") # just an example to get some data

fm = FileMagic.new
fm.buffer(content)    
#=> "PDF document,version 1.4"

要使宝石工作(并编译),您需要文件实用程序以及您的系统上安装了标题的魔术库.从自述中引用:

The file(1) library and headers are required:

Debian/Ubuntu:: +libmagic-dev+
Fedora/SuSE:: +file-devel+
Gentoo:: +sys-libs/libmagic+
OS X:: brew install libmagic

测试在Rails 5下运行良好.

原文地址:https://www.jb51.cc/ruby/265987.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐