微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在Ubuntu中使用python获取与文件关联的元数据列表

我正在尝试使用Ubuntu中的python获取文件关联的元数据列表.

不使用python,命令“extract”工作得很好,但我不知道如何使用它与python,我总是得到一条消息说“提取”没有定义.

解决方法:

我假设您询问“摘要”选项卡下Windows属性”对话框中显示的元数据. (如果没有,请忽略这一点.)这就是我管理它的方式.

>下载并安装Python win32 extensions.这将把win32,win32com等放入你的Python [ver] / Lib / site-packages文件夹中.这些带来了win32api,win32com等等.出于某种原因,我无法获得Python 2.6(在构建216中)的版本.我将我的系统更新为Python 2.7,并使用216版本的Python 2.7,它工作正常. (要下载和安装,请按照上面的链接,单击“pywin32”链接,单击最新版本的链接(当前为216),单击与您的系统和Python安装相匹配的.exe文件链接(对我来说) ,它是pywin32-216.win32-py2.7.exe).运行.exe文件.)
>将Tim Golden教程中“Get document summary information页面代码复制并粘贴到您自己计算机上的.py文件中.
>调整代码.你不必真正调整代码,但如果你将这个Tim的脚本作为主模块运行,并且如果你没有提供路径名作为你的第一个sys.argv,那么你将收到一个错误.要进行调整,请向下滚动到代码底部,并省略最后一个块,该块以if __name__ ==’__ main__’:开头.

文件保存为类似property_reader.py的文件,并调用其property_sets(filepath)方法.此方法返回生成器对象.您可以遍历生成器以查看所有属性及其值.你可以像这样实现它:

# Assuming 'property_reader.py' is the name of the module/file in which you saved Tim Golden's code...
import property_reader 
propgenerator = property_reader.property_sets('[your file path]')
    for name, properties in propgenerator:
        print name
        for k, v in properties.items ():
            print "  ", k, "=>", v

上面代码输出将如下所示:

DocSummaryinformation
   PIDDSI_CATEGORY => qux
Summaryinformation
   PIDSI_TITLE => foo
   PIDSI_COMMENTS => flam
   PIDSI_AUTHOR => baz
   PIDSI_KEYWORDS => flim
   PIDSI_SUBJECT => bar

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐