如何解决可以粘贴爬虫读取 xml zip 文件
我有一个 xml zip 文件。我可以使用胶水爬虫创建模式吗? 我试图使用爬虫 XML 分类器并将分类器添加到爬虫中以创建表。 因为它的 zip 文件。无法阅读。任何人都可以体验在胶水爬虫中使用 Zip 文件
解决方法
AWS 胶水可以读取 zip 文件,但 zip 文件只能包含一个文件。来自docs:
ZIP(支持包含仅一个文件的档案)。请注意,Zip 在其他服务中没有得到很好的支持(因为存档的原因)。
但是,读取 xml 非常有限。并非所有 xml 文件都可以读取。例如,您无法读取 docs 中所示的自闭合元素。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。