微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

StormCrawler /Elastic Search Apache Tika 用于解析 PDF运行拓扑时出错

如何解决StormCrawler /Elastic Search Apache Tika 用于解析 PDF运行拓扑时出错

我在运行 es-crawler.flux 拓扑时遇到以下错误。我不确定我做错了什么。我不认为有 yaml 错误


  **I added the Apache Tika module as an dependency in the pom.xml. file** 


           <!-- Add tika dependency  -->
              <dependency>
                      <groupId>com.digitalpebble.stormcrawler</groupId>
                      <artifactId>storm-crawler-tika</artifactId>
                      <version>${stormcrawler.version}</version>
              </dependency>

更新了此处引用的 es-crawler.flux 文件* https://gist.github.com/jnioche/3f09c2e3f7da845181b733253bc806f1

我运行了拓扑
**Got the following results.**

线程“main”中的异常无法为 JavaBean=org.apache.storm.flux.model.TopologyDef@65e98b1c 创建 property=streams in 'string',line 1,column 1: {{1} } name: "devcrawler" 无法为 JavaBean 创建属性=分组=org.apache.storm.flux.model.StreamDef@1ff4931d ^在“字符串”中,第 94 行,第 5 列:{{ 1}} - 来自:“分流”``` ^

 

解决方法

我从上面的 Gist 复制了 Flux 文件,它运行没有问题。也许您的文件中的行对齐不正确(例如缺少空格)?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。