将 Storm 1 Kafka 拓扑转换为 Heron,有几个问题

如何解决将 Storm 1 Kafka 拓扑转换为 Heron,有几个问题

一直在尝试将 Storm 1.0.6 拓扑切换到 heron。采取措施,移除除 Kafka 喷口以外的所有部件,看看情况如何。有一个main方法如下(从原来的Flux版本修改而来):

import org.apache.heron.eco.Eco;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class KafkaTopology {

    public static void main(String[] args) throws Exception {

        List<String> argList = new ArrayList<String>(Arrays.asList(args));
        String file = KafkaTopology.class.getClassLoader().getResource("topology.yaml").getFile();
        argList.add("local");
        argList.add("--eco-config-file");
        argList.add(file);

        file = KafkaTopology.class.getClassLoader().getResource("dev.properties").getFile();
        argList.add("--props");
        argList.add(file);

        argList.add("--sleep");
        argList.add("36000000");

        String[] ecoArgs = argList.toArray(new String[argList.size()]);

        Eco.main(ecoArgs);

    }
}

YAML 是这样的:

name: "kafkaTopology-XXX_topologyVersion_XXX"
type: "storm"

config:
  topology.workers: ${workers.config}
  topology.max.spout.pending: ${max.spout.pending}
  topology.message.timeout.secs: 120
  topology.testing.always.try.serialize: true
  storm.zookeeper.session.timeout: 30000
  storm.zookeeper.connection.timeout: 30000
  storm.zookeeper.retry.times: 5
  storm.zookeeper.retry.interval: 2000
  properties:
    kafka.mapper.zkServers: ${kafka.mapper.zkServers}
    kafka.mapper.zkPort: ${kafka.mapper.zkPort}
    bootstrap.servers: ${bootstrap.servers}
    kafka.mapper.brokerZkStr: ${kafka.mapper.brokerZkStr}
    kafka.topic.name: ${kafka.topic.name}

components:

  - id: "zkHosts"
    className: "org.apache.storm.kafka.ZkHosts"
    constructorArgs:
      - ${kafka.mapper.brokerZkStr}

  - id: "rawMessageAndMetadataScheme"
    className: "org.acme.storm.spout.RawMessageAndMetadataScheme"

  - id: "messageMetadataSchemeAsMultiScheme"
    className: "org.apache.storm.kafka.MessageMetadataSchemeAsMultiScheme"
    constructorArgs:
      - ref: "rawMessageAndMetadataScheme"

  - id: "kafkaspoutConfig"
    className: "org.apache.storm.kafka.spoutConfig"
    constructorArgs:
      # brokerHosts
      - ref: "zkHosts"
      # topic
      - ${kafka.topic.name}
      # zkRoot
      - "/zkRootKafka.kafkaspout.builder"
      # id
      - ${kafka.topic.name}
    properties:
      - name: "scheme"
        ref: "messageMetadataSchemeAsMultiScheme"
      - name: zkServers
        value: ${kafka.mapper.zkServers}
      - name: zkPort
        value: ${kafka.mapper.zkPort}
      # Retry Properties
      - name: "retryInitialDelayMs"
        value: 60000
      - name: "retryDelayMultiplier"
        value: 1.5
      - name: "retryDelayMaxms"
        value: 14400000
      - name: "retryLimit"
        value: 0

# spout deFinitions
spouts:

  - id: "kafka-spout"
    className: "org.apache.storm.kafka.Kafkaspout"
    parallelism: ${kafka.spout.parallelism}
    constructorArgs:
      - ref: "kafkaspoutConfig"

相关 POM 条目:

        <dependency>
            <groupId>org.apache.heron</groupId>
            <artifactId>heron-api</artifactId>
            <version>0.20.3-incubating</version>
        </dependency>

        <dependency>
            <groupId>org.apache.heron</groupId>
            <artifactId>heron-storm</artifactId>
            <version>0.20.3-incubating</version>
        </dependency>

        <dependency>
            <groupId>org.apache.storm</groupId>
            <artifactId>storm-kafka</artifactId>
            <version>1.0.6</version>
        </dependency>

Main 方法似乎运行良好:

Apr 30,2021 4:38:49 PM org.apache.heron.eco.parser.Ecoparser loadTopologyFromYaml
INFO: Parsing eco config file
Apr 30,2021 4:38:49 PM org.apache.heron.eco.parser.Ecoparser loadTopologyFromYaml
INFO: Performing property substitution.
Apr 30,2021 4:38:49 PM org.apache.heron.eco.parser.Ecoparser loadTopologyFromYaml
INFO: Performing environment variable substitution.
topology type is Storm
Apr 30,2021 4:38:49 PM org.apache.heron.eco.builder.storm.EcoBuilder buildConfig
INFO: Building topology config
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: ---------- TOPOLOGY DETAILS ----------
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: Topology Name: kafkaTopology-XXX_topologyVersion_XXX
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: --------------- spoutS ---------------
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: kafka-spout [1] (org.apache.storm.kafka.Kafkaspout)
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: ---------------- BOLTS ---------------
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: --------------- STREAMS ---------------
Apr 30,2021 4:38:49 PM org.apache.heron.eco.Eco printTopologyInfo
INFO: --------------------------------------
Apr 30,2021 4:38:49 PM org.apache.heron.eco.builder.storm.EcoBuilder buildTopologyBuilder
INFO: Building components
Apr 30,2021 4:38:49 PM org.apache.heron.eco.builder.storm.EcoBuilder buildTopologyBuilder
INFO: Building spouts
Apr 30,2021 4:38:49 PM org.apache.heron.eco.builder.storm.EcoBuilder buildTopologyBuilder
INFO: Building bolts
Apr 30,2021 4:38:49 PM org.apache.heron.eco.builder.storm.EcoBuilder buildTopologyBuilder
INFO: Building streams

Process finished with exit code 0

问题 1: 拓扑立即退出,是否有等效于 Flux '--sleep' 的 Eco 标志以使其运行一段时间(用于调试等)?

问题 2: 有点惊讶我需要拉进 Storm-kafka(以为会有 heron 等价物) - 这是否正确(或其他一些神器?),如果是这样, 1.0.6 是一个可以使用的好版本还是 heron 与其他版本一起使用效果更好?

问题 3: 上面是 YAML 中的 type: "storm",尝试 type: "heron" 会出现以下错误

INFO: Building spouts
Exception in thread "main" java.lang.classCastException: class org.apache.storm.kafka.Kafkaspout cannot be cast to class org.apache.heron.api.spout.IRichspout (org.apache.storm.kafka.Kafkaspout and org.apache.heron.api.spout.IRichspout are in unnamed module of loader 'app')
    at org.apache.heron.eco.builder.heron.spoutBuilder.buildspouts(spoutBuilder.java:42)
    at org.apache.heron.eco.builder.heron.EcoBuilder.buildTopologyBuilder(EcoBuilder.java:70)
    at org.apache.heron.eco.Eco.submit(Eco.java:125)
    at org.apache.heron.eco.Eco.main(Eco.java:161)
    at KafkaTopology.main(KafkaTopology.java:26)

Process finished with exit code 1

这只是它使用 Kafka 的方式吗,类型需要是 Storm 而不是 heron,或者这里有一些解决方法吗?

解决方法

  1. https://search.maven.org/search?q=heron-kafka
,

--verbose:我不知道为什么拓扑会对你关闭。尝试使用 --sleep 标志运行您的提交。此时 Question 2 参数的功能不存在。如果您需要,它可以是添加的功能。

Question 3:有一个 Heron 等价物。在 Heron 被捐赠给 Apache 之后,需要做很多工作才能发布二进制版本。大部分工作已经完成。在下一个版本中,我希望所有二进制工件都能得到适当的分发。

# Note,I manually created this entire path before ever downloading tfhub models /opt/tfhub/tf2/bert_en_uncased_L-12_H-768_A-12_4/ :出现此问题是因为它根据指定的类型查找某个包中的螺栓/喷口。当输入“storm”时,它期望它实现或扩展的类是“org.apache.storm”。当输入“heron”时,它期望它实现或扩展的类是“org.apache.heron”。如果您使用依赖项storm-kafka,则类型需要为“storm”。苍鹭等价物可以在这里找到。 https://search.maven.org/search?q=heron-kafka

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?