apache-storm专题提供apache-storm的最新资讯内容,帮你更好的了解apache-storm。
我已根据这些说明安装了 Apache Storm <a href="https://www.tutorialspoint.com/apache_storm/apache_storm_installation.htm" rel="n
我正在设法建立一个docker / fig Mesos集群.我很喜欢无花果和Docker. Docker有很多文档,但是我发现自己正在努力地了解如何使用fig.这是我现在的fig.yaml:zookeeper: image: jplock/zookeeper ports: - '49181:2181' mesosMaster: image:
我有一个原型风暴应用程序,它读取STOMP流并将输出存储在HBase上.它有效,但不是很灵活,我试图以与我们的其他应用程序更一致的方式设置它,但没有太多运气搞清楚当前使用Storm的方式.我们使用spring-jms类,但不是以标准spring方式使用它们,而是在运行时创建它们,并手动设置依赖项.这个项目:https://github.com/granthe
我的要求是 Move data from Oracle to HDFS Process the data on HDFS Move processed data to Teradata. 还需要每15分钟进行一次整个处理.源数据的量可以接近50GB,并且处理的数据也可以是相同的. 经过互联网搜索后,我发现了 ORAOOP to move data from Oracle to HDFS (Have
我有一个目录,另一个进程将文件引入. 我们当前的Storm实现读取此目录并选择最旧的文件并打开该文件的阅读器.此读取器作为spout中的字段保存,因此当调用nextTuple()时,将从文件输出一行.一旦喷口完成读取,它将关闭阅读器并打开一个新的阅读器到一个新文件. 为了增加吞吐量,一个想法是让多个spout同时读取多个文件,因为这些spout将在同一目录中的相同文件上进行争用,是否有一种方法可以
我试图通过以下方式在 Windows下调试Storm Topology(在Storm v 1.0.0上): TopologyBuilder builder = new TopologyBuilder(); builder.setSpout("spout", new RandomIntegerSpout()); builder.setBolt("partialsum", new StatefulSu
我正在尝试在多个喷口之间分享任务.我有一种情况,我从外部来源一次得到一个元组/消息,我想要有多个喷口实例,主要目的是分担负载并提高性能效率. 我可以使用一个Spout本身做同样的事情,但是我想要跨多个分支分享负载.我无法得到扩展负载的逻辑.由于消息的偏移量将不会被知道,直到特定的出口完成消耗部分(即基于缓冲区大小设置). 任何人都可以在逻辑/算法上如何解决这个问题吗? 提前感谢你的时间. 更新响应
我已经开始使用风暴,所以我使用 this tutorial创建简单的拓扑 当我使用LocalCluster运行我的拓扑结构,似乎都很好, 我的问题是我没有在元组上得到ACK,这意味着我的spout ack不会被调用. 我的代码在下面 – 你知道为什么不叫Ack吗? 所以我的拓扑看起来像这样 public StormTopology build() { TopologyBuilder
我正在尝试编写一个执行以下操作的拓扑: >订阅一个twitter feed(基于关键字) >一个聚合螺栓,用于聚合收集中的一些tweets(例如N),并将它们发送给打印机螺栓 >一个简单的螺栓,将集合一次打印到控制台. 在现实中,我想对收藏进行一些更多的处理. 我在本地测试,看起来像是在工作.但是,我不知道我是否正确设置了螺栓上的分组,并且在部署在实际的风暴集群上时可以正常工作.如果有人可以帮助您
我正在使用一个 java类向风暴集群提交一个拓扑,我也打算使用java类来杀死拓扑.但是根据风暴 documentation,以下命令用于杀死拓扑,并且没有Java方法(这有正当的原因) storm kill {stormname} 那么可以从java类调用shell脚本去杀掉拓扑结构吗?杀死拓扑结构的其他方法是什么? 另外,如何获得在风暴集群中运行拓扑的状态? 为了杀死拓扑结构,你可以试试这个