微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Spark 3.0 - 从 MQTT 流中读取数据

如何解决Spark 3.0 - 从 MQTT 流中读取数据

我想将数据流从基于 mosquitto 的 MQTT 主题读取到我的 Spark 3.0 应用程序中。我通过以下方式尝试使用 Bahir 库:

Dataset<Row> df = sparkSession
           .readStream()
           .format("org.apache.bahir.sql.streaming.mqtt.MQTTStreamSourceProvider")
           .option("topic","mytopic")
           .load("tcp://localhost:1883");

不幸的是这失败了:

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/sql/sources/v2/StreamWriteSupport

显然这仅适用于 2.x Spark。知道如何使用 Spark 3(或使用不同的库)使其工作吗?

解决方法

查看可用的库 here,(see picture below),看起来该库已可用于 Spark 3.x。另外,我不知道有任何其他公共图书馆。

enter image description here

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。