如何解决如何在不保存火花流的情况下将 RDD 转换为 csv?
我有一个火花流管道 (scala),想将 DF 或 RDD 转换为 csv 并通过 ftp 协议进行部署。部署必须是每个批次。是否可以使用 spark-csv 而不保存到 hdfs 来做到这一点?你能推荐另一种方式吗,可能是一些图书馆?可能存在哪些问题?
val stream = ???
case class Record(id:Int,name: String,test: String )
stream.foreachRDD[Record] { rec =>
val csv: String = ???
deploy(csv)
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。