技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

scala – 使用Async HTTP调用的Spark作业

时间：2020-10-22分类：Scala作者：编程之家AI导航网

我从URL列表构建一个RDD,然后尝试使用一些异步http调用获取数据.
在进行其他计算之前我需要所有结果.
理想情况下,我需要在不同节点上进行http调用以进行缩放考虑.

我做了这样的事情：

//init spark
val sparkContext = new SparkContext(conf)
val datas = Seq[String]("url1","url2")

//create rdd
val rdd = sparkContext.parallelize[String](datas)

//httpCall return Future[String]
val requests = rdd.map((url: String) => httpCall(url))

//await all results (Future.sequence may be better)
val responses = requests.map(r => Await.result(r,10.seconds))

//print responses
response.collect().foreach((s: String) => println(s))

//stop spark
sparkContext.stop()

这项工作,但Spark工作永远不会完成！

所以我想知道使用Spark(或Future [RDD])处理Future的最佳实践是什么.

我认为这个用例看起来很常见,但还没有找到任何答案.

最好的祝福

解决方法

this use case looks pretty common

不是真的,因为它根本无法正常工作(可能).由于每个任务都在标准的Scala迭代器上运行,因此这些操作将被压缩在一起.这意味着所有操作都将在实践中阻塞.假设您有三个URL [“x”,“y”,“z”],您的代码将按以下顺序执行：

Await.result(httpCall("x",10.seconds))
Await.result(httpCall("y",10.seconds))
Await.result(httpCall("z",10.seconds))

您可以轻松地在本地重现相同的行为.如果要异步执行代码,则应使用mapPartitions显式处理：

rdd.mapPartitions(iter => {
  ??? // Submit requests
  ??? // Wait until all requests completed and return Iterator of results
})

但这比较棘手.无法保证给定分区的所有数据都适合内存,因此您可能也需要一些批处理机制.

所有这一切都说我无法重现你所描述的问题可能是一些配置问题或httpCall本身的问题.

在旁注上允许单个超时终止整个任务看起来不是一个好主意.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：scala – 测试中的SBT清理钩子下一篇：Scala编码标准：同一行上的花括号

相关推荐

共收录 Twitter 的 14 款开源软件，第 1 页

共收录Twitter的14款开源软件，第1页Twitter的Emoji表情 TwemojiTwemoji是Twitter开源的其完整的Emoji表情图片。开发者可以去GitHub下载完整的表情库，并把这些表情加入到自己的应用或网页中。使用示例：var i = 0;twemoji.parse( ’emoji, m\u276

作者：编程之家时间：2022-11-24

Java和Scala中关于==的区别

Java和Scala中关于==的区别Java：==比较两个变量本身的值，即两个对象在内存中的首地址；equals比较字符串中所包含的内容是否相同。publicstaticvoidmain(String[]args){ Strings1="abc"; Strings2=newString("abc"); System.out.println(s1==s2)

作者：编程之家时间：2022-11-24

Scala怎么使用

本篇内容主要讲解“Scala怎么使用”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Scala怎么使用”吧!语法scala...

作者：编程之家时间：2022-11-02

Scala是一种什么语言

这篇文章主要介绍“Scala是一种什么语言”，在日常操作中，相信很多人在Scala是一种什么语言问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，

作者：编程之家时间：2022-11-11

Scala Trait怎么使用

这篇文章主要介绍“Scala Trait怎么使用”，在日常操作中，相信很多人在Scala Trait怎么使用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，

作者：编程之家时间：2022-11-11

Scala类型检查与模式匹配怎么使用

这篇文章主要介绍“Scala类型检查与模式匹配怎么使用”，在日常操作中，相信很多人在Scala类型检查与模式匹配怎么使用问题上存在疑惑，小编查阅了各式资料，整理...

作者：编程之家时间：2022-11-11

scala中常用但不常见的符号有哪些

这篇文章主要介绍“scala中常用但不常见的符号有哪些”，在日常操作中，相信很多人在scala中常用但不常见的符号有哪些问题上存在疑惑，小编查阅了各式资料，整理...

作者：编程之家时间：2022-11-11

Scala基础知识有哪些

本篇内容主要讲解“Scala基础知识有哪些”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Scala基础知识有哪些”...

作者：编程之家时间：2022-11-11

scala基础知识点有哪些

本篇内容介绍了“scala基础知识点有哪些”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧...

作者：编程之家时间：2022-11-11

Scala下划线怎么使用

本篇内容介绍了“Scala下划线怎么使用”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧...

作者：编程之家时间：2022-11-11

小编推荐

苹果市值2025年有望达4万亿美元