微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

大数据_Flink_Java版_数据处理_Watermark在任务间的传递---Flink工作笔记0054

       上一节我们说到了waterMark,这个时间数据的作用,我们知道waterMark表示在这个时间数据的,之前的数据都已经传输完了.

 

我们来看,我们知道在flink中,一个任务可以分为多个子任务,那么上游任务的数据,到子任务的时候,

数据我们说,如果设置了keyby那么,他分配下游子任务数据的时候,就是按照hashcode,这样分配的

对吧.

   如果没有设置keyby认是通过轮询分配的对吧.

   那么如果从上游来的数据是waterMark呢?这种数据呢?

   他应该怎么做?应该广播出去对吧,如果是waterMark,我们说waterMark就是个时间数据,他

代表在这个时间,之前的数据都已经,传输完毕了,所以如果上游来的数据是waterMark的话,

就要广播出去,告诉所有的下游任务,在这个waterMark之前的数据都已经接收完毕了.

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐