如何解决Flink StatefulFunction对检查点作出反应?
我的有状态函数正在将数据写入数据库,但是它是不确定的,因此从检查点还原可能会导致数据库包含不一致的数据。我的想法是在Flink的持久状态下“缓冲”数据,并仅在检查点完成后才将数据写入数据库。我想我可以通过使用context.sendAfter(Duration duration,Address address,Object input);
来实现此目的,方法是将持续时间设置为高于检查点间隔。
解决方法
按计划,有状态功能2.2将支持Flink数据流作为入口和出口(请参阅https://github.com/apache/flink-statefun/pull/133),然后应允许您使用满足您需要的Flink接收器连接器。如果Flink尚未包含合适的接收器,则可以基于通用的两阶段提交接收器(参与检查点过程)实现一个。
另一种选择是使有状态功能能够知道检查点,但是到目前为止还没有完成(据我所知甚至没有讨论过)。
,目前,处理留下有状态功能(即对数据库的写操作)的副作用的最佳方法是使用恰好一次的出口(例如Kafka)。与其直接从该函数直接写入数据库,不如将消息发送到“副作用出口”。
要完成此操作,您需要编写一个简单的程序,该程序使用该Kafka主题(仅已提交的记录),并将其写入数据库。
为简化此操作,StateFun的未来版本将只包含一个本机JdbcSink。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。