You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by m18814122325 <m1...@163.com> on 2022/07/30 06:22:37 UTC

Flink内部如何做到消息不丢失?

在Storm中会有ack机制来保证消息是否被下个算子是否被处理,那么请问在Flink框架内部中上游算子通过Netty发送消息到下游时,如何做到消息不会因为网络原因等各种异常情况产生丢失情况?

谢谢

Re: Flink内部如何做到消息不丢失?

Posted by yidan zhao <hi...@gmail.com>.
我最近也在对比storm和flink。有没有大佬介绍下,storm这种ack模式的是不是恢复会更快点,目前我感觉storm的架构下,各个节点的fail
over更加独立感觉。
Flink 目前集群中任何一个机器失败都会导致整个任务重启,耗时会长点。
但是从全局资源来说,ckpt的资源占用貌似又比ack模式少。
不知道理解对不对。

tison <wa...@gmail.com> 于2022年7月30日周六 14:28写道:
>
> 可以看下这两份材料
>
> *
> https://nightlies.apache.org/flink/flink-docs-release-1.15/docs/dev/datastream/fault-tolerance/checkpointing/
> * https://zhuanlan.zhihu.com/p/102607983
>
> 其实就是 Flink 里 Exactly-once 的实现方式,简单说来就是分布式快照批量提交,上游数据可以回放。
>
> Best,
> tison.
>
>
> m18814122325 <m1...@163.com> 于2022年7月30日周六 14:22写道:
>
> >
> > 在Storm中会有ack机制来保证消息是否被下个算子是否被处理,那么请问在Flink框架内部中上游算子通过Netty发送消息到下游时,如何做到消息不会因为网络原因等各种异常情况产生丢失情况?
> >
> > 谢谢

Re: Flink内部如何做到消息不丢失?

Posted by tison <wa...@gmail.com>.
可以看下这两份材料

*
https://nightlies.apache.org/flink/flink-docs-release-1.15/docs/dev/datastream/fault-tolerance/checkpointing/
* https://zhuanlan.zhihu.com/p/102607983

其实就是 Flink 里 Exactly-once 的实现方式,简单说来就是分布式快照批量提交,上游数据可以回放。

Best,
tison.


m18814122325 <m1...@163.com> 于2022年7月30日周六 14:22写道:

>
> 在Storm中会有ack机制来保证消息是否被下个算子是否被处理,那么请问在Flink框架内部中上游算子通过Netty发送消息到下游时,如何做到消息不会因为网络原因等各种异常情况产生丢失情况?
>
> 谢谢