You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by Tianwang Li <li...@gmail.com> on 2020/09/02 11:16:21 UTC

Flink如何实现至多一次(At Most Once)

我们有一些场景,对实时性要求高,同时对数据重复会有比较大大影响。
我想关闭checkpoint,这样是不是能不能保证“至多一次” (At Most Once) ?
这里会不会有什么坑?
另外:我们允许丢失数据。


-- 
**************************************
 tivanli
**************************************

Re: Flink如何实现至多一次(At Most Once)

Posted by Yun Tang <my...@live.com>.
Hi

如果是完全依赖source的offset管理,可以达到类似 at most once 的语义。

社区其实也有更完备的checkpoint at most once 的实现讨论,已经抄送了相关的开发人员 @yuanmei.work@gmail.com<ma...@gmail.com>

祝好
唐云
________________________________
From: Paul Lam <pa...@gmail.com>
Sent: Thursday, September 3, 2020 17:28
To: user-zh <us...@flink.apache.org>
Subject: Re: Flink如何实现至多一次(At Most Once)

如果每次都从最新的数据开始读的话,关掉 checkpoint 是可以达到 At Most Once。
另外建议还要看看 sink 有没有自动重试机制,可能造成数据重复。

Best,
Paul Lam

> 2020年9月2日 19:16,Tianwang Li <li...@gmail.com> 写道:
>
> 我们有一些场景,对实时性要求高,同时对数据重复会有比较大大影响。
> 我想关闭checkpoint,这样是不是能不能保证“至多一次” (At Most Once) ?
> 这里会不会有什么坑?
> 另外:我们允许丢失数据。
>
>
> --
> **************************************
> tivanli
> **************************************


Re: Flink如何实现至多一次(At Most Once)

Posted by Paul Lam <pa...@gmail.com>.
如果每次都从最新的数据开始读的话,关掉 checkpoint 是可以达到 At Most Once。
另外建议还要看看 sink 有没有自动重试机制,可能造成数据重复。

Best,
Paul Lam

> 2020年9月2日 19:16,Tianwang Li <li...@gmail.com> 写道:
> 
> 我们有一些场景,对实时性要求高,同时对数据重复会有比较大大影响。
> 我想关闭checkpoint,这样是不是能不能保证“至多一次” (At Most Once) ?
> 这里会不会有什么坑?
> 另外:我们允许丢失数据。
> 
> 
> -- 
> **************************************
> tivanli
> **************************************