You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by 1048262223 <10...@qq.com> on 2020/06/09 06:08:31 UTC

回复:Flink异常及重启容错处理

Hi


1.生产环境中一般都需要try catch捕获异常,因为无法保证上游数据完全没有问题
2.程序默认无限重启代表你的数据有问题,重复处理错误数据,重复失败重启,根本原因还是在错误数据这里
3.某条数据出现异常,try catch + 加perf log + 加监控(报警)等


Best,
Yichao Yang




------------------&nbsp;原始邮件&nbsp;------------------
发件人:&nbsp;"Z-Z"<zz9876543210@qq.com&gt;;
发送时间:&nbsp;2020年6月9日(星期二) 中午1:49
收件人:&nbsp;"user-zh"<user-zh@flink.apache.org&gt;;

主题:&nbsp;Flink异常及重启容错处理



Hi, 各位大佬们,请教几个问题:
&amp;nbsp; &amp;nbsp; 背景:Flink程序在正常运行过程中由于某些原因抛出异常了(比如数据不正确、NullPointer等),设置了checkpoint,程序默认会无限重启,都没办法savepoint。
&amp;nbsp; &amp;nbsp; 问题1:&amp;nbsp; Flink希望开发者怎么处理程序的异常?
&amp;nbsp; &amp;nbsp; 问题2:checkpoint是否可以转化为savepoint,使得在没来得及savepoint之前能够进行恢复?
&amp;nbsp; &amp;nbsp; 问题3:如果我某条数据导致了异常,怎么样才忽略这条数据而不影响应用的状态和运行?