You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by 1048262223 <10...@qq.com> on 2020/06/09 06:08:31 UTC
回复:Flink异常及重启容错处理
Hi
1.生产环境中一般都需要try catch捕获异常,因为无法保证上游数据完全没有问题
2.程序默认无限重启代表你的数据有问题,重复处理错误数据,重复失败重启,根本原因还是在错误数据这里
3.某条数据出现异常,try catch + 加perf log + 加监控(报警)等
Best,
Yichao Yang
------------------ 原始邮件 ------------------
发件人: "Z-Z"<zz9876543210@qq.com>;
发送时间: 2020年6月9日(星期二) 中午1:49
收件人: "user-zh"<user-zh@flink.apache.org>;
主题: Flink异常及重启容错处理
Hi, 各位大佬们,请教几个问题:
&nbsp; &nbsp; 背景:Flink程序在正常运行过程中由于某些原因抛出异常了(比如数据不正确、NullPointer等),设置了checkpoint,程序默认会无限重启,都没办法savepoint。
&nbsp; &nbsp; 问题1:&nbsp; Flink希望开发者怎么处理程序的异常?
&nbsp; &nbsp; 问题2:checkpoint是否可以转化为savepoint,使得在没来得及savepoint之前能够进行恢复?
&nbsp; &nbsp; 问题3:如果我某条数据导致了异常,怎么样才忽略这条数据而不影响应用的状态和运行?