You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by zhisheng <zh...@gmail.com> on 2020/11/02 01:34:28 UTC

Re: 回复: flink任务挂掉后自动重启

hi,

提供一个方案,平台层可以做到作业自动拉起,那么需要平台层有这些信息。

1、作业启动的时候保存一下作业的 jobid 信息

2、平台轮训检测作业的状态,如果作业挂了,直接从配置的 checkpoint 基础路径 + jobid 目录下去找最新的目录(里面含
_metadata)

eg: hdfs:/flink/checkpoints/9b4cddb385b0c5db96b0774769867673/chk-15109

然后平台层将作业从 checkpoint 拉起,当然这个是否自动拉起,拉起的次数可以让用户去选择。

Best!
zhisheng

bradyMk <zh...@126.com> 于2020年10月31日周六 下午4:20写道:

> 好的,我去试试这种方法,感谢~
>
>
>
> -----
> Best Wishes
> --
> Sent from: http://apache-flink.147419.n8.nabble.com/
>

Re: 回复: flink任务挂掉后自动重启

Posted by bradyMk <zh...@126.com>.
了解了,是我想的太局限了,谢谢zhisheng大佬啦~



-----
Best Wishes
--
Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复: flink任务挂掉后自动重启

Posted by zhisheng <zh...@gmail.com>.
平台层是将功能自动化,产品化,没有平台总可以手动按照这个思路去实现。

bradyMk <zh...@126.com> 于2020年11月2日周一 下午2:27写道:

> 那我们没有这样的计算平台该怎么办呢?
>
>
>
> -----
> Best Wishes
> --
> Sent from: http://apache-flink.147419.n8.nabble.com/
>

Re: 回复: flink任务挂掉后自动重启

Posted by bradyMk <zh...@126.com>.
那我们没有这样的计算平台该怎么办呢?



-----
Best Wishes
--
Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复: flink任务挂掉后自动重启

Posted by zhisheng <zh...@gmail.com>.
平台层的意思就是说:假设你们有实时计算平台,那么可以考虑把这个想法做在你们的平台里面。

bradyMk <zh...@126.com> 于2020年11月2日周一 上午11:40写道:

> zhisheng大佬好~我不是很理解您说的平台层具体是什么意思,指的是什么。。。
>
>
>
> -----
> Best Wishes
> --
> Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复: flink任务挂掉后自动重启

Posted by bradyMk <zh...@126.com>.
zhisheng大佬好~我不是很理解您说的平台层具体是什么意思,指的是什么。。。



-----
Best Wishes
--
Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复: flink任务挂掉后自动重启

Posted by bradyMk <zh...@126.com>.
zhisheng大佬好~我不太理解你说的平台层是什么。。。



-----
Best Wishes
--
Sent from: http://apache-flink.147419.n8.nabble.com/