You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by cc vmaster <vm...@gmail.com> on 2022/11/23 05:07:34 UTC

Checkpoint中各算子耗时情况应该怎么看,当发生Timeout时如果确定哪步耗时最多?

如下图几种场景,每个算子后面的End to End Duration代表什么意思?
1、是指当前步骤总耗时,还是说从第一个算子开始,到当前算子完成的累计耗时(如果是累计耗时,图一和图二便会有矛盾)?  
2、是否指当前批次所有数据完成总耗时?比如有12个Task,收到这些Task的Acknowledged后,表明分配给Task处理的数据都已全部处理完成。

图1:Checkpoint超时失败,后面的算子Duration都很大



图2:Checkpoint成功,其中某一步骤的耗时很大



图3:Checkpoint成功,但后面几个算子耗时都一样(较大),那真正的耗时在哪一步,应该如何看?