You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by lec ssmi <sh...@gmail.com> on 2020/04/08 06:05:42 UTC

重复声明watermark的问题

大家好:
  请问,对一个DataStream重复声明watermark,前面的watermark会被覆盖掉吗?
  比如我再source端声明了watermark,进行了一系列操作后,我觉得watermark的延迟不满足需求,就再次声明一次。
  另外,稍微咨询下另外一个问题,两个流join之后,watermark会消失吗?看书上说的是,以两个流最小的watermark(全局最小)为准。
  主要是在阿里云Blink上,使用sql进行join后,说的是时间属性字段会消失。有点不明白。

Re: 重复声明watermark的问题

Posted by lec ssmi <sh...@gmail.com>.
谢谢,主要是我再次声明watermark后,再转成table,然后再window操作,就一直报错,现在能确定是时间属性字段的问题。我用的阿里云的blink,他们开发人员说好像不能这么操作。

jun su <su...@gmail.com> 于 2020年4月10日周五 23:36写道:

> hi,
> 1. 以我的理解, 再次下发watermark会覆盖之前的, 所以在经过n个operator后,可以用再次声明watermark的方式来调整.
> 2. 如果是DataStream模式下, 两个流join后, 下游收到的watermark是较小的流的watermark,
> 如果是stream模式下的sql window join, 那么下游收到的
>     watermark是较小一侧表的watermark - sql设定的时间窗口.
>
> lec ssmi <sh...@gmail.com> 于2020年4月8日周三 下午2:05写道:
>
> > 大家好:
> >   请问,对一个DataStream重复声明watermark,前面的watermark会被覆盖掉吗?
> >   比如我再source端声明了watermark,进行了一系列操作后,我觉得watermark的延迟不满足需求,就再次声明一次。
> >   另外,稍微咨询下另外一个问题,两个流join之后,watermark会消失吗?看书上说的是,以两个流最小的watermark(全局最小)为准。
> >   主要是在阿里云Blink上,使用sql进行join后,说的是时间属性字段会消失。有点不明白。
> >
>
>
> --
> Best,
> Jun Su
>

Re: 重复声明watermark的问题

Posted by jun su <su...@gmail.com>.
hi,
1. 以我的理解, 再次下发watermark会覆盖之前的, 所以在经过n个operator后,可以用再次声明watermark的方式来调整.
2. 如果是DataStream模式下, 两个流join后, 下游收到的watermark是较小的流的watermark,
如果是stream模式下的sql window join, 那么下游收到的
    watermark是较小一侧表的watermark - sql设定的时间窗口.

lec ssmi <sh...@gmail.com> 于2020年4月8日周三 下午2:05写道:

> 大家好:
>   请问,对一个DataStream重复声明watermark,前面的watermark会被覆盖掉吗?
>   比如我再source端声明了watermark,进行了一系列操作后,我觉得watermark的延迟不满足需求,就再次声明一次。
>   另外,稍微咨询下另外一个问题,两个流join之后,watermark会消失吗?看书上说的是,以两个流最小的watermark(全局最小)为准。
>   主要是在阿里云Blink上,使用sql进行join后,说的是时间属性字段会消失。有点不明白。
>


-- 
Best,
Jun Su