You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by Natasha <13...@163.com> on 2020/10/12 06:04:27 UTC

Demo:从埋点日志中,统计实时的 PV 遇到的问题


HI ALL,
    刚入门Flink的我最近从github上找了几个分析用户行为的Demo,想以此来入门Flink。
   1. 但是有一个问题我一直想不通:(图1)
  
  如图,设置用户访问时间为EventTime;我设想的是,如果我设置一小时的滚动时间,那么按道理我应该得到的结果是,在这一小时内访问的pv总数都应该返回给我,但是为什么console打出来的却是四个相同的时间戳但是却是四个分散的41890,992,1474,2539的pv数量?(图2)
 
2. 原来的demo的写法是可以正确打印出理想中的结果(图3),但是我仍旧无法理解:为什么我设置了一小时滚动时间,按道理聚合函数就应该把这一小时内的pv累计好返回给我,为什么会出现四个一样的时间戳,带着不同pv数;我想四个pv数累加在一起就应该是这个时间戳内pv总数;可能我还不能正确理解Flink的代码。。。请各位帮帮忙,可以解答一下我的疑惑吗~