You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by BenChen <ha...@163.com> on 2020/06/30 07:27:44 UTC

关于RichReduceFunction和RichAggregateFunction


Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制


回复:关于RichReduceFunction和RichAggregateFunction

Posted by BenChen <ha...@163.com>.
感谢回复。


假设使用uid keyby保证数据流到同一个算子,因为reduce和aggregate无法使用state,那BloomFilter只能放到WindowFunction里面去state了(或者直接使用process),这样逻辑处理就等到窗口触发才执行,影响吞吐量了。


| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制


在2020年06月30日 15:55,Yichao Yang<10...@qq.com> 写道:
Hi


第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。


Best,
Yichao Yang




------------------&nbsp;原始邮件&nbsp;------------------
发件人:&nbsp;"BenChen"<haibin369@163.com&gt;;
发送时间:&nbsp;2020年6月30日(星期二) 下午3:27
收件人:&nbsp;"user-zh@flink.apache.org"<user-zh@flink.apache.org&gt;;

主题:&nbsp;关于RichReduceFunction和RichAggregateFunction





Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制

回复:关于RichReduceFunction和RichAggregateFunction

Posted by Yichao Yang <10...@qq.com>.
Hi


第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。


Best,
Yichao Yang




------------------&nbsp;原始邮件&nbsp;------------------
发件人:&nbsp;"BenChen"<haibin369@163.com&gt;;
发送时间:&nbsp;2020年6月30日(星期二) 下午3:27
收件人:&nbsp;"user-zh@flink.apache.org"<user-zh@flink.apache.org&gt;;

主题:&nbsp;关于RichReduceFunction和RichAggregateFunction





Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制