You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by BenChen <ha...@163.com> on 2020/06/30 07:27:44 UTC
关于RichReduceFunction和RichAggregateFunction
Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。
看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。
目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?
感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制
回复:关于RichReduceFunction和RichAggregateFunction
Posted by BenChen <ha...@163.com>.
感谢回复。
假设使用uid keyby保证数据流到同一个算子,因为reduce和aggregate无法使用state,那BloomFilter只能放到WindowFunction里面去state了(或者直接使用process),这样逻辑处理就等到窗口触发才执行,影响吞吐量了。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制
在2020年06月30日 15:55,Yichao Yang<10...@qq.com> 写道:
Hi
第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。
Best,
Yichao Yang
------------------ 原始邮件 ------------------
发件人: "BenChen"<haibin369@163.com>;
发送时间: 2020年6月30日(星期二) 下午3:27
收件人: "user-zh@flink.apache.org"<user-zh@flink.apache.org>;
主题: 关于RichReduceFunction和RichAggregateFunction
Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。
看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。
目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?
感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制
回复:关于RichReduceFunction和RichAggregateFunction
Posted by Yichao Yang <10...@qq.com>.
Hi
第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。
Best,
Yichao Yang
------------------ 原始邮件 ------------------
发件人: "BenChen"<haibin369@163.com>;
发送时间: 2020年6月30日(星期二) 下午3:27
收件人: "user-zh@flink.apache.org"<user-zh@flink.apache.org>;
主题: 关于RichReduceFunction和RichAggregateFunction
Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。
看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。
目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?
感谢。
| |
BenChen
|
|
haibin369@163.com
|
签名由网易邮箱大师定制