You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by Jeff <zi...@126.com> on 2022/01/09 11:42:39 UTC

flink sql 如何提高下游并发度?

当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?

Re: flink sql 如何提高下游并发度?

Posted by chang li <li...@gmail.com>.
可以的,提供一个思路,读取了kafka的数据后,直接输出原生的字节流后,接一层map算子做序列化相关工作,map算子的并发度你可以自己控制,这样kafka拉取就不会是瓶颈,大量的计算工作放到了map中,而map的并发度是可以自己控制的

Caizhi Weng <ts...@gmail.com> 于2022年1月11日周二 11:11写道:

> Hi!
>
> 可以设置 parallelism.default 为需要的并发数。
>
> Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:
>
> > 当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?
>

回复: flink sql 如何提高下游并发度?

Posted by JasonLee <17...@163.com>.
hi


是 10 目前 source 还不支持单独设置并发度,但是 sink 是支持的,当然如果没有单独设置的话 sink 也是 10


Best
JasonLee


在2022年01月11日 16:52,RS<ti...@163.com> 写道:
Hi,
请教下,比如设置了parallelism=10,source kafka的topic分区为3,那source、后面的处理和sink的并发度是3还是10?
如果source是10的话,那还有7个线程就空闲了?



在 2022-01-11 11:10:41,"Caizhi Weng" <ts...@gmail.com> 写道:
Hi!

可以设置 parallelism.default 为需要的并发数。

Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:

当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?

Re: 回复: flink sql 如何提高下游并发度?

Posted by venn <wx...@163.com>.
flink 1.12 及以上版本  sql kafka sink 支持参数: sink.parallelism  指定 sink 
的并行度

On 2022/1/11 17:06, 许友昌 wrote:
> hi,
>
>
> 设置了parallelism=10 ,实际上是分配了 10 个 slot,flink 是会共享 slot 的,所以 sink 会有 10 线程。
>
> 在2022年1月11日 16:53,RS<ti...@163.com> 写道:
> Hi,
> 请教下,比如设置了parallelism=10,source kafka的topic分区为3,那source、后面的处理和sink的并发度是3还是10?
> 如果source是10的话,那还有7个线程就空闲了?
>
>
>
> 在 2022-01-11 11:10:41,"Caizhi Weng" <ts...@gmail.com> 写道:
> Hi!
>
> 可以设置 parallelism.default 为需要的并发数。
>
> Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:
>
> 当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?


回复: flink sql 如何提高下游并发度?

Posted by 许友昌 <18...@163.com>.
hi,


设置了parallelism=10 ,实际上是分配了 10 个 slot,flink 是会共享 slot 的,所以 sink 会有 10 线程。 

在2022年1月11日 16:53,RS<ti...@163.com> 写道:
Hi,
请教下,比如设置了parallelism=10,source kafka的topic分区为3,那source、后面的处理和sink的并发度是3还是10?
如果source是10的话,那还有7个线程就空闲了?



在 2022-01-11 11:10:41,"Caizhi Weng" <ts...@gmail.com> 写道:
Hi!

可以设置 parallelism.default 为需要的并发数。

Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:

当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?

Re:Re: flink sql 如何提高下游并发度?

Posted by RS <ti...@163.com>.
Hi,
请教下,比如设置了parallelism=10,source kafka的topic分区为3,那source、后面的处理和sink的并发度是3还是10?
如果source是10的话,那还有7个线程就空闲了?



在 2022-01-11 11:10:41,"Caizhi Weng" <ts...@gmail.com> 写道:
>Hi!
>
>可以设置 parallelism.default 为需要的并发数。
>
>Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:
>
>> 当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?

Re: flink sql 如何提高下游并发度?

Posted by Caizhi Weng <ts...@gmail.com>.
Hi!

可以设置 parallelism.default 为需要的并发数。

Jeff <zi...@126.com> 于2022年1月9日周日 19:44写道:

> 当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?

Re: flink sql 如何提高下游并发度?

Posted by Chang Li <li...@gmail.com>.
可以的,提供一个思路,读取了kafka的数据后,直接输出原生的字节流后,接一层map算子做序列化相关工作,map算子的并发度你可以自己控制,这样kafka拉取就不会是瓶颈,大量的计算工作放到了map中,而map的并发度是可以自己控制的

Jeff <zi...@126.com> 于2022年1月9日周日 19:45写道:

> 当source为kafka时,最大并发度由kafka分区决定的, 有没有办法在不增加kafka分区情况下提高整个任务的并发度呢?