You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by Even <45...@qq.com> on 2020/04/17 01:57:05 UTC

SQL_CLI构建流式应用参数设置

Hi!Nabble似乎无法注册,所以在邮件列表中无法回复。
关于周三问题,还有一点疑惑:
1、在CLI通过 set 命令,如 set &nbsp;execution.parallelism=10&nbsp;动态设置并行度,是当前CLI创建的所有任务都是这个并行度吗?
2、&nbsp;SQL CLI 还不支持 checkpoint 的设置,这个以后会考虑支持吗?如果已考虑会在下个版本中发布吗?
非常感谢!


------------------------------------------------------------
Hi Even,&nbsp;

1. 目前 SQL CLI 支持通过在 sql-client-default.yaml 里设置 parallelism&nbsp;
和 max-parallelism 来控制 CLI 任务的默认并发。或者通过 set 命令,如 set&nbsp;
execution.parallelism=10;放方式动态设置。例外,对于如果使用 blink&nbsp;
planner,可以用 table.exec.resource.default-parallelism 来配置默认并发。[1]&nbsp;
另外 SQL CLI 还不支持 checkpoint 的设置。&nbsp;
2. 目前 SQL CLI 默认是 in-memory catalog,在每个SQL CLI的独立进程中,不会共享。如果SQL&nbsp;
CLI挂掉,in-memory catalog 也会消失。你可以配置你的catalog为 hive catalog [1], 这样你创建的表会持久化到&nbsp;
hive catalog 中,多个SQL CLI使用同一个hive catalog,可以达到你说期望的共享。&nbsp;

[1]&nbsp;
https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/sqlClient.html#environment-files

Best,&nbsp;
Godfrey&nbsp;

Even <[hidden email]&gt; 于2020年4月15日周三 下午3:35写道:&nbsp;

&gt; Hi!&nbsp;
&gt; 请教两个问题:&nbsp;
&gt; 1、 Flink SQL CLI 纯文本方式构建一个流式应用,在DDL语句中如何设置checkpoint和并行度这些参数?&nbsp;
&gt; 2、 Flink SQL CLI&nbsp;
&gt; 纯文本方式构建的流式应用创建的那些表,我在另外一个CLI中是无法找到这些table的,这是为什么?如果任务挂掉了,应该怎么重启,还是必须重新再构建?&nbsp;

Re: SQL_CLI构建流式应用参数设置

Posted by godfrey he <go...@gmail.com>.
第一个问题:set execution.parallelism=10;
这样命令设置的job的默认并发度。一些算子有自己并发度的设置逻辑,不受默认并发度的影响(例如
hive的source,是根据partition数来的)。你可以在提交作业之前调用set命令来修改每个job的默认并发度。
第二个问题:1.11在 FLINK-16822[1] 被fix后,你可以通过配置项方式设置checkpoint [2]。例如:
set execution.checkpointing.mode=EXACTLY_ONCE。

[1] https://issues.apache.org/jira/browse/FLINK-16822
[2]
https://ci.apache.org/projects/flink/flink-docs-stable/ops/config.html#checkpointing

Best,
Godfrey

Even <45...@qq.com> 于2020年4月17日周五 下午3:44写道:

> Hi!Nabble似乎无法注册,所以在邮件列表中无法回复。
> 关于周三问题,还有一点疑惑:
> 1、在CLI通过 set 命令,如 set
> &nbsp;execution.parallelism=10&nbsp;动态设置并行度,是当前CLI创建的所有任务都是这个并行度吗?
> 2、&nbsp;SQL CLI 还不支持 checkpoint 的设置,这个以后会考虑支持吗?如果已考虑会在下个版本中发布吗?
> 非常感谢!
>
>
> ------------------------------------------------------------
> Hi Even,&nbsp;
>
> 1. 目前 SQL CLI 支持通过在 sql-client-default.yaml 里设置 parallelism&nbsp;
> 和 max-parallelism 来控制 CLI 任务的默认并发。或者通过 set 命令,如 set&nbsp;
> execution.parallelism=10;放方式动态设置。例外,对于如果使用 blink&nbsp;
> planner,可以用 table.exec.resource.default-parallelism 来配置默认并发。[1]&nbsp;
> 另外 SQL CLI 还不支持 checkpoint 的设置。&nbsp;
> 2. 目前 SQL CLI 默认是 in-memory catalog,在每个SQL CLI的独立进程中,不会共享。如果SQL&nbsp;
> CLI挂掉,in-memory catalog 也会消失。你可以配置你的catalog为 hive catalog [1],
> 这样你创建的表会持久化到&nbsp;
> hive catalog 中,多个SQL CLI使用同一个hive catalog,可以达到你说期望的共享。&nbsp;
>
> [1]&nbsp;
>
> https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/sqlClient.html#environment-files
>
> Best,&nbsp;
> Godfrey&nbsp;
>
> Even <[hidden email]&gt; 于2020年4月15日周三 下午3:35写道:&nbsp;
>
> &gt; Hi!&nbsp;
> &gt; 请教两个问题:&nbsp;
> &gt; 1、 Flink SQL CLI 纯文本方式构建一个流式应用,在DDL语句中如何设置checkpoint和并行度这些参数?&nbsp;
> &gt; 2、 Flink SQL CLI&nbsp;
> &gt;
> 纯文本方式构建的流式应用创建的那些表,我在另外一个CLI中是无法找到这些table的,这是为什么?如果任务挂掉了,应该怎么重启,还是必须重新再构建?&nbsp;