You are viewing a plain text version of this content. The canonical link for it is here.
Posted to commits@doris.apache.org by yi...@apache.org on 2022/07/15 07:53:20 UTC

[doris] branch master updated: [docs]update flink-connector-doc (#10875)

This is an automated email from the ASF dual-hosted git repository.

yiguolei pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/doris.git


The following commit(s) were added to refs/heads/master by this push:
     new dd70feb35f [docs]update flink-connector-doc (#10875)
dd70feb35f is described below

commit dd70feb35f15db6f80b7ee7b2d856b072df3313b
Author: wudi <67...@qq.com>
AuthorDate: Fri Jul 15 15:53:15 2022 +0800

    [docs]update flink-connector-doc (#10875)
    
    Co-authored-by: wudi <>
---
 docs/en/docs/ecosystem/flink-doris-connector.md    |  8 ++--
 docs/zh-CN/docs/ecosystem/flink-doris-connector.md | 50 +++++++++++-----------
 2 files changed, 30 insertions(+), 28 deletions(-)

diff --git a/docs/en/docs/ecosystem/flink-doris-connector.md b/docs/en/docs/ecosystem/flink-doris-connector.md
index 27f671098d..86bddc78ec 100644
--- a/docs/en/docs/ecosystem/flink-doris-connector.md
+++ b/docs/en/docs/ecosystem/flink-doris-connector.md
@@ -113,10 +113,7 @@ After successful compilation, the file `flink-doris-connector-1.14_2.12-1.0.0-SN
 
 **Remarks:** 
 
-1. Doris FE should be configured to enable http v2 in the configuration
-
-   conf/fe.conf
-
+1. Doris FE should enable http v2 in the configuration fe.conf, which is enabled by default after version 0.15
 ```
 enable_http_server_v2 = true
 ```
@@ -371,6 +368,9 @@ source.sinkTo(builder.build());
 | sink.properties.*     | --               | N              | The stream load parameters.<br /> <br /> eg:<br /> sink.properties.column_separator' = ','<br /> <br />  Setting 'sink.properties.escape_delimiters' = 'true' if you want to use a control char as a separator, so that such as '\\x01' will translate to binary 0x01<br /><br />  Support JSON format import, you need to enable both 'sink.properties.format' ='json' and 'sink.properties.strip_outer_array' ='true'|
 | sink.enable-delete     | true               | N              | Whether to enable deletion. This option requires Doris table to enable batch delete function (0.15+ version is enabled by default), and only supports Uniq model.|
 | sink.enable-2pc                  | true              | N        | Whether to enable two-phase commit (2pc), the default is true, to ensure Exactly-Once semantics. For two-phase commit, please refer to [here](../data-operate/import/import-way/stream-load-manual.md). |
+| sink.max-retries                 | 1                  | N        | In the 2pc scenario, the number of retries after the commit phase fails.                                                                                                                                                                                                                                         |
+| sink.buffer-size                 | 1048576(1MB)       | N        | Write data cache buffer size, in bytes. It is not recommended to modify, the default configuration is sufficient.                                                                                                                                                                                                                                 |
+| sink.buffer-count                | 3                  | N        | The number of write data cache buffers, it is not recommended to modify, the default configuration is sufficient.                                                                                                                                                                                                                                     |
 
 
 
diff --git a/docs/zh-CN/docs/ecosystem/flink-doris-connector.md b/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
index a38af7fa24..3b94fa79a9 100644
--- a/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
+++ b/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
@@ -117,10 +117,7 @@ sh build.sh --flink 1.14.3 --scala 2.12
 
 **备注**
 
-1. Doris FE 要在配置中配置启用 http v2
-
-​       conf/fe.conf
-
+1. Doris FE 要在配置fe.conf中启用 http v2, 0.15版本之后默认开启
 ```
 enable_http_server_v2 = true
 ```
@@ -350,27 +347,31 @@ source.sinkTo(builder.build());
 
 ### 通用配置项
 
-| Key                              | Default Value      | Required | Comment                                                      |
-| -------------------------------- | ------------------ | -------- | ------------------------------------------------------------ |
-| fenodes                          | --                 | Y        | Doris FE http 地址                                           |
-| table.identifier                 | --                 | Y        | Doris 表名,如:db.tbl                                       |
-| username                         | --                 | Y        | 访问 Doris 的用户名                                          |
-| password                         | --                 | Y        | 访问 Doris 的密码                                            |
-| doris.request.retries            | 3                  | N        | 向 Doris 发送请求的重试次数                                  |
-| doris.request.connect.timeout.ms | 30000              | N        | 向 Doris 发送请求的连接超时时间                              |
-| doris.request.read.timeout.ms    | 30000              | N        | 向 Doris 发送请求的读取超时时间                              |
-| doris.request.query.timeout.s    | 3600               | N        | 查询 Doris 的超时时间,默认值为1小时,-1表示无超时限制       |
-| doris.request.tablet.size        | Integer. MAX_VALUE | N        | 一个 Partition 对应的 Doris Tablet 个数。 此数值设置越小,则会生成越多的 Partition。从而提升 Flink 侧的并行度,但同时会对 Doris 造成更大的压力。 |
-| doris.batch.size                 | 1024               | N        | 一次从 BE 读取数据的最大行数。增大此数值可减少 Flink 与 Doris 之间建立连接的次数。 从而减轻网络延迟所带来的额外时间开销。 |
-| doris.exec.mem.limit             | 2147483648         | N        | 单个查询的内存限制。默认为 2GB,单位为字节                   |
-| doris.deserialize.arrow.async    | FALSE              | N        | 是否支持异步转换 Arrow 格式到 flink-doris-connector 迭代所需的 RowBatch |
-| doris.deserialize.queue.size     | 64                 | N        | 异步转换 Arrow 格式的内部处理队列,当 doris.deserialize.arrow.async 为 true 时生效 |
-| doris.read.field                 | --                 | N        | 读取 Doris 表的列名列表,多列之间使用逗号分隔                |
-| doris.filter.query               | --                 | N        | 过滤读取数据的表达式,此表达式透传给 Doris。Doris 使用此表达式完成源端数据过滤。 |
-| sink.label-prefix                | --                 | Y        | Stream load导入使用的label前缀。2pc场景下要求全局唯一 ,用来保证Flink的EOS语义。 |
+| Key                              | Default Value      | Required | Comment                                                                                                                                                                                                                                                          |
+| -------------------------------- |--------------------| -------- |------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| fenodes                          | --                 | Y        | Doris FE http 地址                                                                                                                                                                                                                                                 |
+| table.identifier                 | --                 | Y        | Doris 表名,如:db.tbl                                                                                                                                                                                                                                                |
+| username                         | --                 | Y        | 访问 Doris 的用户名                                                                                                                                                                                                                                                    |
+| password                         | --                 | Y        | 访问 Doris 的密码                                                                                                                                                                                                                                                     |
+| doris.request.retries            | 3                  | N        | 向 Doris 发送请求的重试次数                                                                                                                                                                                                                                                |
+| doris.request.connect.timeout.ms | 30000              | N        | 向 Doris 发送请求的连接超时时间                                                                                                                                                                                                                                              |
+| doris.request.read.timeout.ms    | 30000              | N        | 向 Doris 发送请求的读取超时时间                                                                                                                                                                                                                                              |
+| doris.request.query.timeout.s    | 3600               | N        | 查询 Doris 的超时时间,默认值为1小时,-1表示无超时限制                                                                                                                                                                                                                                 |
+| doris.request.tablet.size        | Integer. MAX_VALUE | N        | 一个 Partition 对应的 Doris Tablet 个数。 此数值设置越小,则会生成越多的 Partition。从而提升 Flink 侧的并行度,但同时会对 Doris 造成更大的压力。                                                                                                                                                                |
+| doris.batch.size                 | 1024               | N        | 一次从 BE 读取数据的最大行数。增大此数值可减少 Flink 与 Doris 之间建立连接的次数。 从而减轻网络延迟所带来的额外时间开销。                                                                                                                                                                                           |
+| doris.exec.mem.limit             | 2147483648         | N        | 单个查询的内存限制。默认为 2GB,单位为字节                                                                                                                                                                                                                                          |
+| doris.deserialize.arrow.async    | FALSE              | N        | 是否支持异步转换 Arrow 格式到 flink-doris-connector 迭代所需的 RowBatch                                                                                                                                                                                                          |
+| doris.deserialize.queue.size     | 64                 | N        | 异步转换 Arrow 格式的内部处理队列,当 doris.deserialize.arrow.async 为 true 时生效                                                                                                                                                                                                  |
+| doris.read.field                 | --                 | N        | 读取 Doris 表的列名列表,多列之间使用逗号分隔                                                                                                                                                                                                                                       |
+| doris.filter.query               | --                 | N        | 过滤读取数据的表达式,此表达式透传给 Doris。Doris 使用此表达式完成源端数据过滤。                                                                                                                                                                                                                   |
+| sink.label-prefix                | --                 | Y        | Stream load导入使用的label前缀。2pc场景下要求全局唯一 ,用来保证Flink的EOS语义。                                                                                                                                                                                                           |
 | sink.properties.*                | --                 | N        | Stream Load 的导入参数。<br/>例如:  'sink.properties.column_separator' = ', ' 定义列分隔符,  'sink.properties.escape_delimiters' = 'true' 特殊字符作为分隔符,'\x01'会被转换为二进制的0x01  <br/><br/>JSON格式导入<br/>'sink.properties.format' = 'json' 'sink.properties.read_json_by_line' = 'true' |
-| sink.enable-delete               | TRUE               | N        | 是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0.15+版本默认开启),只支持 Unique 模型。 |
-| sink.enable-2pc                  | TRUE               | N        | 是否开启两阶段提交(2pc),默认为true,保证Exactly-Once语义。关于两阶段提交可参考[这里](../data-operate/import/import-way/stream-load-manual.md)。 |
+| sink.enable-delete               | TRUE               | N        | 是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0.15+版本默认开启),只支持 Unique 模型。                                                                                                                                                                                                    |
+| sink.enable-2pc                  | TRUE               | N        | 是否开启两阶段提交(2pc),默认为true,保证Exactly-Once语义。关于两阶段提交可参考[这里](../data-operate/import/import-way/stream-load-manual.md)。                                                                                                                                                 |
+| sink.max-retries                 | 1                  | N        | 2pc场景下,commit阶段失败后的重试次数。                                                                                                                                                                                                                                         |
+| sink.buffer-size                 | 1048576(1MB)       | N        | 写数据缓存buffer大小,单位字节。不建议修改,默认配置即可。                                                                                                                                                                                                                                 |
+| sink.buffer-count                | 3                  | N        | 写数据缓存buffer个数,不建议修改,默认配置即可。                                                                                                                                                                                                                                      |
+
 
 ## Doris 和 Flink 列类型映射关系
 
@@ -396,6 +397,7 @@ source.sinkTo(builder.build());
 
 ## 使用 Flink CDC 接入 Doris 示例(支持 Insert / Update / Delete 事件)
 ```sql
+SET 'execution.checkpointing.interval' = '10s';
 CREATE TABLE cdc_mysql_source (
   id int
   ,name VARCHAR


---------------------------------------------------------------------
To unsubscribe, e-mail: commits-unsubscribe@doris.apache.org
For additional commands, e-mail: commits-help@doris.apache.org