You are viewing a plain text version of this content. The canonical link for it is here.
Posted to commits@doris.apache.org by yi...@apache.org on 2022/07/15 07:53:20 UTC
[doris] branch master updated: [docs]update flink-connector-doc (#10875)
This is an automated email from the ASF dual-hosted git repository.
yiguolei pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/doris.git
The following commit(s) were added to refs/heads/master by this push:
new dd70feb35f [docs]update flink-connector-doc (#10875)
dd70feb35f is described below
commit dd70feb35f15db6f80b7ee7b2d856b072df3313b
Author: wudi <67...@qq.com>
AuthorDate: Fri Jul 15 15:53:15 2022 +0800
[docs]update flink-connector-doc (#10875)
Co-authored-by: wudi <>
---
docs/en/docs/ecosystem/flink-doris-connector.md | 8 ++--
docs/zh-CN/docs/ecosystem/flink-doris-connector.md | 50 +++++++++++-----------
2 files changed, 30 insertions(+), 28 deletions(-)
diff --git a/docs/en/docs/ecosystem/flink-doris-connector.md b/docs/en/docs/ecosystem/flink-doris-connector.md
index 27f671098d..86bddc78ec 100644
--- a/docs/en/docs/ecosystem/flink-doris-connector.md
+++ b/docs/en/docs/ecosystem/flink-doris-connector.md
@@ -113,10 +113,7 @@ After successful compilation, the file `flink-doris-connector-1.14_2.12-1.0.0-SN
**Remarks:**
-1. Doris FE should be configured to enable http v2 in the configuration
-
- conf/fe.conf
-
+1. Doris FE should enable http v2 in the configuration fe.conf, which is enabled by default after version 0.15
```
enable_http_server_v2 = true
```
@@ -371,6 +368,9 @@ source.sinkTo(builder.build());
| sink.properties.* | -- | N | The stream load parameters.<br /> <br /> eg:<br /> sink.properties.column_separator' = ','<br /> <br /> Setting 'sink.properties.escape_delimiters' = 'true' if you want to use a control char as a separator, so that such as '\\x01' will translate to binary 0x01<br /><br /> Support JSON format import, you need to enable both 'sink.properties.format' ='json' and 'sink.properties.strip_outer_array' ='true'|
| sink.enable-delete | true | N | Whether to enable deletion. This option requires Doris table to enable batch delete function (0.15+ version is enabled by default), and only supports Uniq model.|
| sink.enable-2pc | true | N | Whether to enable two-phase commit (2pc), the default is true, to ensure Exactly-Once semantics. For two-phase commit, please refer to [here](../data-operate/import/import-way/stream-load-manual.md). |
+| sink.max-retries | 1 | N | In the 2pc scenario, the number of retries after the commit phase fails. |
+| sink.buffer-size | 1048576(1MB) | N | Write data cache buffer size, in bytes. It is not recommended to modify, the default configuration is sufficient. |
+| sink.buffer-count | 3 | N | The number of write data cache buffers, it is not recommended to modify, the default configuration is sufficient. |
diff --git a/docs/zh-CN/docs/ecosystem/flink-doris-connector.md b/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
index a38af7fa24..3b94fa79a9 100644
--- a/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
+++ b/docs/zh-CN/docs/ecosystem/flink-doris-connector.md
@@ -117,10 +117,7 @@ sh build.sh --flink 1.14.3 --scala 2.12
**备注**
-1. Doris FE 要在配置中配置启用 http v2
-
- conf/fe.conf
-
+1. Doris FE 要在配置fe.conf中启用 http v2, 0.15版本之后默认开启
```
enable_http_server_v2 = true
```
@@ -350,27 +347,31 @@ source.sinkTo(builder.build());
### 通用配置项
-| Key | Default Value | Required | Comment |
-| -------------------------------- | ------------------ | -------- | ------------------------------------------------------------ |
-| fenodes | -- | Y | Doris FE http 地址 |
-| table.identifier | -- | Y | Doris 表名,如:db.tbl |
-| username | -- | Y | 访问 Doris 的用户名 |
-| password | -- | Y | 访问 Doris 的密码 |
-| doris.request.retries | 3 | N | 向 Doris 发送请求的重试次数 |
-| doris.request.connect.timeout.ms | 30000 | N | 向 Doris 发送请求的连接超时时间 |
-| doris.request.read.timeout.ms | 30000 | N | 向 Doris 发送请求的读取超时时间 |
-| doris.request.query.timeout.s | 3600 | N | 查询 Doris 的超时时间,默认值为1小时,-1表示无超时限制 |
-| doris.request.tablet.size | Integer. MAX_VALUE | N | 一个 Partition 对应的 Doris Tablet 个数。 此数值设置越小,则会生成越多的 Partition。从而提升 Flink 侧的并行度,但同时会对 Doris 造成更大的压力。 |
-| doris.batch.size | 1024 | N | 一次从 BE 读取数据的最大行数。增大此数值可减少 Flink 与 Doris 之间建立连接的次数。 从而减轻网络延迟所带来的额外时间开销。 |
-| doris.exec.mem.limit | 2147483648 | N | 单个查询的内存限制。默认为 2GB,单位为字节 |
-| doris.deserialize.arrow.async | FALSE | N | 是否支持异步转换 Arrow 格式到 flink-doris-connector 迭代所需的 RowBatch |
-| doris.deserialize.queue.size | 64 | N | 异步转换 Arrow 格式的内部处理队列,当 doris.deserialize.arrow.async 为 true 时生效 |
-| doris.read.field | -- | N | 读取 Doris 表的列名列表,多列之间使用逗号分隔 |
-| doris.filter.query | -- | N | 过滤读取数据的表达式,此表达式透传给 Doris。Doris 使用此表达式完成源端数据过滤。 |
-| sink.label-prefix | -- | Y | Stream load导入使用的label前缀。2pc场景下要求全局唯一 ,用来保证Flink的EOS语义。 |
+| Key | Default Value | Required | Comment |
+| -------------------------------- |--------------------| -------- |------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| fenodes | -- | Y | Doris FE http 地址 |
+| table.identifier | -- | Y | Doris 表名,如:db.tbl |
+| username | -- | Y | 访问 Doris 的用户名 |
+| password | -- | Y | 访问 Doris 的密码 |
+| doris.request.retries | 3 | N | 向 Doris 发送请求的重试次数 |
+| doris.request.connect.timeout.ms | 30000 | N | 向 Doris 发送请求的连接超时时间 |
+| doris.request.read.timeout.ms | 30000 | N | 向 Doris 发送请求的读取超时时间 |
+| doris.request.query.timeout.s | 3600 | N | 查询 Doris 的超时时间,默认值为1小时,-1表示无超时限制 |
+| doris.request.tablet.size | Integer. MAX_VALUE | N | 一个 Partition 对应的 Doris Tablet 个数。 此数值设置越小,则会生成越多的 Partition。从而提升 Flink 侧的并行度,但同时会对 Doris 造成更大的压力。 |
+| doris.batch.size | 1024 | N | 一次从 BE 读取数据的最大行数。增大此数值可减少 Flink 与 Doris 之间建立连接的次数。 从而减轻网络延迟所带来的额外时间开销。 |
+| doris.exec.mem.limit | 2147483648 | N | 单个查询的内存限制。默认为 2GB,单位为字节 |
+| doris.deserialize.arrow.async | FALSE | N | 是否支持异步转换 Arrow 格式到 flink-doris-connector 迭代所需的 RowBatch |
+| doris.deserialize.queue.size | 64 | N | 异步转换 Arrow 格式的内部处理队列,当 doris.deserialize.arrow.async 为 true 时生效 |
+| doris.read.field | -- | N | 读取 Doris 表的列名列表,多列之间使用逗号分隔 |
+| doris.filter.query | -- | N | 过滤读取数据的表达式,此表达式透传给 Doris。Doris 使用此表达式完成源端数据过滤。 |
+| sink.label-prefix | -- | Y | Stream load导入使用的label前缀。2pc场景下要求全局唯一 ,用来保证Flink的EOS语义。 |
| sink.properties.* | -- | N | Stream Load 的导入参数。<br/>例如: 'sink.properties.column_separator' = ', ' 定义列分隔符, 'sink.properties.escape_delimiters' = 'true' 特殊字符作为分隔符,'\x01'会被转换为二进制的0x01 <br/><br/>JSON格式导入<br/>'sink.properties.format' = 'json' 'sink.properties.read_json_by_line' = 'true' |
-| sink.enable-delete | TRUE | N | 是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0.15+版本默认开启),只支持 Unique 模型。 |
-| sink.enable-2pc | TRUE | N | 是否开启两阶段提交(2pc),默认为true,保证Exactly-Once语义。关于两阶段提交可参考[这里](../data-operate/import/import-way/stream-load-manual.md)。 |
+| sink.enable-delete | TRUE | N | 是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0.15+版本默认开启),只支持 Unique 模型。 |
+| sink.enable-2pc | TRUE | N | 是否开启两阶段提交(2pc),默认为true,保证Exactly-Once语义。关于两阶段提交可参考[这里](../data-operate/import/import-way/stream-load-manual.md)。 |
+| sink.max-retries | 1 | N | 2pc场景下,commit阶段失败后的重试次数。 |
+| sink.buffer-size | 1048576(1MB) | N | 写数据缓存buffer大小,单位字节。不建议修改,默认配置即可。 |
+| sink.buffer-count | 3 | N | 写数据缓存buffer个数,不建议修改,默认配置即可。 |
+
## Doris 和 Flink 列类型映射关系
@@ -396,6 +397,7 @@ source.sinkTo(builder.build());
## 使用 Flink CDC 接入 Doris 示例(支持 Insert / Update / Delete 事件)
```sql
+SET 'execution.checkpointing.interval' = '10s';
CREATE TABLE cdc_mysql_source (
id int
,name VARCHAR
---------------------------------------------------------------------
To unsubscribe, e-mail: commits-unsubscribe@doris.apache.org
For additional commands, e-mail: commits-help@doris.apache.org