You are viewing a plain text version of this content. The canonical link for it is here.

Posted to user-zh@flink.apache.org by RS <ti...@163.com> on 2021/11/22 11:13:11 UTC

flink1.12 请教下如何配置多hadoop参数，s3使用问题

hi，


环境：
1. flink-1.12，版本可以升级
2. flink-conf中配置了env.hadoop.conf.dir，路径下有hdfs集群的core-site.xml和hdfs-site.xml， state.backend保存在该HDFS上
3. flink的部署模式是K8S+session


需求：
需要从一个s3协议的分布式文件系统中读取文件，处理完写到mysql中


问题：
s3配置采用hadoop的配置方式，保存为一个新的core-site.xml文件，参考的 https://hadoop.apache.org/docs/stable/hadoop-aws/tools/hadoop-aws/index.html#S3A


按照官网说明文档中，需要 修改hadoop的环境变量，但是就和以前的core-site.xml冲突了，无法同时配置2个hadoop路径
https://nightlies.apache.org/flink/flink-docs-release-1.14/docs/deployment/filesystems/s3/


或者 在flink-conf.yaml中添加一堆s3配置，这样又写死了，再新增一个s3集群的时候如何处理？


所以请教下如何解决这类问题（可以修改代码）？如何配置多个hadoop配置（比如从第一个文件系统（s3协议）读数据，写到第二个文件系统中（s3协议））？