You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by 秦寒 <ha...@chinaums.com> on 2020/04/08 01:51:45 UTC
关于kafka connector通过python链接
您好
Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
环境等,谢谢。
Re: 关于kafka connector通过python链接
Posted by Dian Fu <di...@gmail.com>.
您好,
图片看不到,可以把图片上传到第三方网站,然后贴个链接,或者贴一下文本的报错信息。
> 在 2020年4月9日,下午4:41,秦寒 <ha...@chinaums.com> 写道:
>
> 您好
> 根据你们的说明我做了如下配置,我用的是flink 1.10版本
> 1在pyflink/lib下面添加了kafka-clients-2.2.0.jar
>
>
> 2 在build-target/lib下面添加了flink-sql-connector-kafka_2.11-1.10.0.jar flink-connector-kafka_2.11-1.10.0.jar 以及 flink-json-1.10.0-sql-jar.jar
>
>
> 3 构建PyFlink发布包并安装
> cd flink-python; python setup.py sdist
> pip install dist/*.tar.gz
>
>
> 4 执行测试程序tumble_window.py报错如下,不知道你们有没有遇见过这个错误,望能解答
> [yy1s@rbtnode1 project]$ python3 tumble_window.py
>
>
>
>
>
> 发件人: Hequn Cheng <he...@apache.org>
> 发送时间: 2020年4月9日 10:08
> 收件人: user-zh <us...@flink.apache.org>
> 抄送: hanqin@chinaums.com
> 主题: Re: 关于kafka connector通过python链接
>
> Hi 秦寒,
>
> Dian 说得很完善了。除此之外,金竹的博客[1]有介绍“Python API 中如何使用 Kafka”,可能对你有帮助,可以看下。
>
> Best, Hequn
>
> [1] https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/ <https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/>
>
> On Thu, Apr 9, 2020 at 9:34 AM Dian Fu <dian0511.fu@gmail.com <ma...@gmail.com>> wrote:
>> 你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
>>
>> 关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
>> 1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
>> 2)如果是remote运行,可以通过CLI的-j选项添加。
>>
>> 这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
>>
>> [1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector><https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector>>
>> [2] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html> <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html>>
>> [3] https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943> <https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943>>
>> > 在 2020年4月9日,上午8:45,zhisheng <zhisheng2018@gmail.com <ma...@gmail.com>> 写道:
>> >
>> > hi, 秦寒
>> >
>> > 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
>> >
>> > Best
>> >
>> > zhisheng
>> >
>> > 秦寒 <hanqin@chinaums.com <ma...@chinaums.com>> 于2020年4月8日周三 下午4:10写道:
>> >
>> >> 您好
>> >>
>> >> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
>> >> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
>> >> 环境等,谢谢。
>> >>
>> >>
>> >>
>> >>
>>
回复: 关于kafka connector通过python链接
Posted by 秦寒 <ha...@chinaums.com>.
您好
根据你们的说明我做了如下配置,我用的是flink 1.10版本
1在pyflink/lib下面添加了kafka-clients-2.2.0.jar
2 在build-target/lib下面添加了flink-sql-connector-kafka_2.11-1.10.0.jar flink-connector-kafka_2.11-1.10.0.jar 以及 flink-json-1.10.0-sql-jar.jar
3 构建PyFlink发布包并安装
cd flink-python; python setup.py sdist
pip install dist/*.tar.gz
4 执行测试程序tumble_window.py报错如下,不知道你们有没有遇见过这个错误,望能解答
[yy1s@rbtnode1 project]$ python3 tumble_window.py
发件人: Hequn Cheng <he...@apache.org>
发送时间: 2020年4月9日 10:08
收件人: user-zh <us...@flink.apache.org>
抄送: hanqin@chinaums.com
主题: Re: 关于kafka connector通过python链接
Hi 秦寒,
Dian 说得很完善了。除此之外,金竹的博客[1]有介绍“Python API 中如何使用 Kafka”,可能对你有帮助,可以看下。
Best, Hequn
[1] https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/
On Thu, Apr 9, 2020 at 9:34 AM Dian Fu <dian0511.fu@gmail.com <ma...@gmail.com> > wrote:
你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
2)如果是remote运行,可以通过CLI的-j选项添加。
这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
[1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector>
[2] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html>
[3] https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943>
> 在 2020年4月9日,上午8:45,zhisheng <zhisheng2018@gmail.com <ma...@gmail.com> > 写道:
>
> hi, 秦寒
>
> 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
>
> Best
>
> zhisheng
>
> 秦寒 <hanqin@chinaums.com <ma...@chinaums.com> > 于2020年4月8日周三 下午4:10写道:
>
>> 您好
>>
>> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
>> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
>> 环境等,谢谢。
>>
>>
>>
>>
回复: 关于kafka connector通过python链接
Posted by 秦寒 <ha...@chinaums.com>.
这个搞定了,pip3重装了一下apache flink,引入了jar包搞定
发件人: 秦寒 <ha...@chinaums.com>
发送时间: 2020年4月9日 16:41
收件人: 'Hequn Cheng' <he...@apache.org>; 'user-zh' <us...@flink.apache.org>
主题: 回复: 关于kafka connector通过python链接
您好
根据你们的说明我做了如下配置,我用的是flink 1.10版本
1在pyflink/lib下面添加了kafka-clients-2.2.0.jar
2 在build-target/lib下面添加了flink-sql-connector-kafka_2.11-1.10.0.jar flink-connector-kafka_2.11-1.10.0.jar 以及 flink-json-1.10.0-sql-jar.jar
3 构建PyFlink发布包并安装
cd flink-python; python setup.py sdist
pip install dist/*.tar.gz
4 执行测试程序tumble_window.py报错如下,不知道你们有没有遇见过这个错误,望能解答
[yy1s@rbtnode1 project]$ python3 tumble_window.py
发件人: Hequn Cheng <hequn@apache.org <ma...@apache.org> >
发送时间: 2020年4月9日 10:08
收件人: user-zh <user-zh@flink.apache.org <ma...@flink.apache.org> >
抄送: hanqin@chinaums.com <ma...@chinaums.com>
主题: Re: 关于kafka connector通过python链接
Hi 秦寒,
Dian 说得很完善了。除此之外,金竹的博客[1]有介绍“Python API 中如何使用 Kafka”,可能对你有帮助,可以看下。
Best, Hequn
[1] https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/
On Thu, Apr 9, 2020 at 9:34 AM Dian Fu <dian0511.fu@gmail.com <ma...@gmail.com> > wrote:
你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
2)如果是remote运行,可以通过CLI的-j选项添加。
这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
[1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector>
[2] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html>
[3] https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943>
> 在 2020年4月9日,上午8:45,zhisheng <zhisheng2018@gmail.com <ma...@gmail.com> > 写道:
>
> hi, 秦寒
>
> 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
>
> Best
>
> zhisheng
>
> 秦寒 <hanqin@chinaums.com <ma...@chinaums.com> > 于2020年4月8日周三 下午4:10写道:
>
>> 您好
>>
>> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
>> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
>> 环境等,谢谢。
>>
>>
>>
>>
回复: 关于kafka connector通过python链接
Posted by 秦寒 <ha...@chinaums.com>.
这个问题定义了
我用了两个kafka包,其中红色的包是不需要的,非常感谢你们的帮助
flink-connector-kafka_2.11-1.10.0.jar
flink-sql-connector-kafka_2.11-1.10.0.jar
发件人: 秦寒 <ha...@chinaums.com>
发送时间: 2020年4月10日 10:15
收件人: 'Hequn Cheng' <he...@apache.org>; 'user-zh' <us...@flink.apache.org>
主题: 回复: 关于kafka connector通过python链接
这个搞定了,pip3重装了一下apache flink,引入了jar包搞定
发件人: 秦寒 < <ma...@chinaums.com> hanqin@chinaums.com>
发送时间: 2020年4月9日 16:41
收件人: 'Hequn Cheng' < <ma...@apache.org> hequn@apache.org>; 'user-zh' < <ma...@flink.apache.org> user-zh@flink.apache.org>
主题: 回复: 关于kafka connector通过python链接
您好
根据你们的说明我做了如下配置,我用的是flink 1.10版本
1在pyflink/lib下面添加了kafka-clients-2.2.0.jar
2 在build-target/lib下面添加了flink-sql-connector-kafka_2.11-1.10.0.jar flink-connector-kafka_2.11-1.10.0.jar 以及 flink-json-1.10.0-sql-jar.jar
3 构建PyFlink发布包并安装
cd flink-python; python setup.py sdist
pip install dist/*.tar.gz
4 执行测试程序tumble_window.py报错如下,不知道你们有没有遇见过这个错误,望能解答
[yy1s@rbtnode1 project]$ python3 tumble_window.py
发件人: Hequn Cheng < <ma...@apache.org> hequn@apache.org>
发送时间: 2020年4月9日 10:08
收件人: user-zh < <ma...@flink.apache.org> user-zh@flink.apache.org>
抄送: <ma...@chinaums.com> hanqin@chinaums.com
主题: Re: 关于kafka connector通过python链接
Hi 秦寒,
Dian 说得很完善了。除此之外,金竹的博客[1]有介绍“Python API 中如何使用 Kafka”,可能对你有帮助,可以看下。
Best, Hequn
[1] https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/
On Thu, Apr 9, 2020 at 9:34 AM Dian Fu <dian0511.fu@gmail.com <ma...@gmail.com> > wrote:
你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
2)如果是remote运行,可以通过CLI的-j选项添加。
这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
[1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector>
[2] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html>
[3] https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943>
> 在 2020年4月9日,上午8:45,zhisheng <zhisheng2018@gmail.com <ma...@gmail.com> > 写道:
>
> hi, 秦寒
>
> 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
>
> Best
>
> zhisheng
>
> 秦寒 <hanqin@chinaums.com <ma...@chinaums.com> > 于2020年4月8日周三 下午4:10写道:
>
>> 您好
>>
>> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
>> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
>> 环境等,谢谢。
>>
>>
>>
>>
Re: 关于kafka connector通过python链接
Posted by Hequn Cheng <he...@apache.org>.
Hi 秦寒,
Dian 说得很完善了。除此之外,金竹的博客[1]有介绍“Python API 中如何使用 Kafka”,可能对你有帮助,可以看下。
Best, Hequn
[1]
https://enjoyment.cool/2019/08/28/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E4%B8%AD%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8%20Kafka/
On Thu, Apr 9, 2020 at 9:34 AM Dian Fu <di...@gmail.com> wrote:
> 你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
>
> 关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
> 1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
> 2)如果是remote运行,可以通过CLI的-j选项添加。
>
>
> 这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
>
> [1]
> https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector
> <
> https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector
> >
> [2]
> https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html
> <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html
> >
> [3] https://issues.apache.org/jira/browse/FLINK-16943 <
> https://issues.apache.org/jira/browse/FLINK-16943>
> > 在 2020年4月9日,上午8:45,zhisheng <zh...@gmail.com> 写道:
> >
> > hi, 秦寒
> >
> > 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
> >
> > Best
> >
> > zhisheng
> >
> > 秦寒 <ha...@chinaums.com> 于2020年4月8日周三 下午4:10写道:
> >
> >> 您好
> >>
> >> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
> >> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
> >> 环境等,谢谢。
> >>
> >>
> >>
> >>
>
>
Re: 关于kafka connector通过python链接
Posted by Dian Fu <di...@gmail.com>.
你指的是Python Table API中如何使用kafka connector的例子吗?这个是有例子的[1]。
关于如何把kafka client的jar包配置到Python环境,分两种情况,当前有对应的两种解决方案:
1)如果是local运行,需要把kafka client的jar拷贝到python环境中pyflink的lib目录下
2)如果是remote运行,可以通过CLI的-j选项添加。
这两种方式对于Python用户来说可能都不太便捷,所以已有一个JIRA[3]在考虑添加另外一种对Python用户来说更友好的方式,欢迎到JIRA里参与讨论。
[1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector <https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#kafka-connector>
[2] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html <https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/cli.html>
[3] https://issues.apache.org/jira/browse/FLINK-16943 <https://issues.apache.org/jira/browse/FLINK-16943>
> 在 2020年4月9日,上午8:45,zhisheng <zh...@gmail.com> 写道:
>
> hi, 秦寒
>
> 暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
>
> Best
>
> zhisheng
>
> 秦寒 <ha...@chinaums.com> 于2020年4月8日周三 下午4:10写道:
>
>> 您好
>>
>> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
>> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
>> 环境等,谢谢。
>>
>>
>>
>>
Re: 关于kafka connector通过python链接
Posted by zhisheng <zh...@gmail.com>.
hi, 秦寒
暂时还没有 Python 这块的 API,可以去社区 JIRA 提建议
Best
zhisheng
秦寒 <ha...@chinaums.com> 于2020年4月8日周三 下午4:10写道:
> 您好
>
> Flink的 kafka connector 文档中只有java 和scala的列子,能否添加python
> 调用kafka的列子,包括如何添加kafka connector,kafka client的jar包配置到pyhon
> 环境等,谢谢。
>
>
>
>