You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by Jacob <17...@163.com> on 2021/02/02 08:22:43 UTC

Flink job与自己系统平台的一体化集成

有一个模糊的需求,不知道是否合理

目前我们的实时计算的Job都是以On Yarn模式运行在hadoop集群,每次提交新的job,都是在Flink客户端下面,用./bin/flink
run-application -t yarn-application ....... 的形式去提交Job。

现在我们有自研的一个关于数据处理平台,flink
job是数据处理的一个环节,想着能不能在我们系统的portal中配一个菜单,上传flink项目的jar包,可以提交Job到hadoop集群,形成一体化的管理,不用每次去一个flink客户端下面去提交了,不知道这种需求是否合理?

我想着如果在我们自己的平台上提交job,那是不是应该先把flink客户端先集成到我们的系统中呢,否则job如何被启动运行呢?

需求比较模糊,各位大佬见谅。



-----
Thanks!
Jacob
--
Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink job与自己系统平台的一体化集成

Posted by 冯嘉伟 <14...@qq.com>.
Hi

可以分解为两步:
1、生成JobGraph,可以参考org.apache.flink.runtime.webmonitor.handlers.utils.JarHandlerUtils
中 toJobGraph()
2、向Yarn提交JobGraph,可以参考org.apache.flink.yarn.YarnClusterDescriptor 中
deployJobCluster()
注:1.11.x


Jacob wrote
> 有一个模糊的需求,不知道是否合理
> 
> 目前我们的实时计算的Job都是以On Yarn模式运行在hadoop集群,每次提交新的job,都是在Flink客户端下面,用./bin/flink
> run-application -t yarn-application ....... 的形式去提交Job。
> 
> 现在我们有自研的一个关于数据处理平台,flink
> job是数据处理的一个环节,想着能不能在我们系统的portal中配一个菜单,上传flink项目的jar包,可以提交Job到hadoop集群,形成一体化的管理,不用每次去一个flink客户端下面去提交了,不知道这种需求是否合理?
> 
> 我想着如果在我们自己的平台上提交job,那是不是应该先把flink客户端先集成到我们的系统中呢,否则job如何被启动运行呢?
> 
> 需求比较模糊,各位大佬见谅。
> 
> 
> 
> -----
> Thanks!
> Jacob
> --
> Sent from: http://apache-flink.147419.n8.nabble.com/





--
Sent from: http://apache-flink.147419.n8.nabble.com/