You are viewing a plain text version of this content. The canonical link for it is here.

Posted to user-zh@flink.apache.org by superainbower <su...@163.com> on 2020/09/24 03:52:20 UTC

flink on yarn NM JVM内存

Hi, 大家好
我有个flink任务在yarn上跑，statebackend是rocksdb，由于是测试，所以一段时间内我反复起停了任务，后来我发现在Yarn集群的NodeManger出现GC时间超出阈值报警（没有其他错误日志），此时我查看对应节点的 NodeManger的JVM堆内存几乎占满了（1.5G），从曲线图上看整个堆内存是逐步增加的（和我测试Flink任务的时间基本吻合），GC持续达到30多秒，把flink任务停止后，JVM堆内存始终下不来，只能重启Yarn集群；
想请教大家，flink on yarn给了 taskmanger的内存 和jobmanager的内存，怎么还会影响到Nodemanger的JVM内存，另外任务已经停掉，JVM堆内存也下不来，这块会和rocksdb有关系吗？


| |
superainbower
|
|
superainbower@163.com
|
签名由网易邮箱大师定制

Re: flink on yarn NM JVM内存

Posted by Xintong Song <to...@gmail.com>.

应该和 flink 的 JM/TM/rocksdb 没有直接关系。不排除反复起停任务给 NM 造成了一定的压力。建议你去 hadoop
社区的邮件列表问问看。

Thank you~

Xintong Song



On Thu, Sep 24, 2020 at 11:52 AM superainbower <su...@163.com>
wrote:

> Hi, 大家好
> 我有个flink任务在yarn上跑，statebackend是rocksdb，由于是测试，所以一段时间内我反复起停了任务，后来我发现在Yarn集群的NodeManger出现GC时间超出阈值报警（没有其他错误日志），此时我查看对应节点的
> NodeManger的JVM堆内存几乎占满了（1.5G），从曲线图上看整个堆内存是逐步增加的（和我测试Flink任务的时间基本吻合），GC持续达到30多秒，把flink任务停止后，JVM堆内存始终下不来，只能重启Yarn集群；
> 想请教大家，flink on yarn给了 taskmanger的内存
> 和jobmanager的内存，怎么还会影响到Nodemanger的JVM内存，另外任务已经停掉，JVM堆内存也下不来，这块会和rocksdb有关系吗？
>
>
> | |
> superainbower
> |
> |
> superainbower@163.com
> |
> 签名由网易邮箱大师定制
>
>