You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by yidan zhao <hi...@gmail.com> on 2021/06/11 02:56:32 UTC

Flink的web-ui卡顿问题

工作中遇到的各种web-ui现象:
0 web-ui正常。
1 web-ui卡顿,进入页面时候白色,一直转圈。看控制台发现network部分对应请求一直pending,请求一直不返回。
2 web-ui卡顿,转圈很久突然一瞬间展示,如何刷新就继续转圈进入白色页面了。
3 web-uI基本正常使用,但是很卡顿。
4 任务提交、取消、主动触发保存点等case下,web-ui卡顿严重,过会恢复。
5 如上几个case中,有时候伴随卡顿之后进入选举,然后重新进入循环(可能正常也可能继续卡顿继续导致JM进程失败导致重启拉起进入选举等)。


如上总结,目前我部署集群,比如30个容器。每个容器都部署Jm和Tm进程。JM分配3G内存,TM分配20G内存。我自认为web-ui的卡顿部分问题在于JM的性能假设,那么我想知道的是:
(1)是否需要降低JM进程的数量,比如30个JM是不是会导致选举性能下降,那么JM一般搞多少合适呢?比如搞3个(在TM为30个的规模背景下)?
(2)考虑30个JM,每个JM3G内存,那就是90G内存。是否改造成3个JM,每个30G内存,这样leader的JM进程就性能好一些,这个想法正确吗?