You are viewing a plain text version of this content. The canonical link for it is here.
Posted to issues@kylin.apache.org by "Jiale He (Jira)" <ji...@apache.org> on 2022/12/01 07:52:00 UTC

[jira] [Updated] (KYLIN-5315) Optimize snapshot management and support automatic snapshot refresh

     [ https://issues.apache.org/jira/browse/KYLIN-5315?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel ]

Jiale He updated KYLIN-5315:
----------------------------
    Attachment: KYLIN-5315 自动刷新快照 Dev Design.pdf

> Optimize snapshot management and support automatic snapshot refresh
> -------------------------------------------------------------------
>
>                 Key: KYLIN-5315
>                 URL: https://issues.apache.org/jira/browse/KYLIN-5315
>             Project: Kylin
>          Issue Type: Bug
>          Components: Job Engine
>            Reporter: Jiale He
>            Priority: Major
>             Fix For: 5.0-alpha
>
>         Attachments: KYLIN-5315 自动刷新快照 Dev Design.pdf
>
>
>  
> Kylin 系统中对于快照管理,有两种管理模式:系统自动管理、用户手动管理。默认是系统自动管理,可以通过在项目级开启快照管理来进入用户手动管理模式。 * 系统自动管理的优势是,用户操作简便,无需单独新建、刷新快照等。劣势是,会造成一定程度上的重复刷新,每次构建 Segment 时,都会重复刷新引用的快照,而且如果是快照是分区表,也会刷新全部分区。
>  * 用户手动管理的优势是,可以精准刷新快照,只需要在快照在底层数据源更新之后,主动触发刷新即可。对于分区表快照,也可以精准刷新部分分区。而缺点是管理成本高,{*}系统无法主动感知底层数据源刷新,需要用户主动触发{*},往往需要与上游数据准备进行集成,数据源有更新或新增分区时,触发刷新快照 API。而如果不进行及时的刷新,快照数据可能滞后。
> 为了降低上述管理成本,希望 kylin 能自动感知快照底层 Hive 数据源的更新,并自动触发刷新快照,用户无需与上下游集成也能及时刷新快照。



--
This message was sent by Atlassian Jira
(v8.20.10#820010)