You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user@kylin.apache.org by Weatherpop <62...@qq.com> on 2016/06/21 07:11:14 UTC
回复:DISTINCT_COUNT精确计算问题
可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的
------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org"<us...@kylin.apache.org>; "dev@kylin.apache.org"<de...@kylin.apache.org>;
主题: DISTINCT_COUNT精确计算问题
大家好:
Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
谢谢!
答复: 回复:DISTINCT_COUNT精确计算问题
Posted by 仇同心 <qi...@jd.com>.
您好:
Hash值是否会出现重复呢?
谢谢!
发件人: Weatherpop [mailto:623891205@qq.com]
发送时间: 2016年6月21日 15:11
收件人: user@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题
可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的
------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org<ma...@kylin.apache.org>>; "dev@kylin.apache.org<ma...@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题
大家好:
Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
谢谢!
答复: 回复:DISTINCT_COUNT精确计算问题
Posted by 仇同心 <qi...@jd.com>.
您好:
Hash值是否会出现重复呢?
谢谢!
发件人: Weatherpop [mailto:623891205@qq.com]
发送时间: 2016年6月21日 15:11
收件人: user@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题
可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的
------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org<ma...@kylin.apache.org>>; "dev@kylin.apache.org<ma...@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题
大家好:
Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
谢谢!