You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user@kylin.apache.org by Weatherpop <62...@qq.com> on 2016/06/21 07:11:14 UTC

回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的


------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org"<us...@kylin.apache.org>; "dev@kylin.apache.org"<de...@kylin.apache.org>; 

主题: DISTINCT_COUNT精确计算问题



  
大家好:
 
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
 
 
 
谢谢!

答复: 回复:DISTINCT_COUNT精确计算问题

Posted by 仇同心 <qi...@jd.com>.
您好:
Hash值是否会出现重复呢?

谢谢!

发件人: Weatherpop [mailto:623891205@qq.com]
发送时间: 2016年6月21日 15:11
收件人: user@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的

------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org<ma...@kylin.apache.org>>; "dev@kylin.apache.org<ma...@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题

大家好:
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?

谢谢!

答复: 回复:DISTINCT_COUNT精确计算问题

Posted by 仇同心 <qi...@jd.com>.
您好:
Hash值是否会出现重复呢?

谢谢!

发件人: Weatherpop [mailto:623891205@qq.com]
发送时间: 2016年6月21日 15:11
收件人: user@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的

------------------ 原始邮件 ------------------
发件人: "仇同心";<qi...@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org<ma...@kylin.apache.org>>; "dev@kylin.apache.org<ma...@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题

大家好:
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?

谢谢!