新的知识点学习:Hive的聚合函数和窗口函数。之前学过简单的数值计算函数(比如计数、求和),今天学的聚合函数,其实是在此基础上的进阶,而且更适合批量统计分析,比如统计每个日期、每个地区的访问总量、商品点击总量。
今天重点学了最基础的窗口函数:row_number(给每条数据排名,不重复)、rank(排名,重复数据排名相同,后续排名会跳过),还有over()窗口的基础用法。
明天的计划是,继续练习窗口函数的实操,重点攻克over()窗口的用法,多写几条排名、分组统计的语句
新的知识点学习:Hive的聚合函数和窗口函数。之前学过简单的数值计算函数(比如计数、求和),今天学的聚合函数,其实是在此基础上的进阶,而且更适合批量统计分析,比如统计每个日期、每个地区的访问总量、商品点击总量。
今天重点学了最基础的窗口函数:row_number(给每条数据排名,不重复)、rank(排名,重复数据排名相同,后续排名会跳过),还有over()窗口的基础用法。
明天的计划是,继续练习窗口函数的实操,重点攻克over()窗口的用法,多写几条排名、分组统计的语句