数据分析及应用:如何分析区间上用户分布情况 | 基于快递单量区间划分的用户分布情况 | 基于TOPN商品区间划分用户浏览情况分析
目录
0 引言
1 需求描述
2 数据准备
3 数据分析
4 问题拓展
4.1 场景
4.2 方案
0 引言
按照一定规则划分区间这类问题 本质上是基于规则的分桶问题,在实际业务中经常出现,通过人为对某一指标值划分区间,然后反向分析该区间中用户的分布情况、用户行为情况,以达到运营促销的目的。此类问题实际上就是利用case when来划分区间,再根据划分的区间进行分组,这类问题在数据分析应用中比较多。
1 需求描述
SOL查询数据库中揽收表字段如下
运单号 客户id 创建日期
PNO0011 CC001 2020-05-01
计算创建日期在2020-05-01到2020-05-31期间客户的单量分布情况
最终得出数据如下
单量 客户数
0-5
6-10
11-20
20以上注意揽收表track_t
运单号唯一:track_id
一个客户可以有多个快递
2 数据准备
create table track_t as
select 'PNO0011' track_id, 'CC001' cus_id, '2020-05-01' dt union all
select 'PNO0012' track_id, 'CC001' cus_id, '2020-05-01' dt union all
select 'PNO00