当前位置: 首页 > news >正文

一份热乎的数据分析(数仓)面试题 | 每天一点点,收获不止一点

目录

1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

2. 设计数据仓库的保单表(⾃⾏命名)

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

6.2 异常值检测问题 

6.3  无效搜索问题 | 百度面试题

 6.4 区间分布问题

6.5 用户购买行为分析

 6.6 滴滴呼叫订单问题

 6.7 蚂蚁森林低碳生活数据分析

 6.8 快手直播间人员在线分析

6.9 京东电商购物漏斗分析 

6.10 Soul 用户活跃、留存和粘性分析

​6.11 微信-情人节红包流向探索分析

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!


1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

根据数据仓库命名规范给用户维度表命名
字段名字段类型描述
customeridstring用户唯一标识
agebigint用户年龄
age_descstring用户年龄分层(21岁到60岁,每5岁为一个间隔,例如21-25、26-30)
1.1 create :创建⽤⼾维度表(hive)
要求1,建表
要求2,保留最近7⽇分区
1.2 insert :将ods表导⼊建好的⽤⼾维度表

2. 设计数据仓库的保单表(⾃⾏命名)

(保单表)数据范围2024年8月1日至今的新短期付费保险单
字段名字段类型描述
用户唯一标识
产品ID
保单号
保费
投保日期
其他能想到的维度自行补充

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

参考数据如下:Mike是在1/6,John是在1/8,Lisa是在1/4
用户唯一标识保费投保日期
Mike20002024-01-01
Mike20002024-01-02
John30002024-01-02
Lisa50002024-01-04
Mike60002024-01-06
John20002024-01-08
Lisa10002024-01-08

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

推荐人被推荐人推荐层级
AB1
BC1
AD1
DE1
DF1
CH1

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

 数据分析面试题:客户投保问题分析-CSDN博客

6.2 异常值检测问题 

 数据分析面试题:如何分析基于绝对中位差的异常值检测问题?-CSDN博客

6.3  无效搜索问题 | 百度面试题

数据分析面试题:无效搜索问题 | 百度面试题-CSDN博客

 

 6.4 区间分布问题

数据分析面试题:如何分析区间上用户分布情况 | 基于快递单量区间划分的用户分布情况 | 基于TOPN商品区间划分用户浏览情况分析-CSDN博客

6.5 用户购买行为分析

数据分析面试题:用户购买行为及订单统计分析【巴别时代】-CSDN博客

 

 6.6 滴滴呼叫订单问题

数据分析面试题:滴滴-订单呼叫完答率分析_滴滴应答率怎么解决数据分析-CSDN博客

 

 6.7 蚂蚁森林低碳生活数据分析

数据分析面试题:蚂蚁森林低碳生活数据分析_关于低碳生活 数据分析表-CSDN博客 

 

 6.8 快手直播间人员在线分析

数据分析面试题:快手直播间人员在线分析_c# 快手直播间在线人数-CSDN博客

6.9 京东电商购物漏斗分析 

数据分析面试题:京东电商购物漏斗分析-CSDN博客

6.10 Soul 用户活跃、留存和粘性分析

数据分析面试题:Soul 用户活跃、留存和粘性分析_soul留存数据-CSDN博客 

 6.11 微信-情人节红包流向探索分析

数据分析面试题:微信-情人节红包流向探索分析_红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信-CSDN博客

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!

当然,本文只是展示了数据分析面试题部分内容,其余的内容均在我的数字化建设通关指南专栏里,该专栏不局限于数据分析面试题,也有实战技巧的总结,和数仓建模经验的总结,具体参考如下专栏:

数字化建设通关指南_莫叫石榴姐的博客-CSDN博客

 

 


http://www.mrgr.cn/news/22047.html

相关文章:

  • 3280. 将日期转换为二进制表示
  • ROS - C++实现RosBag包录制
  • 【LeetCode热题100】前缀和
  • JVM 调优篇2 jvm的内存结构
  • 【Hot100】LeetCode—55. 跳跃游戏
  • 起点中文网防止网页调试的代码展示
  • 基于人工智能的手写数字识别系统
  • 【实习】C++方向面试经验3
  • 文件系统(文件描述符fd 重定向原理 缓冲区 stderr)
  • [OpenGL]使用Opengl和GLFW绘制三角形
  • 双网卡绑定(链路聚合)
  • 火绒安全:一款强大且高效的国产杀毒软件技术解析
  • 第三天旅游线路规划
  • TensorRT-LLM高级用法
  • 【系统设计】主动查询与主动推送:如何选择合适的数据传输策略
  • Clion不识别C代码或者无法跳转C语言项目怎么办?
  • Windows 环境安装 MSYS2 教程
  • 三个月涨粉两万,只因为知道了这个AI神器
  • 计算机世界撷趣
  • 树莓派5_opencv笔记27:Opencv录制视频(无声音)