当前位置: 首页 > news >正文

数据分析技术面试常问知识点整理

SQL高频面试题

行列转换可以通过CASE WHENGROUP BY实现,适用于统计不同维度的汇总结果。例如:

SELECTuser_id,MAX(CASEWHENtype='click'THENcntELSE0END)ASclick_cnt,MAX(CASEWHENtype='pay'THENcntELSE0END)ASpay_cntFROMuser_actionGROUPBYuser_id;

分组取TopN通常使用窗口函数ROW_NUMBER()RANK()实现:

SELECT*FROM(SELECTcategory,sales,ROW_NUMBER()OVER(PARTITIONBYcategoryORDERBYsalesDESC)ASrnFROMproduct_sales)tWHERErn<=3;

连续登录或连续日期问题可以通过日期偏移和分组标记法解决:

SELECTuser_id,COUNT(*)AScontinuous_daysFROM(SELECTuser_id,login_date,DATE_SUB(login_date,INTERVALROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYlogin_date)DAY)ASflagFROMuser_login)tGROUPBYuser_id,flagHAVINGcontinuous_days>=3;

去重与统计可以使用COUNT(DISTINCT)GROUP BY

SELECTCOUNT(DISTINCTuser_id)ASuvFROMuser_logWHEREdate='2025-12-25';

多表连接与子查询包括INNER JOINLEFT JOIN的使用场景:

SELECTu.user_id,u.name,o.order_amountFROMuseruLEFTJOIN`order`oONu.user_id=o.user_id;

核心指标理解

基础业务指标包括UV、PV、转化率、留存率、复购率、GMV、客单价和LTV。

留存计算分为次日留存、7日留存和30日留存,公式为:

次日留存 = 当日新增用户且次日仍活跃用户数 / 当日新增用户数

转化率包括点击转化率和支付转化率:

点击转化率 = 点击用户数 / 曝光用户数 支付转化率 = 支付用户数 / 点击用户数

业务分析思路

数据波动分析框架包括确认数据真实性、拆分维度、对比同期和环比,并结合运营动作分析原因。

漏斗分析适用于转化路径优化,定位流失最大环节并给出优化方向。

用户分层可以通过RFM模型实现,用于精细化运营。


Python与工具相关

Pandas常用操作包括数据读取、缺失值处理、分组聚合和透视表:

importpandasaspd df=pd.read_csv('data.csv')df=df.dropna()df.groupby('category')['sales'].sum()

数据可视化工具如Matplotlib和Seaborn可用于绘制折线图、柱状图、饼图和热力图。

统计学基础包括均值、中位数、标准差、正态分布和假设检验。


http://www.jsqmd.com/news/546778/

相关文章:

  • SEO_网站SEO效果差?试试这些解决办法与策略
  • 丹青幻境快速上手:用‘揭榜留存’功能批量导出高清PNG/WEBP格式作品
  • 用过才敢说 2026 最新降AI率工具测评与推荐
  • 2026年日常保洁口碑白皮书三口之家服务解析:日式擦玻璃/日式收纳/日式日常保洁/日式深度保洁/日式除菌保洁/日式高端保洁/选择指南 - 优质品牌商家
  • 嵌入式裸机菜单库:无GUI框架的静态树形菜单实现
  • 2026生产进度管理系统精选推荐:自动化产线、数字工厂与车间设备数据采集方案解析
  • Django REST framework的应用场景
  • FMQL系列SOC的PS侧UART功能使用说明2
  • 咱们今天来唠唠机器人轨迹规划那点事儿。不少小伙伴在玩机械臂的时候总会遇到关节空间和笛卡尔空间轨迹规划的抉择困难症,这俩货到底有什么区别?直接上硬核代码
  • 复合餐饮定制融合型番茄火锅底料推荐指南:调味料品牌推荐/钵钵鸡调料/餐调味料/黄焖鸡调料/中餐底料/串串香火锅底料/选择指南 - 优质品牌商家
  • 嵌入式轻量级3D数学库mmath:面向MCU的定点/浮点向量矩阵运算
  • 【PolarCTF2026年春季挑战赛】sql_search
  • 软件测试学习第一期
  • OpenClaw轻量部署:Qwen3-VL:30B-4bit量化版飞书助手搭建
  • Matlab处理tdms数据踩坑实录:从‘无法识别’到完美绘图的5个关键步骤
  • 2026招生财务教务一体化平台品牌推荐榜:校园一站式管理平台/校园大数据分析平台/职业院校 一体化管理平台/选择指南 - 优质品牌商家
  • STM32负载平衡监控系统设计与实现
  • STM32激光充电系统设计与实现
  • 薛定谔的交付:既上线又未上线的功能模块
  • 5步实现Switch控制器PC全功能适配:从连接到精通的设备适配指南
  • ssm+java2026年毕设司库管理系统【源码+论文】
  • 【docker】WSL2+docker_desktop+GPU环境配置避坑指南
  • 告别加班!3个Word神技巧,文档处理快人一步
  • 多项式朴素贝叶斯
  • 「理性认知」和「本能恐惧」在打架
  • AT89C52单片机驱动共阴数码管实现方法
  • Ark-Pets的模型资源管理革新:从下载困境到智能分发的实践之路
  • STM32智能水产养殖监控系统设计与实现
  • RTX4090D显存优化:OpenClaw+Qwen3-32B-Chat批量处理千页PDF
  • ssm+java2026年毕设私教预约系统【源码+论文】