一次大数据平台面试被 K8S 追问打穿后,我把这些知识盲点补齐了
一次大数据平台面试,让我重新审视 K8S
最近参加了一场偏机器人数据平台 / 大数据平台开发的面试。
我原本以为重点会集中在:
Spark / Flink
DolphinScheduler
数据质量
多模态数据处理
训练数据构建
MCAP / HDF5 / ROS2
结果面试官连续追问了大量 K8S 相关问题:
K8S 集群级动态扩缩容怎么做?
Spark dynamic allocation 和 K8S 扩 Node 是什么关系?
K8S Service 怎么把服务暴露出去?
K8S 有哪些核心组件?
Prometheus 有哪些指标类型?
RSS / WSS / container_memory_usage 有什么区别?
taint / toleration / nodeSelector / nodeAffinity 怎么用?
DolphinScheduler + Spark on K8S 下任务 kill 失败怎么定位?
这场面试让我意识到一个现实:
今天的大数据开发,尤其是数据平台开发,已经不再只是写 Spark SQL、Flink Job、调度 DAG。只要你的任务跑在 K8S 上,你就绕不开 Pod、Node、调度、资源、监控、扩缩容和 OOM。
如果你简历里写了Sp
