etl

# etl

共 3 篇文章

把事做完的人，才有资格谈成长

职场认知 · 观点

把事做完的人，才有资格谈成长

一个实习生Spark源码读了三遍，却搭不出一条最基础的ETL管道。数据团队的高级工程师追求完美，两周无法交付；初级工程师三天交出粗糙版本，两周后迭代成核心工具。本文揭示职场成长的核心逻辑：七成完整胜过十成精通，被动积累是温柔的陷阱，主动挑战才是真正的来源。

Elazer (石头) 2026年4月6日

数据地基（三）：最稀缺的能力，不在简历上

数据治理 · 方法

数据地基（三）：最稀缺的能力，不在简历上

数据地基系列第三篇：当两张报表数字对不上，谁能在30分钟内定位到是哪条ETL链路的哪个口径出了问题？数据血缘追踪能力——这项不写在简历上的稀缺技能，正是区分普通数据工程师和资深架构师的关键分水岭。本文通过真实排查场景，拆解这项能力的本质。

Elazer (石头) 2026年2月5日

为什么西贝3分钟能上菜，你的报表却要等2小时？

数据工程 · 方法

为什么西贝3分钟能上菜，你的报表却要等2小时？

西贝3分钟上菜靠的是预制菜，数据仓库3分钟出报表靠的是分层预计算——ODS/DWD/DWS/ADS每一层都是对数据的「预制」处理。本文借西贝预制菜风波，用最直观的类比讲透数据仓库分层思想：为什么你的报表要等2小时，以及如何通过合理分层把它缩短到3分钟。

Elazer (石头) 2025年9月26日

未在播放