跳到正文
全部标签

# etl

共 3 篇文章

  • 把事做完的人,才有资格谈成长

    把事做完的人,才有资格谈成长

    一个实习生Spark源码读了三遍,却搭不出一条最基础的ETL管道。数据团队的高级工程师追求完美,两周无法交付;初级工程师三天交出粗糙版本,两周后迭代成核心工具。本文揭示职场成长的核心逻辑:七成完整胜过十成精通,被动积累是温柔的陷阱,主动挑战才是真正的来源。
  • 数据地基(三):最稀缺的能力,不在简历上

    数据地基(三):最稀缺的能力,不在简历上

    数据地基系列第三篇:当两张报表数字对不上,谁能在30分钟内定位到是哪条ETL链路的哪个口径出了问题?数据血缘追踪能力——这项不写在简历上的稀缺技能,正是区分普通数据工程师和资深架构师的关键分水岭。本文通过真实排查场景,拆解这项能力的本质。
  • 为什么西贝3分钟能上菜,你的报表却要等2小时?

    为什么西贝3分钟能上菜,你的报表却要等2小时?

    西贝3分钟上菜靠的是预制菜,数据仓库3分钟出报表靠的是分层预计算——ODS/DWD/DWS/ADS每一层都是对数据的「预制」处理。本文借西贝预制菜风波,用最直观的类比讲透数据仓库分层思想:为什么你的报表要等2小时,以及如何通过合理分层把它缩短到3分钟。