跳到正文

更多文章

企业 Agent 进生产,数据人的机会不在写 Demo AI 时代数据人的学习地图——表达力、阅读力,与那些不必再练熟的东西 数据周刊|2026年5月第1周:wuphf 的 Agent 共享办公室、5 框架上下文对比、Apache Fluss 「AI 工程师」是不是泡沫——一个流行标签的虚实 2-4 年到 4-6 年的跃迁动作清单——抓住数据人的窗口期
AI 时代的技能折旧表:你简历上的词条,哪些在贬值

我有个朋友,5 年前花了 1 万 5 考了 Cloudera 的 CCP 数据工程师认证,那时候这是大数据圈子里挺硬的资历——简历上一摆,年薪可以多谈 10%。

去年他跳槽,面试官一脸茫然问他:“Cloudera 是什么?”

类似的事每个数据人身边都有几个。Storm 这个项目你们还记得吗?2014 到 2017 年大厂实时数仓的当家技术。HBase 呢?Sqoop?Pig?这些当年简历上闪闪发光的关键词,今天你写上去面试官多半会看一眼然后跳过。

技能不是不会被替换,是替换速度永远比你以为的快


什么叫”技能折旧”

汽车折旧好理解——你今天买一辆车,明天开出 4S 店就便宜 10%。技能也类似,区别是你看不见折旧的过程。

技能折旧的常见形态有四种:

第一种,被新技术替代。你会的那个工具被一个更顺手的工具取代了。Storm 被 Flink 替代、Pig 被 Spark SQL 替代、传统 ETL 工具被 dbt 替代——你之前花的时间还在,但市场不再为它付费。

第二种,被自动化吃掉。这是 AI 时代的主旋律。你之前做的事变成了一个工具按钮,比如”写一段把 raw 表清洗成宽表的 SQL”——以前是数据工程师 2 小时的活,现在 AI Copilot 30 秒。

第三种,门槛降低。你的技能本身没过时,但学会它的成本变低了。供给变多,单价变低。Python 数据分析现在大学生都会,10 年前是稀缺技能。

第四种,标准变了。市场对”什么算合格”的标准变高了。10 年前你会写 SQL 就是数据分析师,今年你只会写 SQL 但不会做归因分析、不懂 AB test、不能写出业务洞察——你拿不到 offer。

理解这四种形态,是为了搞清楚一件事——不是所有技能都按同样的速度折旧。差异巨大。


技能折旧表(数据从业者版)

下面这张表是我自己最近梳理的,结合身边朋友的市场反馈和招聘数据(Indeed Hiring Lab 报告、各家 JD 关键词分布观察)。按折旧速度分四个区

数据从业者技能折旧速度表:四个区域 + 每区典型技能清单

下面是逐区的详细列举——

🔻 加速折旧区(2-3 年内市场需求大幅下降)

技能折旧原因当前还能用多久
纯 ETL 工具操作(Informatica / Kettle / DataStage)被 dbt + Airflow 生态替代,AI 还在加速这个过程3-5 年
单一平台技能(Hadoop / Cloudera 全家桶)云数仓和湖仓一体把它挤到边角2-3 年
Pig / Storm / Sqoop / HBase 操作已经基本退出主流已经过期
会写 SQL 但不懂业务的”取数员”AI Copilot 30 秒能写2 年
做基础报表 / 看板搭建自助 BI + AI 接管3 年
简单的描述性统计分析AI 标准动作2 年
模板化的 PPT 汇报AI 一键出1 年

特征:纯执行性、强工具依赖、低判断含量

🟡 中速折旧区(5-10 年仍有市场,但回报递减)

技能现状
Python 数据处理(pandas / numpy)基础项,必须会但不再加分
Spark / Flink 开发仍是核心技能,但要求叠加场景理解
传统数仓建模(Inmon / Kimball)没过时,但要会迁移到云原生
经典机器学习(决策树/线性回归/聚类)仍有价值,但被深度学习和 LLM 挤压
标准 AB 测试执行不过时,但要懂得设计而不只是跑

特征:仍是”基本盘”,但单独靠它已经撑不起市场价

🟢 保值区(10 年甚至更长依然增值)

技能为什么保值
数据建模思维(不是工具)业务再变、工具再变,建模本质不变
因果推断 / 实验设计反直觉、需要数学和判断力,AI 短期内做不好
业务理解 + 翻译能力把模糊业务问题变成具体数据问题——这是 AI 最弱的环节
数据治理 / 元数据 / 血缘越来越重要,且工具替代不了治理决策
系统架构设计全局视角 + 取舍判断,AI 能辅助但替代不了
写作 / 表达 / 影响力跨任何技术周期都增值

特征:判断力 + 跨场景 + 不依赖特定工具

🌱 新生区(出生 2 年内,正在加速升值)

技能当前价值信号
RAG 系统设计与优化JD 出现频率显著上升(参见 Indeed 报告中”数据/分析岗 45% 含 AI 关键词”的趋势)
Agent 编排 / 多 Agent 协作几乎所有 AI 工程岗都在问
LLM 评测体系(eval / trace / golden set)真正能让 AI 产品上线的关键能力
Prompt 工程 / Context 工程从被嘲笑到被严肃要求
向量数据库 / 语义检索标配
模型选型 / 成本优化新岗位”AI Cost Engineer”已经在出现
LLMOps / AI 平台可靠性上一期周刊讲过的 Whatnot 那篇就是典型案例

特征:刚有市场需求、供给还没跟上、入场早的人享有溢价


为什么差异这么大

把上面四个区域放一起看,你会发现一个规律——越靠近”工具”的技能,折旧越快;越靠近”判断”的技能,折旧越慢;越靠近”新工具配新判断”的技能,反而在升值

为什么?

工具是有形的、可复制的、有替代品的。任何一个具体工具——Cloudera 也好、Storm 也好、Informatica 也好——它的本质是”针对某个时代的工程问题给出的一个解”。时代变了,问题被新工具更好地解了,老工具就退场。这是技术演化的常态。

判断力是抽象的、个人化的、积累型的。“这个数据该信吗""这个业务问题该怎么拆”——这种事你从入行第一天开始练,到第十年还在练。AI 现在能模拟一部分判断,但判断力的核心是基于上下文 + 经验的”知道在乎什么”——这是 AI 短期内做不到的。

新工具配新判断为什么升值?因为市场刚刚意识到自己需要它,但合格供给还没到。RAG 系统设计、Agent 编排、LLM 评测——这些技能两年前几乎没有市场,现在 JD 上越来越多,但有真实生产经验的人还很少。供需缺口 = 溢价


学习时间该怎么分配

如果你认同上面的分类,下面是我的建议——把你的学习时间切成三块

学习时间分配建议:50% 保值区打基础 + 30% 新生区抓窗口 + 20% 中速折旧区维护

第一块:50% 投在”保值区”打基础

这是地基。如果你刚入行 1-3 年,所有的判断力训练都不嫌多。具体可以这样投:

  • 系统读完 Kimball 的《数据仓库工具箱》(这本书 30 年了,依然是数据建模圣经)
  • 学一遍因果推断——推荐 Judea Pearl 的《Book of Why》入门 + Scott Cunningham 的 Causal Inference: The Mixtape 进阶
  • 找机会做完整的 AB test 设计——不只是跑实验,是从假设、样本量、统计检验、解读这一整套
  • 每周写一篇技术或业务复盘,强迫自己练”把模糊问题说清楚”的能力

这部分投入回报最慢,但回报最长。5 年后你和同期入行的人之间,就靠这一块拉开本质差距

第二块:30% 投在”新生区”抓窗口

新生区的特点是早入场就有红利。但风险是它可能不会变成下一个保值区——比如 5 年前的”区块链工程师”。

所以这一块的投入要带一点理性的赌性:

  • 集中投在已经有真实落地案例的方向——RAG、Agent、LLM eval、向量检索。这些不是 hype,是已经有大厂在用的工程能力。
  • 做项目,不是看视频。学这些技能最快的方式是建一个能跑的小系统——哪怕是一个 RAG 化的”我的笔记问答机器人”。
  • 关注开源项目的演进——LangChain、LlamaIndex、DSPy、MCP——这些是这一波技术的”工具书”。
  • 在公司里主动接一个 AI 项目。哪怕只是一个内部小工具,把它做到能上线、能被同事用——你的简历上会多一笔硬通货。

第三块:20% 投在”中速折旧区”维护现状

这部分是养着——保持基本盘不丢,但不要再过度投入。Python、Spark、传统数仓这些技能你已经会了,每年花 20% 的时间维护更新就够。不要再为一份新的”Spark 性能调优大全”花一个月去啃——你会的那点已经够用了。

剩下的 0% 给”加速折旧区”——别再投入了,到了这一步就该开始迁移。


一个反例:保值不等于不学

需要澄清一件事——保值区的技能不会贬值,但你的”对它的掌握程度”会贬值

5 年前你做的 AB test 是”分流量看 ctr 涨没涨”,今年公司期待的 AB test 是”考虑长期效应、考虑 sleeper effect、考虑因果识别、考虑实验间互相干扰”——同样叫 AB test,深度要求完全不一样

保值区不是”学一次永久受益”的躺平区。它是”你必须不断加深理解”的区域——只是加深的方向不会错。


一个更长远的判断

AI 这一波下来,最值钱的不是某个具体技能,是**“判断什么会折旧”这个能力本身**。

5 年前我看到 Hadoop 那一套全家桶,没多想就跟着学了。后来发现这一套被云数仓挤到边角,自己投在上面的时间一去不返。

今年再看 LLM 这一波,我学聪明了——不再死磕某个特定 framework(LangChain 半年迭代一次架构,你跟得过来吗?),而是死磕”模型无关”的能力:怎么写好 prompt、怎么搭 eval、怎么管 context。

这种”看清折旧速度”的能力,是元能力。它指导你下一次该投资什么、该放弃什么。它本身永远不会折旧——因为每一次技术换代,市场都需要这种判断。


一句话收束

技能折旧不可避免,但可以管理;判断什么会折旧的能力,永远值得投资

说到这里我自己一直在想一件事——如果让我画一张”数据从业者每个段位 5 年内的学习地图”——保值区学什么、新生区抓什么、什么时候放弃什么——会长什么样? 这是我最近一直在梳理的,有想法的朋友可以加我微信(shisuidata)一起聊


我叫石头,在数据行业里摸爬滚打了十几年,学到的东西,大半是在做错之后才想明白的。这里写的,就是这些教训——我觉得值得说出来的那部分。


数据来源

拾穗数据|https://ss-data.cc

Elazer (石头)
Elazer (石头)

11 年数据老兵,从分析师到架构专家。用真实经历帮数据人少走弯路。

加入免费社群

和数据从业者一起交流成长

了解详情 →

成为会员

解锁全部内容 + 知识库

查看权益 →

1v1 咨询

有具体职业困惑?一小时说清楚

预约咨询 →
← 上一篇 2026 数据岗位金字塔变形:入门岗在缩,4-6 年突然变香 下一篇 → 数据周刊|2026年4月第4周:Agent 落地的账本——Shopify、Monzo、Halodoc 的真实数字