数据人最痛苦的不是不学习。
是学了一堆,还是不知道自己值不值钱。
我见过太多这样的朋友:收藏夹里躺着 SQL 题库,网盘里放着 Python 课,浏览器标签页开着 Agent 教程,手机里还刷到一个“30 天转 AI 工程师”的训练营。每天都在学,每天都觉得自己落后。
这事有点像去医院体检。你明明只是缺维生素,却给自己安排了一个全身换血;你明明是睡眠不足,却开始研究高端保健品。钱花了,时间也花了,病因还在那儿。
学习也是一样。
你不是缺学习资料,你是缺一张体检表。

别再问“现在最火的是什么”
2026 年的数据人,最容易问错一个问题:现在最火的是什么?
有人说 Agent,有人说 RAG,有人说 dbt,有人说湖仓,有人说数据治理,有人说业务分析。每个人都说得挺有道理。听到最后,你会产生一种幻觉:好像这些都得学,而且最好明天就会。
可是学习不是赶集。不是看到哪个摊位人多,就过去买两斤。
真正该问的是:我现在卡在哪一层?
如果你连基础 SQL 都写不稳,先学 Agent 框架,像不会走路就买越野车。车很好,你开不动。如果你已经能独立做分析,但结论总被老板一句“所以呢”打回来,那你缺的不是 Python,而是问题定义和表达。
如果你有 3-5 年经验,技术栈挺满,却一直没有更大的项目机会,那你缺的可能不是新工具,而是把事情从“我会做”变成“我能负责”的能力。
所以我更建议你做一次学习体检。
第一类:0-1 年新人,先别急着学花活
0-1 年的数据新人,最容易被吓住。
打开招聘 JD,一行写 SQL,一行写 Python,一行写数仓,一行写大模型,一行写业务理解。看完感觉自己像刚进厨房的学徒,老板让你同时会切菜、炒菜、算账、装修和直播带货。
但新人真正要补的,不是所有东西。
你最该补三件事:SQL、指标、项目。
SQL 是你和数据世界说话的基本语言。不是说你要把每个窗口函数背成口诀,而是至少能独立查数、排错、解释结果。指标是业务世界的基本语言。你要知道 GMV、留存、转化、复购这些词背后到底怎么算,边界在哪里。
项目则是把前两者串起来的证据。
很多新人简历最大的问题是:技能很多,证据很少。写了 SQL、Python、Excel、Tableau、机器学习,但问一个“你独立完成过什么分析”就开始冒汗。
所以 0-1 年不要急着追最火的 AI。先做出一个能讲清楚的项目:问题是什么、数据从哪来、指标怎么定义、你发现了什么、最后产生了什么动作。
这一关过了,你才真正从“学过数据”变成“用过数据”。
第二类:1-3 年执行者,最该补业务分析
1-3 年的人,通常已经能干活了。
需求来了,能取数;报表坏了,能修;老板要看一个分渠道转化,也能做出来。问题是,你做得越熟,越容易变成“人肉查询引擎”。
别人问你什么,你就查什么。别人说要什么口径,你就给什么口径。你很忙,也很可靠,但不一定更值钱。
这个阶段最该补的,不是再多学一个工具,而是业务分析和表达。
业务分析,说白了就是不只回答“数据是多少”,还要回答“为什么是这样、接下来怎么办”。表达也不是写漂亮 PPT,而是能把一个复杂问题讲到别人愿意行动。
有个很简单的判断标准:
如果你做完一份分析,老板只说“收到”,那你大概率还停在执行层。
如果老板追问“那我们下周怎么改”,你才开始进入影响层。
1-3 年最重要的跃迁,就是从“完成需求”变成“改写需求”。
第三类:3-5 年瓶颈期,缺的是负责一件事
3-5 年是很多数据人的尴尬期。
你已经不是新人。基础能力也不差。SQL 会,Python 会,数仓懂一点,业务也懂一点。可是晋升、涨薪、跳槽都没有想象中顺。
原因可能很残酷:你会很多,但没有一件事真正由你负责。
公司不缺会做任务的人。公司缺的是能把一个模糊问题接过来,拆成路径,协调资源,推动落地,最后复盘结果的人。
这个阶段最该补的是:项目负责、方法沉淀、影响力。
项目负责不是头衔。不是你在项目群里,而是别人遇到这个问题会想到你。方法沉淀也不是写文档给自己看,而是把一次经验变成团队下次可以复用的东西。
影响力更不是到处刷存在感。它是你做的事情,被更多人看见、理解、信任。
如果你 3-5 年还在问“我还要不要学某个工具”,我会建议你先换个问题:
过去一年,有没有哪件事因为你而变得更好?
如果没有,再多工具也救不了你。
第四类:想转 AI 的数据人,别只做 Demo
现在很多数据人想转 AI。
这是好事。数据人确实有优势:懂数据、懂指标、懂业务,也知道系统上线后会遇到多少脏东西。
但转 AI 最容易踩的坑,是把“会调模型”当成“会做 AI 应用”。
一个 RAG Demo,上传几篇文档,问答能跑,这不难。难的是:文档怎么切、检索怎么评估、权限怎么控制、答案错了怎么发现、成本怎么压、用户反馈怎么进下一轮。
所以想转 AI 的数据人,最该补四件事:RAG、Eval、数据链路、工程化。
RAG 是让模型用外部知识回答问题。Eval 是评估模型输出好不好,不靠感觉拍脑袋。数据链路是把数据从源头、加工、检索、调用到反馈串起来。工程化是让 Demo 能稳定跑在真实业务里。
这也是为什么我最近一直在写 Agent、Eval、数据地基。因为真正值钱的不是“我会用某个模型”,而是“我能把模型接进一条可靠的数据和业务链路”。
第五类:求职党,最该补项目证据
求职党最容易陷入另一个误区:疯狂补技能词。
简历越改越长,技能栏越来越满:SQL、Python、Spark、Flink、RAG、Agent、LangChain、向量数据库、数据治理、A/B 测试……看起来像一个技术超市。
可是面试官真正想看的,不是你逛过多少货架,而是你买回去做成了什么菜。
求职最该补的是:项目证据和面试表达。
项目证据包括:你解决了什么问题、用了什么数据、做了什么取舍、结果如何验证。面试表达包括:你能不能在 3 分钟内讲清一个项目,在追问里不露怯,在谈薪时说清自己的价值。
如果你现在正在找工作,我建议你先别再往技能栏塞新词。先挑 2 个项目,按下面这 5 个问题重写:
- 当时的业务问题是什么?
- 为什么这个问题值得解决?
- 你用了哪些数据和方法?
- 中间做过什么关键取舍?
- 结果怎么验证,带来了什么变化?
这 5 个问题答不清,简历再漂亮也不稳。
一张学习体检表
把上面这些汇总起来,大概是这样:
| 你现在的状态 | 典型表现 | 最该补的课 | 不建议优先补 |
|---|---|---|---|
| 0-1 年新人 | 会工具,但没项目 | SQL、指标、项目 | Agent 框架 |
| 1-3 年执行者 | 能取数,但不会拆问题 | 业务分析、表达 | 再学一个 BI 工具 |
| 3-5 年瓶颈期 | 技术不少,影响力不够 | 项目负责、方法沉淀 | 继续堆技能词 |
| 转 AI 的数据人 | 会调模型,但落不了地 | RAG、Eval、数据链路 | 只追模型榜单 |
| 求职党 | 简历很多词,证据很少 | 项目证据、面试表达 | 盲目刷课 |
这张表不是标准答案。它更像一张地图。你不一定完全落在某一类,但大概率会在其中一两格里看到自己。
看到自己,比看到热点重要。
如果你想系统补课
如果你只是想判断方向,这篇文章够了。
但如果你想把方向变成具体学习路径、项目清单、面试题和模板,我建议你去看拾穗数据知识库。
我把这些内容分成了几条路线:
- 数据分析师 L1-L4 成长路线;
- 数据开发 / 数据工程师 L1-L4 成长路线;
- SQL、Python、Spark、数仓建模的面试题和实战题;
- RAG、Agent、Eval、数据飞轮这些 AI 方向的工程化内容;
- 简历、项目复盘、面试表达、薪酬谈判模板。
你可以把它当成一个数据人的学习导航。不是让你什么都学,而是先判断自己在哪一层,再补那一层最关键的课。
入口我会放在文章发布页和知识库导航里。你也可以在评论区告诉我:你现在是新人、执行者、瓶颈期、转 AI,还是求职党?我后面可以继续把每一类拆成更细的学习清单。
如果你正在纠结下一步该学什么,也可以直接加我微信聊聊。微信号:shisuidata,加的时候备注一下「学习体检」。