跳到正文

更多文章

影响力日常操作系统:21天习惯养成计划 从技能雇佣者到价值创造者 互惠账户的运营 影响力的三层架构 组织的注意力经济学
把事做完的人,才有资格谈成长

我带过一个实习生,Spark 源码读了三遍。

面试的时候,他聊 Shuffle 机制能聊一下午,从 HashPartitioner 讲到 SortShuffleManager,白板上画的架构图比教科书还工整。我当时觉得这小伙子不错,基础扎实,收了。

入职第二周,项目组要搭一条实时数据链路。需求不复杂:Kafka 接消息,Flink 做清洗,写进 Hive 分区表,下游 BI 报表能看到数据。说白了就是一条最基础的 ETL 管道,任何一个干了两年的数据工程师闭着眼都能搭出来。

他卡住了。

不是不会——你问他 Flink 的 Checkpoint 原理,他答得比我都好。可是他不知道第一步该做什么。Kafka 的 topic 找谁申请?Flink 集群的资源怎么配?Hive 的分区策略按天还是按小时?下游报表刷新频率是多少,数据延迟 SLA 怎么定?

这些问题每个单拎出来都不难,可是串在一起,就变成了一条完整的链路——从需求到交付,从 0 到 1。他读过的源码里没有这一章。

三周后项目上线,链路是我帮他搭完的。他在旁边看,很认真地记笔记。我没有责怪他,因为这不是他一个人的问题。这是一整代人的问题。

我们花了太多时间去「懂」,却太少时间去「做完」。

「我懂了」是最贵的错觉

我不知道从什么时候开始,「学习」变成了一种独立的目标。

打开朋友圈,到处是在读书的人——读技术书、读商业书、读认知升级的书。听播客,刷视频课,做笔记,整理卡片。每个人看起来都在学习,都很努力。可你问他:学完了,然后呢?

然后就没有然后了。

很多人会觉得被冒犯:学习难道不好吗?当然好。我不是说学习没有价值。我想说的是——没有目标的学习,保质期极短

你今天花三小时读了一篇关于 LLM Fine-tuning 的论文,读懂了 LoRA 的原理,觉得自己又进步了。可是如果接下来的三个月里你没有在任何场景中用到它,三个月后你对 LoRA 的理解程度大概会回到读论文之前的水平。这不是你记性差,这是大脑的工作机制——没有被使用的知识会被自动降权。

在 AI 快速发展的时代,这个问题变得更加尖锐。知识的半衰期在缩短。三年前你花两个月学的某个框架,今天可能已经进了博物馆。如果你学它的时候没有用它做成过任何东西,那这两个月就真的白费了。

我并不是说学习一定要「有用」,那太功利了。我的意思是,学习应该指向一个具体的结果。这个结果可以是很多种:

  • 你在准备下一份工作的面试,需要补齐某个技术栈
  • 你想在团队里争取晋升,需要拿一个有说服力的项目
  • 公司给你定了 OKR,你得交出成果
  • 你想跳槽到一个新的方向,需要证明你有这个能力
  • 你纯粹想创作一个东西——一篇文章、一个工具、一个 Side Project
  • 你甚至只是想彻底搞明白一件事,然后把你的理解写下来,讲给别人听

这些目的有大有小,有短期有长期,都没关系。关键是不能为了「懂」而去「懂」。

为了「懂」而「懂」,就像健身的时候只研究肌肉的解剖结构,背熟了每块肌肉的拉丁名称,却从来没走进过健身房。你确实懂了,可杠铃不认识你。

我见过很多这样的人。他们的知识储备相当丰富,聊技术的时候头头是道,可一旦让他们从头到尾交付一个完整的东西,就开始犯难。不是能力不行,是肌肉没练过。

知道怎么做和做完一件事,中间隔着一道巨大的鸿沟。这道鸿沟不是知识能填的,而是经验——是你在做的过程中踩过的坑、做过的妥协、面对过的不确定性。

七成完整,胜过十成精通

说一个我在上家公司经历过的事。

数据团队接了一个需求:给运营团队做一个用户分层看板,能看到不同层级用户的留存、活跃、消费趋势。需求本身不复杂,就是标准的 RFM 模型加一些自定义维度。

团队里有个高级工程师,技术很好,对数据质量有洁癖。他主动接了这个项目。

第一周,他花时间梳理数据源,发现三个上游表的口径不一致。他开始对齐口径。

第二周,他发现用户 ID 在不同系统里有合并的问题,一个用户可能有多个 ID。他开始做 ID Mapping。

第三周,ID Mapping 做得差不多了,他觉得 Hive 查询太慢,想切到 ClickHouse,开始调研存储层。

第四周,运营团队来问:看板什么时候能看到?

他说,快了,还有一些数据质量的问题要处理。

第五周,运营总监找到了数据负责人,说这个需求一个月前提的,到现在连个原型都没看到,是不是排期有问题。

最后这个项目转给了另一个人——一个经验不如他的初级工程师。这个初级工程师用了三天时间,直接在现有的 Hive 表上跑了一堆 SQL,数据口径没对齐(他知道,但先不管),ID Mapping 用了一个最简单的规则(取最近登录的主 ID),性能也谈不上优化(报表刷新要等两分钟)。

三天后,运营团队看到了一个粗糙但能用的看板。

他们很高兴。

接下来的两周,初级工程师根据运营的反馈迭代了三个版本。第一版加了导出功能,第二版优化了查询速度,第三版补上了那些口径不一致的问题。两周后,这个看板变成了运营团队每天都要打开的工具。

那个高级工程师做错了吗?没有。他做的每一件事都是对的——对齐口径、ID Mapping、存储优化,都是正确的事情。可是他的问题在于,他把「把事做好」当成了「把事做完」的前提,而不是把「把事做完」当成第一优先级。

这就是我想说的:七成完整,胜过十成精通。

解决了 70% 的问题,能交出一个虽然粗糙但可用的成果——这个人在组织里的价值,远大于在某个环节钻研到 100% 却始终无法交付的人。

原因很简单:

第一,完整的东西才能被验证。 你写了一个模型,只有跑起来才知道对不对。你做了一个方案,只有落地了才知道有没有坑。在脑子里反复推演,永远不如在现实中验证一次。

第二,完整的东西才能被迭代。 一个能用的粗糙版本,可以根据反馈改进。一个完美的半成品,什么反馈都拿不到,因为别人根本看不到它。

第三,完整的东西才能被记住。 你的老板、你的同事、你的客户,他们不会记住你在某个技术环节做得有多精妙。他们只记住一件事:你交了还是没交。

我有时候觉得,我们的教育系统对「深度」的崇拜有点过头了。从小到大,考试考的是你对每个知识点理解得有多深。但真实世界不考试。真实世界问的是:你能不能把这件事搞定?

被动积累是一个温柔的陷阱

来,做一个思想实验。

假设有两个人,A 和 B,同时进入一家公司做数据开发。

A 是个稳定型选手。他干活很靠谱,分配给他的任务总能按时完成。领导也喜欢他,因为他不闹事、不出错。五年过去了,他在同一个岗位上做着差不多相同的事——维护几条数据链路,写写报表,偶尔优化一下查询性能。他对这套系统非常熟悉,闭着眼都知道哪张表有问题、哪个 DAG 容易挂。

B 是个折腾型选手。她第一年干数据开发,第二年主动转去做了数据治理(因为公司正好缺人),第三年又跑去参与了一个机器学习平台的搭建项目(虽然她不会 ML,但她想学)。她在每个方向上都没有 A 那么精通,每次转方向都有一段手忙脚乱的适应期。但五年后,她能独立负责从数据采集到模型上线的全链路。

现在问你:假如公司要裁员,留谁?

假如公司要提拔一个人做数据负责人,选谁?

假如 AI 大规模替代了基础的数据开发工作,谁更危险?

答案都是同一个。

A 的问题不是能力不够,是他的能力只在一个很窄的范围内。他不是成长了五年,是在同一年里重复了五次。

这就是被动积累的陷阱。

很多人相信一个逻辑:我在这个行业做得久了,经验就多了,经验多了就值钱了。这个逻辑在过去可能成立——在一个变化缓慢的行业里,经验确实就是壁垒。你比新人多踩过几个坑,你就是比他值钱。

可是 AI 时代的规则变了。

AI 不是来替代你的知识的——你知道的那些东西,AI 早就知道了,比你知道得还多。AI 是来替代你的重复动作的。你每天做的那些常规操作,不管是写 SQL、跑报表、调参数、整理数据,AI 正在用越来越高的效率吞噬这些工作。

如果你的价值建立在「我对这套系统很熟」上面,那你要问自己一个残酷的问题:系统换了,你的价值还在吗?

我见过太多这样的情况。写了五年 Hive SQL 的人,公司突然决定迁到数据湖架构,Iceberg 加 Spark,SQL 方言变了,工具链变了,连思维方式都变了。那些年积累的「熟练度」,一夜之间打了折。

不是说积累完全没用。基本功当然重要,对业务的理解当然重要。可是如果你的积累只是在重复同样的事情,那它的价值会随着时间递减,而不是递增。

我有时候路过工位区,看到有些同事的日常是这样的:早上九点到,打开 Airflow 监控页面,看看哪些任务红了,点一下重跑,等它变绿。然后打开 SQL 编辑器,改几个筛选条件,跑几个数出来贴到 Excel 里,发给业务方。午饭永远是楼下的拌面。下午开一个需求评审会,然后继续改 SQL。六点下班。

一天过去了。第二天,同样的事情再来一遍。

这不叫稳定。这叫静止。

静止最可怕的地方在于,你感觉不到自己在原地踏步。因为每天都在忙,每天都有产出,每天都很累。你觉得自己在工作,在积累,在前进。可实际上你只是在同一个圆圈里转,速度没变,半径没变,你到达的还是同一个地方。

成长的真正来源是主动挑战

那怎么办?

我的答案很简单,虽然做起来不简单:去挑战你不会的东西。

很多人对「挑战」有误解,觉得那是一个很宏大的词——好像要去创业、去转行、去做一件惊天动地的事才叫挑战。不是的。挑战可以很小:

  • 你一直在写 ETL,试着去负责一个端到端的数据产品项目
  • 你一直在用 Python,试着用 Go 或 Rust 重写一个性能敏感的模块
  • 你从来没做过技术分享,试着在组内讲一次,哪怕只有十分钟
  • 你一直在执行别人的需求,试着自己发现一个数据问题,提出方案,推动落地
  • 你觉得你的想法不错但从来没写过文章,试着写一篇发出来,让别人看到

这些事情的共同点是:你做的时候会不舒服。

不舒服就对了。不舒服是成长的信号。

如果你每天上班很舒服,所有的事情都在你的能力范围内,不需要查资料,不需要问人,不需要面对「我可能搞不定」的焦虑——那你大概率已经在吃老本了。你不是在成长,是在消耗之前攒下来的东西。

我经常跟人说一句话:游泳不是在岸上学会的。

你可以在岸上看一百个教学视频,记住每一个技术要领:手臂怎么划,腿怎么蹬,换气的时机。可是你不跳进水里,你永远学不会游泳。而且你第一次下水一定会呛水,一定会手忙脚乱,一定会觉得自己要沉下去了。

职业发展也是一样。

你不接那个你不确定能搞定的项目,你就永远不知道自己能不能搞定。你不去挑战那个让你紧张的技术方向,你就永远停在舒适区里。你不面对「这个我可能做不好」的恐惧,你就只能做那些你已经做好过的事情——而这些事情,越来越容易被 AI 替代。

我自己的经历也是这样。回头看这十几年,每一次真正的能力跳跃,都发生在我接了一个「超出我当时能力」的活之后。

当年我从数据分析转数据工程,第一个月完全是懵的——看不懂 Spark 的报错日志,搞不清楚 YARN 的资源调度,提交的第一个作业跑了八小时才发现数据倾斜。可是三个月后,那些东西变成了我的基本功。

后来我第一次做数据架构方案,要在公司几十个人面前讲,讲之前紧张得一晚上没睡好。讲的时候被 CTO 追问了好几个我没想到的问题,当场答不上来,很尴尬。可是那次之后,我知道了做方案需要考虑哪些维度,比读十本架构书都管用。

再后来开始写公众号,第一篇文章改了七遍还觉得不好意思发。发出去以后阅读量可怜,评论区有人说写得不行。可是写下去了,写了一百篇以后,写作变成了我思考的工具、我个人品牌的入口、我做内容创业的基础。

这些事情,没有一件是我准备好了才去做的。都是先做了,再在做的过程中变得准备好了。

AI 时代的新规则是这样的:你不需要样样精通,但你需要有快速从 0 到 0.7 的能力。

注意,我说的是 0.7,不是 1.0。

从 0 到 0.7 意味着:你能快速理解一个新领域的基本框架,掌握关键的 20% 知识,然后用这些知识解决 70% 的问题。剩下的 30% 可以在实践中慢慢补。这比你在一个领域从 0.9 磨到 0.95 有价值得多。

因为从 0.9 到 0.95 的那点提升,边际效用极低,花的时间极多,而且很可能明天规则就变了,你的 0.95 变得毫无意义。可是从 0 到 0.7 的能力——快速上手、快速出活、快速验证——这个能力是通用的,不管领域怎么变,都用得上。

怎么训练这个能力?就是不断去做你没做过的事。

每一次挑战都是一次从 0 到 0.7 的练习。做的次数多了,你的「冷启动速度」会越来越快。你不再害怕陌生的领域,因为你已经有了一套方法论——你知道面对一个新东西,先看什么,先问什么,先做什么。

这就是为什么我说,人的发展是在不断挑战自己的过程中实现的,不是被动等出来的。

不是你在一个岗位上坐了十年就自动变得更强。不是你每天重复同样的动作就自然获得了经验。成长这件事没有自动挡——你得自己踩油门,还得时不时换一条没走过的路。

把事做完,是一种稀缺能力

说到底,我想表达的就是一句话:

这个时代,不缺聪明人,不缺学东西快的人,不缺知识储量丰富的人。缺的是能把事做完的人。

「把事做完」四个字,看起来简单,背后包含的东西很多。它意味着你能定义问题,能拆解步骤,能在资源有限的情况下做出取舍,能在面对不确定性的时候依然往前走,能在做了 70% 的时候敢说「这个版本先上线」,能在出了问题以后快速修复而不是停下来自我怀疑。

这些能力,不是靠读书读来的。是靠一次又一次「把事做完」练出来的。

如果你问我对年轻人(或者不年轻但还想进步的人)有什么建议,就三条:

一、给你的每一次学习设定一个「交付物」。 学了 Flink,就搭一条链路跑起来。学了 LLM,就做一个小应用部署上线。学了数据治理,就给你们组写一份数据质量报告。别让知识停留在脑子里,让它变成一个别人看得见的东西。

二、接受「粗糙但完整」的自己。 不是每件事都要做到完美。先做完,再做好。先交付,再迭代。先跑起来,再优化。完美主义是生产力的天敌,尤其是在这个变化速度远超你优化速度的时代。

三、主动去找让你不舒服的事情做。 如果你的工作已经完全在舒适区内,主动找一个新项目、新方向、新技能。不舒服说明你在长肌肉。一直舒服说明你在萎缩。

不需要想那么远。不需要规划五年十年的职业路径。你只需要做好眼前这一件事——从头到尾,做完它,交出来。

然后做下一件。

能一直这样做下去的人,运气不会太差。


我叫石头,在数据行业里摸爬滚打了十几年,学到的东西,大半是在做错之后才想明白的。这里写的,就是这些教训——我觉得值得说出来的那部分。

Elazer (石头)
Elazer (石头)

11 年数据老兵,从分析师到架构专家。用真实经历帮数据人少走弯路。

加入免费社群

和数据从业者一起交流成长

了解详情 →

成为会员

解锁全部内容 + 知识库

查看权益 →
← 上一篇 Typeless:让职场人告别打字的 AI 语音键盘 下一篇 → 数据周刊|2026年4月第1周:Coding Agent 混战、Flink 造 AI Agent、数据岗「被迫升级」