跳到正文

更多文章

影响力日常操作系统:21天习惯养成计划 从技能雇佣者到价值创造者 互惠账户的运营 影响力的三层架构 组织的注意力经济学
AI时代数据人的职业地图

这篇文章写给正在写SQL、拼报表、调ETL的你。不是写给想入行AI的新人,也不是写给已经在搞大模型的算法工程师。

你可能是一个干了三五年的数据分析师,每天主要工作是从数仓里取数、出报表、做周报月报。你可能是一个数据工程师,维护着几十条Airflow的DAG,偶尔建新表、写新的数据清洗逻辑。

然后你看到了Text-to-SQL工具越来越好用,看到了产品经理开始用ChatGPT自己分析数据,看到了Cursor可以一次性生成你写半天的ETL代码。

你慌不慌?

说实话,应该慌一点。但不是”天要塌了”那种慌,而是”该认真想想下一步了”那种。


第一部分:现实诊断——到底哪些工作在被侵蚀

先说结论:大多数数据岗位不是”被替代”,而是”被加速”。但这个区别很重要,因为”被加速”意味着——同样的活,需要的人更少了。

数据分析师:最先感受到压力的群体

工作内容AI冲击程度说明
固定格式报表AI BI工具已经能自动生成
临时取数需求Text-to-SQL准确率在标准数仓场景已超过85%
描述性分析(环比、同比、占比)这类分析本质是模式化计算,AI完全胜任
归因分析AI能给出候选原因,但判断哪个是真正原因需要业务理解
专题分析/深度洞察需要理解业务背景、提出假设、设计验证方案
数据驱动的决策建议需要理解组织政治、资源约束、执行可行性

最危险的状态:如果你日常工作80%以上是”取数+出表”,而且取的数和出的表都有固定模板,那你的工作确实在高替代风险区。不是说明天就没了,而是说你的岗位人数在未来2-3年会压缩。

数据工程师:被加速多于被替代

正在被加速的部分

  • 写标准ETL逻辑:Cursor/Copilot已经能根据注释生成80%的Spark SQL或dbt模型
  • 写数据清洗规则:AI能快速生成正则表达式、数据校验逻辑
  • 写建表语句和DDL:几乎可以完全自动化
  • Debug常见报错:AI排查能力已经很强

暂时安全的部分

  • 数据架构选型和设计(Lakehouse还是传统数仓?增量还是全量?)
  • 跨系统数据一致性保障
  • 数据管道的容灾和高可用设计
  • 性能调优(理解底层存储引擎、理解数据倾斜的本质)
  • 与业务方沟通数据口径、推动数据标准化

AI工具让单个数据工程师的产出提升了2-3倍。这意味着原来需要5个人的团队,可能3个人就够了。问题不是”数据工程师会不会消失”,而是”你是那3个人还是多出来的2个人”。

BI工程师:转型最紧迫的岗位

直说了:纯粹做仪表板搭建的BI工程师,是这一轮冲击中压力最大的角色。

自然语言BI工具(如ThoughtSpot、Power BI Copilot、Tableau AI)正在让业务用户直接用自然语言提问,自动生成可视化图表。BI工程师的核心技能——“把数据拖拽成好看的图表”——正在被工具化。

但如果你做的是指标体系设计、数据语义层建设、数据产品化,那情况完全不同。


第二部分:什么不会被替代——你的真正护城河

MAX 会员专属

本文为 MAX 会员专属内容,升级到 MAX 即可阅读全文。

MAX ¥498/年 · 全部专属文章 + 2300+ 知识文档 + 1v1 咨询

Elazer (石头)
Elazer (石头)

11 年数据老兵,从分析师到架构专家。用真实经历帮数据人少走弯路。

加入免费社群

和数据从业者一起交流成长

了解详情 →

成为会员

解锁全部内容 + 知识库

查看权益 →
← 上一篇 两千万字背后的事 下一篇 → 数据从业者岗位导向求职指南