这篇文章写给正在写SQL、拼报表、调ETL的你。不是写给想入行AI的新人,也不是写给已经在搞大模型的算法工程师。
你可能是一个干了三五年的数据分析师,每天主要工作是从数仓里取数、出报表、做周报月报。你可能是一个数据工程师,维护着几十条Airflow的DAG,偶尔建新表、写新的数据清洗逻辑。
然后你看到了Text-to-SQL工具越来越好用,看到了产品经理开始用ChatGPT自己分析数据,看到了Cursor可以一次性生成你写半天的ETL代码。
你慌不慌?
说实话,应该慌一点。但不是”天要塌了”那种慌,而是”该认真想想下一步了”那种。
第一部分:现实诊断——到底哪些工作在被侵蚀
先说结论:大多数数据岗位不是”被替代”,而是”被加速”。但这个区别很重要,因为”被加速”意味着——同样的活,需要的人更少了。
数据分析师:最先感受到压力的群体
| 工作内容 | AI冲击程度 | 说明 |
|---|---|---|
| 固定格式报表 | 高 | AI BI工具已经能自动生成 |
| 临时取数需求 | 高 | Text-to-SQL准确率在标准数仓场景已超过85% |
| 描述性分析(环比、同比、占比) | 高 | 这类分析本质是模式化计算,AI完全胜任 |
| 归因分析 | 中 | AI能给出候选原因,但判断哪个是真正原因需要业务理解 |
| 专题分析/深度洞察 | 低 | 需要理解业务背景、提出假设、设计验证方案 |
| 数据驱动的决策建议 | 低 | 需要理解组织政治、资源约束、执行可行性 |
最危险的状态:如果你日常工作80%以上是”取数+出表”,而且取的数和出的表都有固定模板,那你的工作确实在高替代风险区。不是说明天就没了,而是说你的岗位人数在未来2-3年会压缩。
数据工程师:被加速多于被替代
正在被加速的部分:
- 写标准ETL逻辑:Cursor/Copilot已经能根据注释生成80%的Spark SQL或dbt模型
- 写数据清洗规则:AI能快速生成正则表达式、数据校验逻辑
- 写建表语句和DDL:几乎可以完全自动化
- Debug常见报错:AI排查能力已经很强
暂时安全的部分:
- 数据架构选型和设计(Lakehouse还是传统数仓?增量还是全量?)
- 跨系统数据一致性保障
- 数据管道的容灾和高可用设计
- 性能调优(理解底层存储引擎、理解数据倾斜的本质)
- 与业务方沟通数据口径、推动数据标准化
AI工具让单个数据工程师的产出提升了2-3倍。这意味着原来需要5个人的团队,可能3个人就够了。问题不是”数据工程师会不会消失”,而是”你是那3个人还是多出来的2个人”。
BI工程师:转型最紧迫的岗位
直说了:纯粹做仪表板搭建的BI工程师,是这一轮冲击中压力最大的角色。
自然语言BI工具(如ThoughtSpot、Power BI Copilot、Tableau AI)正在让业务用户直接用自然语言提问,自动生成可视化图表。BI工程师的核心技能——“把数据拖拽成好看的图表”——正在被工具化。
但如果你做的是指标体系设计、数据语义层建设、数据产品化,那情况完全不同。