# ai

共 43 篇文章

每次问 AI 都要从头解释，是你的工作还没有留下“说明书”

很多数据分析师和数据开发已经开始用 AI 写 SQL、查资料、整理分析，但每次提问都要重新解释业务背景、指标口径和项目约束。问题不一定是 AI 记性差，而是你的工作没有沉淀成说明书。本文从普通数据从业者视角，讲怎么把反复解释的内容变成可复用的项目说明、指标说明和判断记录。

Elazer (石头) 2026年7月13日

AI · 观点

AI 模型再聪明，也救不了一条喂不动的数据链路

很多数据分析师和数据开发以为 AI 项目卡住，是模型不够聪明、Prompt 不够好。Meta 的 AI Storage Blueprint 提醒了另一件事：模型能不能发挥作用，取决于数据能不能稳定、及时、可追溯地喂进去。本文从普通数据从业者视角，拆解为什么数据链路比模型演示更早决定 AI 项目的上限。

Elazer (石头) 2026年7月12日

数据工程 · 方法

Spark 任务跑了 3 小时，别急着问 AI 怎么调参

Spark 任务跑了 3 小时，很多数据开发第一反应是问 AI 要不要改 executor、shuffle、分区数。但慢任务不是靠一句调参解决的。本文结合 Expedia 分析 Spark SQL Plan 的实践，说明普通数据开发为什么要先拿出执行计划、运行指标和业务上下文这 3 份证据。

Elazer (石头) 2026年7月9日

职业成长 · 观点

普通数据人想涨薪，先别急着学新工具

很多数据从业者一焦虑就去学新工具：Python、Flink、ClickHouse、AI Agent、各种 BI 平台。但涨薪真正买单的，往往不是工具数量，而是你能不能减少业务不确定性、讲清项目价值、承担更复杂问题。本文从一个课程收藏夹讲起，拆解普通数据人涨薪前更该补的 4 种能力。

Elazer (石头) 2026年6月26日

AI · 观点

AI 真会替代数据岗位吗？先看岗位边界怎么变

AI 进入数据团队后，写 SQL、生成报表、整理分析初稿这类低上下文动作会先变便宜；真正变贵的是指标口径判断、权限边界、证据审计和业务结果责任。本文从数据分析师、数据开发的真实日常拆起，说明 AI 不是简单替代岗位，而是在重画岗位边界，也提醒你下一步该把能力放在哪里。

Elazer (石头) 2026年6月2日

高质量数据集 · 观点

高质量数据集为什么突然被反复提起？

高质量数据集正在从 AI 训练语料变成企业数据工作的核心议题。对数据开发、数据治理和数据分析师来说，它不是“多整理几个文件夹”，而是决定 AI 应用能否落地的业务资产工程：场景、口径、授权、版本和质量责任缺一不可。遇到类似需求时，应该先问什么、留什么证据？

Elazer (石头) 2026年6月1日

数据要素 · 观点

数据要素价值释放年，普通数据人到底该关心什么？

2026 年“数据要素价值释放年”和“数据要素×”大赛被反复提起，普通数据开发、数据分析师到底该关心政策、项目，还是岗位机会？这篇文章从公司内部需求单、数据供给、AI 训练数据和项目证据出发，讲清楚热词落到工位上会变成什么。遇到类似需求时，应该先问什么、留什么证据？

Elazer (石头) 2026年5月29日

AI · 观点

AI 进了数据团队，最先被放大的不是效率，而是协作问题

企业开始把 AI Agent、Copilot 和自动化分析工具放进数据团队，但效率并不会自动出现。真正先被放大的，是需求表达、口径治理、代码审查、权限边界和跨角色协作中的旧问题。

Elazer (石头) 2026年5月21日

AI · 观点

DeepSeek V4 把价格打到 1/7：数据人的工作流要不要切

DeepSeek V4 上周末发布，1.6T 参数、1M 上下文、编码 benchmark 拉平 GPT-5.4 和 Claude Opus 4.6，但价格只要 $3.48 / 百万 token——是 Claude 的 1/7。问题来了：你的日常工作流要不要切？切的隐性成本有哪些？什么时候该切、什么时候别动？

Elazer (石头) 2026年4月26日

职业成长 · 观点

数据开发的八股文，现在还值得背吗

一个朋友在群里问：知识库里有没有初级数据开发的八股文？我的回答是——有，但你不该在这上面押注。面试里八股文的占比已经从三分之二降到塞牙缝，工作里 80% 写 SQL 的时代也过去了。真正的问题不是背不背八股文，而是你还在用执行者的思路寻找出路。这篇讲讲 AI 这波变革为什么躲不过去。

Elazer (石头) 2026年4月23日

数据工程 · 观点

Agentic Data Engineering 方法论

数据工程师会被 Agent 取代吗？答案是：不会，但「写管道的数据工程师」会。这篇文章把 2026 年数据工程的价值重心从执行指令迁移到设计意图、护栏和数据产品契约的完整方法论讲清楚——包含 MCP、Data Product、Intent 三层架构，以及工程师该补的三类能力。

Elazer (石头) 2026年4月20日

数据工程 · 方法

Iceberg V3 深度解析：为 AI workload 重新设计的表格式

2026 年 4 月 6 日 Dremio 宣布 Iceberg V3 在云服务正式可用，意味着 V3 从规范走向生产。这篇深度解析拆开 V3 的四大变化：行级血缘、Row Lineage、Deletion Vectors、Variant 类型，以及它们为什么是为 AI workload 重新设计——数据工程师和数据架构师读完能拿到一张清晰的升级路径图。

Elazer (石头) 2026年4月20日

职业成长 · 观点

Agentic Analytics：分析师角色的终局推演

2026 年 Snowflake Cortex Analyst 和 Databricks AI/BI Genie 宣称 Text-to-SQL 准确率达到 90%，数据分析师真的要失业了吗？这篇文章把问题问对：哪种数据分析师要失业、哪种会因此受益。给出三类角色的终局推演和一条清晰的转型路径——写给还在写 SQL 导表的分析师。

Elazer (石头) 2026年4月20日

AI · 观点

什么时候才该 Fine-tune：2026 决策框架

AI 工程师和数据负责人最容易踩的坑之一：问题一出现就想着 Fine-tune。但 Fine-tune 不是默认选项，是最后选项。这篇文章给出一套 2026 年的决策框架：先穷尽 RAG、Prompt、工具调用，再考虑 SFT / LoRA / DPO，并配上成本、数据量、迭代速度三个维度的判断阈值——帮你把钱和时间花在对的地方。

Elazer (石头) 2026年4月20日

职业成长 · 观点

2026 数据人必学 TOP 10

2026 年数据工程师、数据分析师、数据架构师到底该补哪些课？从 Databricks、Snowflake、Atlan、Cloudera 2025 年底到 2026 年 4 月的一系列动作里筛出最硬的十项：Agentic DE、Iceberg V3、MCP、Unity/Polaris、Agent 可观测性、Fine-tune 决策框架——每项都附上为什么要学和通往知识库的入口。

Elazer (石头) 2026年4月20日