跳到正文

更多文章

AI 合规开始变严,普通数据人要知道哪几件事? 企业 AI 数据合规入门:数据人必须懂的四条边界 别把数据治理做成填表:从一次指标口径争议开始 业务反复改口径,不一定是业务不专业 数据人不要只盯互联网:制造、医保、政务正在释放新机会
为什么很多数据项目看起来很热闹,最后都变成填表?

很多数据项目,是从一张漂亮的启动会 PPT 开始变味的。

会议室里投着大屏,标题写得很端正:数据资产盘点、指标体系建设、数据治理专项提升。领导讲目标,咨询顾问讲方法,项目经理讲排期。每个人都觉得这事终于要正经做了。

然后两周过去,项目群里最常见的话变成了:

“这个字段负责人是谁?”

“这张资产卡今天能补完吗?”

“指标口径那一列不要空着。”

再过一个月,大家已经不太记得当初为什么要做这个项目,只记得每周五下午会有人来催表。

不是数据库里的表。

是 Excel 表。

这就是很多数据项目最尴尬的地方:开始时讲的是数据能力,推进时变成资料收集,验收时变成完成率截图,结束后留下一批没人再打开的模板。

数据项目启动会和填表压力

我不是反对填表。数据治理离不开表格,资产目录、指标字典、质量规则、责任矩阵,本来就需要结构化记录。

问题在于,很多项目最后不是“用表格支撑工作”,而是“用填表替代工作”。

这两件事差得很远。

最危险的不是填表,而是把填表误认为治理

填表有一个很强的迷惑性:它看起来像进度。

你可以统计完成率,可以画甘特图,可以做周报,可以把“已填 82%”放进领导汇报。项目群里也很热闹,每天都有提醒、确认、修改和汇总。

可是热闹不等于有效。

一个字段说明补齐了,不代表这个字段以后能被正确使用。一个责任人写上去了,不代表数据出错时真的有人处理。一个指标口径填进模板,不代表业务开会时不会继续各说各话。

公司里最常见的误会,是把“资料完整”当成“问题解决”。

资料当然重要,但资料只是中间物。真正有价值的是资料后面的动作:谁使用它,在哪个流程里使用,出了问题谁处理,下一次能不能少返工。

如果这些动作没有发生,填得再整齐,也只是一次行政劳动。

做数据的人对此并不陌生。很多人都参加过类似项目:前期很正式,中期很忙,后期很沉默。项目验收材料一交,群消息马上变少。等下次指标吵起来、报表对不上、口径又变了,大家还是回到聊天记录里翻旧结论。

这说明项目没有进入公司的日常工作,只是在日常工作旁边开了一个临时摊位。

摊位撤了,问题还在。

项目为什么会慢慢滑向填表运动

很少有人一开始就想做一场填表运动。

大多数项目滑到这一步,是因为填表最容易被管理。

真正的数据问题都比较麻烦。比如指标口径争议,背后可能有销售、运营、财务三方的利益和习惯;比如资产复用,背后要改需求入口、权限审批、数据集命名和维护责任;比如质量治理,背后要改上游录入、任务调度、异常处理和业务确认。

这些事都不容易在周报里写得好看。

相比之下,填表很确定。

模板发下去,责任分下去,日期定下去,项目经理每天追进度。就算问题没有解决,至少看起来在推进。

数据项目如何滑向填表运动

它通常有四个滑坡动作。

第一步,目标太大。

“全公司数据资产盘点”“统一指标体系”“提升数据治理能力”,这些话没有错,但一旦没有绑定具体场景,就会变成谁都支持、谁都不真正负责的大目标。

第二步,范围太宽。

一开始就盘全量系统、全量表、全量指标、全量责任人。范围越大,越难讨论真实使用,只能先收资料。

第三步,动作太轻。

项目推进没有改变会议、看板、需求评审、权限审批、质量告警这些真实流程,只是在流程外面加一层登记。

第四步,验收太虚。

验收看完成率、模板数量、文档页数、培训场次,却很少看一个月后业务是否少吵了一个口径,数据开发是否少修了一类重复问题,分析师是否少解释了一批同样的字段。

这么一来,项目当然会变成填表。

不是因为表格邪恶,而是因为表格成了唯一能被看见的交付物。

先问一个问题:它服务哪个决策场景

判断一个数据项目会不会变味,最简单的方法,是先问一句:

这件事最终服务哪个真实决策场景?

不要急着说“服务公司数字化”。这句话太大,大到没人能反对,也没人知道明天该怎么做。

要说得具体一点。

比如,销售周会每周都要复盘转化率,但销售、运营、财务用的是三套口径,所以要先治理“转化率”这个指标。

比如,老板希望 AI 问数能回答经营问题,但模型背后的数据集来源不清、权限不清、口径不清,所以要先治理最常被问的五个经营指标。

比如,数据开发每个月都被同一类手工表拖住,业务也不知道哪些字段可靠,所以要先把这条数据供给链路做成可复用数据集。

场景不需要一开始很大。

小一点反而更好。

一个真实场景,会自然逼出项目该做什么:哪些字段必须解释,哪些指标必须确认,哪些责任必须进流程,哪些质量问题必须监控,哪些文档其实不用写。

没有场景,所有字段都显得重要。

有了场景,很多表格会自动瘦下来。

从决策场景反推数据项目

这里有一个很实用的判断标准:如果一个项目说不清“哪场会会因为它变得更清楚”,它就很危险。

销售复盘会、经营分析会、预算评审会、活动复盘会、风控例会、产品迭代会,都可以。

数据项目最终要进入某个决策场景。否则它就只能停在项目材料里。

表格应该服务动作,而不是替代动作

我见过一张很认真的资产目录表。

字段很多:系统名称、表名、字段名、中文名、业务含义、更新频率、负责人、权限等级、质量规则、下游应用。每一列看起来都合理,甚至有点令人感动。

问题是,填完以后没人知道下一步做什么。

业务找数据,还是在群里问。数据开发改字段,还是靠熟人通知。指标出错,还是先追 SQL。权限申请,还是靠截图说明。

这张表没有错。

错在它没有接上动作。

一张资产目录,应该接上“如何被发现、如何申请、如何复用”。

一张指标字典,应该接上“如何确认、如何变更、如何在看板里展示”。

一张质量规则表,应该接上“如何监控、如何告警、如何修复、如何通知影响方”。

一张责任矩阵,应该接上“出了问题先找谁、多久响应、谁有权拍板”。

否则它就是一份好看的说明书,放在一个不太会被打开的地方。

数据团队推进项目时,可以给每一张表后面补一个问题:

“这张表会改变哪个动作?”

答不上来,就先别推广到全公司。

这句话听起来有点扫兴,但能救很多项目。

因为很多范围,本来就不该第一阶段做。很多字段,本来就没人用。很多责任,本来就不该只写在模板里。

把全量盘点,改成一个能跑通的样板

如果公司已经启动了一个很大的数据项目,数据团队也不一定能说停就停。

这时候更现实的做法,是把它切成一个样板。

不要一上来盘全公司。

先选一个高频、有争议、有业务负责人、能在 30 天内看到变化的场景。

比如“经营周会里的收入指标对齐”。

第一周,不要发大模板。先把最近三次争议找出来:哪几个数字对不上,谁在用,影响了什么判断。

第二周,把指标链路画清楚:源系统在哪里,数仓怎么加工,看板怎么展示,哪些手工步骤可能改变结果。

第三周,确认一个默认口径和两个例外口径:默认用于经营周会,例外用于财务对账和活动复盘。不要假装一个指标能满足所有人。

第四周,把口径放回看板和会议里:看板上能看到定义,变更有记录,会议里争议减少,相关人知道以后怎么改。

这才叫样板。

样板不是做一份更精美的 PPT,而是让一小段真实流程开始变好。

它跑通以后,再扩大范围才有意义。否则全量推广只是把一个没验证过的动作放大,最后大家一起痛苦。

数据团队应该留下哪些证据

还有一个容易被忽略的问题:很多数据项目最后无法证明自己有用。

项目材料很多,但证据很少。

这里的证据,不是“我们填了多少张表”,而是“这件事让工作发生了什么变化”。

至少可以留下五类证据。

第一,问题证据。

项目开始前,到底哪里痛?是会议反复对数,是报表没人敢用,是 AI 问数回答不稳,还是数据开发不断返工。最好有具体案例,而不是抽象描述。

第二,使用证据。

治理结果被谁使用了,在哪个会议、看板、需求流程、权限流程或告警流程里使用。只写“已沉淀文档”不够,要写“文档进入了哪里”。

第三,变化证据。

争议是否减少,重复需求是否减少,异常处理是否更快,口径变更是否更清楚,数据集是否被复用。数字不一定要很夸张,但要诚实。

第四,责任证据。

谁确认口径,谁维护链路,谁处理异常,谁审批权限。责任如果只在项目表里,不算真正落地。要能在日常流程里找到它。

第五,复用证据。

这个样板能不能迁移到下一个指标、下一个数据集、下一个业务场景。不能复用也没关系,但要知道为什么不能。

这些证据留下来,数据项目才不只是一次阶段性活动。

它会变成组织里可以继续使用的东西。

真正的治理,通常很朴素

很多公司喜欢把数据项目讲得很大。

建设数据资产,释放数据价值,打造统一治理能力。话都没错,但说多了容易发飘。

真正有用的数据治理,往往很朴素。

它可能只是让经营会上的一个指标终于不再吵。

它可能只是让一个常用数据集有了稳定负责人。

它可能只是让字段变更前,有人知道会影响哪几张报表。

它可能只是让数据开发不用每个月重复解释同一个口径。

这些事听起来不宏大,但公司就是靠这些具体动作变好的。

数据项目最怕的不是小。

最怕的是大而无用。

所以,下次再遇到“全公司数据治理专项”“数据资产盘点”“指标体系建设”这类需求,数据团队可以先别急着反对,也别马上接模板。

先问三句话:

第一,哪一个真实场景会因为这个项目变清楚?

第二,哪一张表会进入哪个日常流程?

第三,30 天后,我们能少掉哪一种返工或争议?

这三句话问清楚,很多项目就不会只剩填表。

它会从热闹回到使用,从材料回到动作,从口号回到公司真实的工作台面上。

热闹不是价值。

被使用,才是价值。

数据从业者全栈知识库

如果你想系统补齐数据治理、AI 应用、指标体系和职业成长这些能力,可以继续看数据从业者全栈知识库。这些主题我会继续拆成公司里能真正用上的方法。


我叫石头,在数据行业里摸爬滚打了十几年,见过不少项目从口号开始,最后停在模板里。这里写的,不是反对治理,而是希望治理能少一点热闹,多一点真的被使用。

Elazer (石头)
Elazer (石头)

11 年数据老兵,从分析师到架构专家。用真实经历帮数据人少走弯路。

加入免费社群

和数据从业者一起交流成长

了解详情 →

成为会员

解锁全部内容 + 知识库

查看权益 →

1v1 咨询

有具体职业困惑?一小时说清楚

预约咨询 →
← 上一篇 业务想上 AI 问数,数据开发应该先画哪三张图? 下一篇 → 数据要素项目接不接?一套给数据人的内部判断清单