跳到正文
全部标签

# 数据治理

共 28 篇文章

  • 数据质量不要只靠告警:真正有效的是把责任放进流程里 PRO

    数据质量不要只靠告警:真正有效的是把责任放进流程里

    数据质量问题反复出现,很多团队第一反应是加监控和告警,但告警本身不能解决责任缺位。本文从空值、重复、延迟、口径变化和下游影响出发,拆解数据质量治理如何进入开发、发布和复盘流程。
  • 别让 AI 直接查库:企业问数 Agent 上线前必须补的 5 个底座 PRO

    别让 AI 直接查库:企业问数 Agent 上线前必须补的 5 个底座

    很多团队想把自然语言问数和 AI Agent 接进数据库,但真正的难点不是让模型写 SQL,而是指标口径、权限控制、语义层、审计追踪和人工确认。本文给出企业问数 Agent 上线前必须补齐的 5 个底座。
  • 数据周刊|2026年5月第3周:Airbnb 网关、Netflix 身份、Meta 迁移

    数据周刊|2026年5月第3周:Airbnb 网关、Netflix 身份、Meta 迁移

    本期数据周刊关注 Data Engineering Weekly #270:Airbnb Viaduct 1.0、Netflix Data Projects、Meta PB 级数据摄取迁移和 Databricks Catalog Commits。AI 进入数据团队后,数据平台如何从工具堆叠走向边界清楚?
  • AI 进了数据团队,最先被放大的不是效率,而是协作问题

    AI 进了数据团队,最先被放大的不是效率,而是协作问题

    企业开始把 AI Agent、Copilot 和自动化分析工具放进数据团队,但效率并不会自动出现。真正先被放大的,是需求表达、口径治理、代码审查、权限边界和跨角色协作中的旧问题。
  • 一张宽表为什么会越用越乱:数据建模要先守住三个边界 PRO

    一张宽表为什么会越用越乱:数据建模要先守住三个边界

    很多数据团队的宽表一开始只是为了提效,后来却变成无人敢改的巨表。本文从主题边界、粒度边界和口径边界三个角度,解释数据建模为什么会失控,以及数据开发如何让宽表重新可维护。
  • 企业 Agent 进生产,数据人的机会不在写 Demo

    企业 Agent 进生产,数据人的机会不在写 Demo

    IBM Think 2026、Google Agentic Data Cloud、Citi Arc 都在把 Agent 推进企业生产环境。数据工程师和数据分析师真正该关心什么?不是再做一个会查数的 Demo,而是数据上下文、实时数据、权限治理和可观测性这四层基础设施。
  • Unity Catalog vs Open Catalog:2026 元数据治理的路线之争

    Unity Catalog vs Open Catalog:2026 元数据治理的路线之争

    Databricks 主导的 Unity Catalog 和 Snowflake 发起、Apache 托管的 Polaris,2026 年正式在企业数据目录市场正面交锋。这篇文章横评两条路线的权限模型、表格式支持、跨引擎能力和治理边界,给数据架构师和平台负责人一份可以带进选型会议的判断框架。
  • MCP Gateway 与生产部署:把 Agent 从 Demo 送进生产的那一道关

    MCP Gateway 与生产部署:把 Agent 从 Demo 送进生产的那一道关

    企业把 MCP Server 从 Demo 送进生产,卡在哪儿?认证、限流、审计、多租户、可观测性——单个 MCP Server 解决不了,需要一层 Gateway。这篇讲清 MCP Gateway 的职责边界、五种部署拓扑、主流方案选型(Kong / Envoy / 自研)和落地 checklist,给数据架构师和平台工程师一份生产部署指南。
  • A/B测试数据治理 - 科学验证AI优化效果 PRO

    A/B测试数据治理 - 科学验证AI优化效果

    在AI系统的数据飞轮和反馈闭环中,A/B测试是验证模型优化效果、指导迭代方向的核心工具。。A/B测试的核心价值:。与传统A/B测试的区别:。AI模型A/B测试的特殊挑战:。- 模型推荐影响用户行为。- 用户行为数据又用于训练模型。- 形成自我强化或退化的循环。- 用户之间存在相互影响。- 违反了A/B测试的SUT...
  • OneID统一身份 - 企业级统一身份标识体系设计与实现 PRO

    OneID统一身份 - 企业级统一身份标识体系设计与实现

    OneID统一身份体系是构建企业数字化用户身份管理的核心身份证系统,通过全局统一的身份标识技术和完善的身份管理架构,为企业打造跨平台、跨系统的用户身份统一管理基础设施。。OneID统一身份的数字化身份价值:。识别效率极高:智能身份匹配让用户识别速度提升300%,提升用户体验。管理成本优化:集中身份管理让...
  • OneData方法论 - 阿里巴巴数据中台统一数据架构方法论

    OneData方法论 - 阿里巴巴数据中台统一数据架构方法论

    OneData方法论是构建企业数据统一标准体系的权威制定书,作为阿里巴巴数据中台实践的核心方法论,为企业提供从数据标准化到数据服务化的完整解决方案和最佳实践指导。。OneData方法论的标准化价值:。📏 标准统一权威:One理念让数据标准统一度达到95%以上,消除数据定义歧义。方法论成熟:阿里实践验证的方...
  • 中国数据产业月报2026年3月封面

    中国数据产业月报 | 2026 年 3 月:日均词元调用量破 140 万亿,两会明确数字经济目标

    2026 年 3 月中国数据产业动态:日均词元调用量破 140 万亿,两年增长逾千倍;两会政府工作报告明确数字经济占 GDP 达 10.5%,十五五目标 12.5%;国家数据局推进数据流通服务机构培育,探索「数据换数据」新模式。来自国家数据局官网、人民日报原文整理。
  • 80% 的库不是人建的了

    80% 的库不是人建的了:数据工程师的角色正在悄悄变形

    Databricks 披露:80% 的数据库现已由 AI Agent 自动创建,两年前这个数字几乎为零。数据工程师最熟悉的建库、写 DDL、配环境正在被 Agent 接管。但速度背后有个危险——没有人在看这些库是怎么建的。架构判断力、治理能力、业务理解力,才是 Agent 还无法替代的。数据工程师的角色正在从建造者变成审计者。
  • AI 工具铺得满地都是,为什么你公司的数据还是一锅粥?

    AI 工具铺得满地都是,为什么你公司的数据还是一锅粥?

    Deloitte《AI现状2026》调研3235位全球高管发现:企业AI工具覆盖率同比增长50%,但数据基础设施就绪度仅43%、数据管理就绪度仅40%,比去年还在下降。工具越铺越多,数据底座却越来越乱——本文解读这份报告的核心发现,分析为什么大多数企业的AI落地注定失败。
  • 数据治理工程师 L2:治理实践

    数据治理工程师 L2:治理实践

    数据治理工程师实战进阶路线:系统掌握数据质量评估与监控、元数据管理平台搭建、数据标准化规范制定3大核心实践能力。从理论框架到落地执行,解决「治理制度写了一堆但没人执行」的典型难题,帮助1-3年数据治理从业者建立可复用的治理实践体系。
  • 数据地基(三):最稀缺的能力,不在简历上

    数据地基(三):最稀缺的能力,不在简历上

    数据地基系列第三篇:当两张报表数字对不上,谁能在30分钟内定位到是哪条ETL链路的哪个口径出了问题?数据血缘追踪能力——这项不写在简历上的稀缺技能,正是区分普通数据工程师和资深架构师的关键分水岭。本文通过真实排查场景,拆解这项能力的本质。
  • 你公司的数据系统,已经没有人能完全看懂了 PRO

    你公司的数据系统,已经没有人能完全看懂了

    数据地基系列第二篇:你公司的数据系统跑了七八年,中间换过三拨人,现在连一条「昨天的订单转化率」从埋点到报表经过了几道手都说不清。这不是个例,而是中大型公司的常态。本文剖析数据系统「熵增」的根本原因,以及为什么没有人能完整画出数据流全貌。
  • 【谨慎面对】探索数据Agent的可行性

    【谨慎面对】探索数据Agent的可行性

    MCP引爆Data Agent热潮,但大数据+AI真的是万能钥匙吗?从数据开发效率到口径统一,从数据治理到AI应用落地,深度剖析大数据行业痛点与AI解决方案,揭示技术革新背后的机遇与挑战,帮助企业理性看待AI浪潮。
  • 数据治理工程师 L3:治理体系

    数据治理工程师 L3:治理体系

    资深数据治理专家进阶路线:建立企业级数据治理体系,推动数据资产管理、数据安全合规和数据血缘追踪3大核心能力落地。面向3-5年数据治理从业者,提供从单点治理到全局体系化的能力跃迁路径,附治理成熟度评估模型和真实企业案例。
  • 开篇:大数据从业者们如何应对AI带来的变化

    开篇:大数据从业者们如何应对AI带来的变化

    DeepSeek引爆全民AI时代,大数据从业者如何应对?从企业级AI需求到数据底座建设,从数据治理到数据需求管理,深度解析AI浪潮下大数据行业的机遇与挑战,揭示数据治理和需求管理等难以被AI替代的关键岗位价值。
  • 如何量化数据价值?从财务视角看数据资产

    如何量化数据价值?从财务视角看数据资产

    数据作为企业资产,其价值如何评估?本文从财务角度深入探讨数据价值的量化方法,分析数据的成本构成(采集、存储、维护)和收益来源(业务增长、降本提效),以及如何建立数据价值与业务财务之间的联系,为企业数据管理提供决策依据。