跳到正文
全部标签

# ai

共 28 篇文章

  • 分析师如何建立不可替代性 MAX

    分析师如何建立不可替代性

    新来的分析师工资是你一半,两个月就能独立完成大部分日常需求。你的5年经验值什么?本文提出不可替代性的三个层次:执行稀缺性、知识稀缺性、关系稀缺性。大部分分析师只在第一层竞争,而真正的护城河在第二层和第三层。
  • AI 时代,数据从业者的位置在哪

    AI 时代,数据从业者的位置在哪

    GPT能写SQL、能做分析、能出报告。你每天80%的工作AI都能做。但这不是末日,是分水岭。本文分析AI对数据分析师和数据工程师的真实影响,划出「会被替代」和「不会被替代」的分界线,帮你找到AI时代的新定位。
  • 技术更新太快,该学什么 MAX

    技术更新太快,该学什么

    Spark还没学完Flink又火了,Flink还没熟AI又来了。你学得越多越焦虑,因为新技术出现的速度远快于你学习的速度。本文提供一个判断框架:区分「必须学」和「可以不学」,把有限精力投入到半衰期最长的知识上。
  • AI 工具铺得满地都是,为什么你公司的数据还是一锅粥?

    AI 工具铺得满地都是,为什么你公司的数据还是一锅粥?

    Deloitte《AI现状2026》调研3235位全球高管发现:企业AI工具覆盖率同比增长50%,但数据基础设施就绪度仅43%、数据管理就绪度仅40%,比去年还在下降。工具越铺越多,数据底座却越来越乱——本文解读这份报告的核心发现,分析为什么大多数企业的AI落地注定失败。
  • 特征工程平台(Feature Store) PRO

    特征工程平台(Feature Store)

    实时ML架构 - 特征在实时系统中的应用。MLOps实践 - 模型生命周期管理。机器学习基础 - ML核心概念。RAG实战 - 向量化特征应用
  • 实时机器学习系统架构 PRO

    实时机器学习系统架构

    Feature Store - 特征管理详解。MLOps实践 - 模型生命周期管理。Spark MLlib - 批量训练基础。机器学习基础 - ML核心概念
  • MLOps最佳实践 - 机器学习工程化 PRO

    MLOps最佳实践 - 机器学习工程化

    MLOps(Machine Learning Operations)是将DevOps实践应用于机器学习的方法论,旨在统一机器学习系统的开发(Dev)和运营(Ops),实现ML系统的可靠、可扩展和高效部署。。机器学习基础 - ML基础理论。Spark MLlib - 大数据ML实践。机器学习 - Python ML...
  • Agentic RAG工程实战 PRO

    Agentic RAG工程实战

    #为什么选 Corrective RAG 作为实战目标。#第二步:State 定义。#第四步:条件边(决策逻辑)。#第五步:图的编译与执行。#第六步:FastAPI 封装。#效果评估:与 Naive RAG 的对比。Agentic RAG进阶架构 介绍了四种 Agentic RAG 架构。选 Corrective...
  • LLM评估体系

    LLM评估体系

    传统 NLP 评估指标与人类判断之间的相关性,在 LLM 时代几乎崩塌了。BLEU 高不代表答案好,ROUGE 低不代表答案差。LLM 评估需要一套完全不同的体系。。#为什么 LLM 评估很难。#第一层:自动化评估(RAGAS)。#第二层:LLM-as-Judge。#评估驱动的开发工作流。1. 开放域输出,没有唯...
  • 写给数据人的 2026:当技术护城河被填平,我们靠什么端稳饭碗?

    写给数据人的 2026:当技术护城河被填平,我们靠什么端稳饭碗?

    2026年数据行业深度研究报告:AI填平技术护城河后,数据分析师和数据工程师靠什么端稳饭碗?从大厂到独角兽的行业数据分析,涵盖市场行情研判、技能重构方向、高潜力赛道选择和具体避坑指南,帮助数据从业者在技术大变局中找到进阶路径。
  • Text-to-SQL 自然语言查询实战

    Text-to-SQL 自然语言查询实战

    #是什么,为什么现在才真正可用。#主流工具全景(2025年实际在用的)。#工程实践:一个完整的实现。#数据分析师的日常用法。#对数据岗位的真实影响。Text-to-SQL 做的事情直白说就一件:把人话翻译成 SQL。。这个转换过程拆开来有三个核心子任务:。1. 意图理解:判断用户要做什么(查询、聚合、排名、趋势....
  • AI数据标注与数据飞轮 - 数据才是AI的核心壁垒 PRO

    AI数据标注与数据飞轮 - 数据才是AI的核心壁垒

    不同的 AI 任务需要不同类型的标注,理解它们的差异是选择工具和工作流的前提:。一个反直觉的发现:使用 1 万条高质量标注数据训练的模型,往往优于使用 10 万条低质量噪声标注数据训练的模型。噪声标注会误导模型学习错误的决策边界,且越是边界附近的样本,噪声的危害越大。。Kappa 系数(标注一致性指标)的工程意义...
  • 向量数据库与RAG工程实践 - 让AI真正懂你的数据 PRO

    向量数据库与RAG工程实践 - 让AI真正懂你的数据

    传统搜索用关键词匹配——"苹果手机"搜不到"iPhone"的结果,因为字面上不相似。Embedding 技术的突破在于:把语义相似的内容映射到向量空间中相近的位置。。假设知识库有 100 万条文档,每条 Embedding 是 768 维的 float32:。存储:768 × 4 bytes × 1,000,00...
  • AI工程化实践指南 - 从模型训练到生产落地的完整链路 PRO

    AI工程化实践指南 - 从模型训练到生产落地的完整链路

    每个做过AI项目的人都经历过这个场景:模型在 Jupyter Notebook 里跑得很好,准确率亮眼,但一到要上线就陷入泥潭——环境不一致、代码不可复现、接口没有标准化、性能不达标……。这道鸿沟不是技术能力问题,而是工程体系问题。。机器学习的版本管理比普通软件更复杂,因为它有三个需要同步追踪的维度:。代码版本:...
  • AI多Agent协作系统 PRO

    AI多Agent协作系统

    Agent概述 - 单Agent基础知识。Agent框架 - 框架详细使用。提示工程 - Agent Prompt设计。大语言模型 - Agent的核心引擎
  • AI Agent开发框架实战 PRO

    AI Agent开发框架实战

    Agent概述 - 了解Agent基础概念。RAG实战 - 检索增强技术详解。提示工程 - Agent Prompt技巧。向量数据库 - 检索基础设施。大语言模型 - Agent的"大脑"
  • AI Agent智能体概述

    AI Agent智能体概述

    大语言模型 很强,但本质上只是一个"嘴上功夫"选手——能说会道,却不能真正做事。。AI Agent = LLM + 记忆 + 工具 + 规划能力。一个能够自主感知环境、制定计划、执行行动、并根据反馈调整的AI系统。。Agent的"思考引擎",负责:。将复杂任务分解为可执行的步骤。。Agent的"手脚",让AI能与...
  • 消失的两周,我重新思考了数据人的 2025

    消失的两周,我重新思考了数据人的 2025

    停更两周后的年终复盘:作为11年数据老兵,重新思考2025年数据行业的变与不变。AI工具铺天盖地,但数据从业者的核心竞争力依然是理解业务、定义问题、推动落地。本文分享这两周闭关打磨产品的心路历程,以及对数据人2025-2026年发展方向的冷静研判。
  • RAG检索增强生成实战

    RAG检索增强生成实战

    大语言模型 很强大,但有三个致命问题:。RAG(Retrieval-Augmented Generation)= 检索 + 生成。先从知识库中检索相关文档,再让大模型基于检索结果生成回答。。把各种格式的文档转成纯文本。。把文本转换成向量(一串数字),让计算机能计算"语义相似度"。。详见 → 向量数据库与语义搜索。...
  • Prompt Engineering提示工程

    Prompt Engineering提示工程

    同一个 大语言模型,不同的提示词可能带来天壤之别的效果:。掌握Prompt工程,你可以:。将AI的效果提升 3-10倍。完成之前"AI做不好"的任务。显著减少来回修改的次数。建立可复用的"提示词资产库"。最简单但非常有效的技巧:。在 RAG系统 中,Prompt设计至关重要:。在 AI Agent 中,Promp...
  • 大语言模型全景解析

    大语言模型全景解析

    2022年底ChatGPT的发布,标志着AI进入了一个新时代。如今(2025年),大语言模型已经:。正在改变几乎所有行业的工作方式。催生了全新的职业(如Prompt工程师)。成为企业数字化转型的核心技术。语言模型的本质很简单:预测下一个词。。当模型大到一定程度,会突然"涌现"出小模型不具备的能力:。所有主流大模型...