跳到正文
全部标签

# 数据标注

共 2 篇文章

  • AI数据标注与数据飞轮 - 数据才是AI的核心壁垒 PRO

    AI数据标注与数据飞轮 - 数据才是AI的核心壁垒

    不同的 AI 任务需要不同类型的标注,理解它们的差异是选择工具和工作流的前提:。一个反直觉的发现:使用 1 万条高质量标注数据训练的模型,往往优于使用 10 万条低质量噪声标注数据训练的模型。噪声标注会误导模型学习错误的决策边界,且越是边界附近的样本,噪声的危害越大。。Kappa 系数(标注一致性指标)的工程意义...
  • AI数据标注与数据飞轮:数据才是AI的核心壁垒 MAX

    AI数据标注与数据飞轮:数据才是AI的核心壁垒

    GPT系列的真正壁垒不是Transformer架构,而是高质量的训练数据。本文深入讲解数据标注体系、主动学习、RLHF、数据飞轮建立路径,以及数据工程师在AI时代的新职责。