跳到正文
全部标签

# llmops

共 4 篇文章

  • Agent 可观测性三件套:Trace、Eval、Guardrail

    Agent 可观测性三件套:Trace、Eval、Guardrail

    2026 年 Atlan 把 Agent Observability 列为与 DataOps 平级的新品类。Agent 出错了怎么复现?回归怎么量化?线上怎么兜底?这篇文章把 Agent 可观测性拆成三件套:Trace 追踪调用链、Eval 量化行为质量、Guardrail 拦截风险输出,配合主流工具(Langfuse、Braintrust、Guardrails AI)给出一套可落地的监控方案。
  • LLM评估体系 MAX

    LLM评估体系

    BLEU分数0.45,用户投诉率30%——你信哪个?传统NLP评估指标在LLM时代几乎崩塌。本文构建三层LLM评估体系:RAGAS自动化评估、LLM-as-Judge、人工评估,附完整代码实现。
  • LLMOps体系全景 MAX

    LLMOps体系全景

    大多数团队上了LLM之后,第一个月在写Prompt,第二个月在数钱,第三个月才意识到没有工程体系撑不住。本文系统讲解LLMOps与MLOps的本质差异、五大核心组件和成熟度模型。
  • LLM成本控制与优化 MAX

    LLM成本控制与优化

    Demo阶段花了50美元,规模化之后账单是5万美元——这不是特例。本文系统讲解模型路由、缓存策略、Prompt压缩、Batch API和本地化替代五大成本优化策略,附完整代码示例。