llmops

# llmops

共 4 篇文章

Agent 可观测性三件套：Trace、Eval、Guardrail

AI · 方法

Agent 可观测性三件套：Trace、Eval、Guardrail

2026 年 Atlan 把 Agent Observability 列为与 DataOps 平级的新品类。Agent 出错了怎么复现？回归怎么量化？线上怎么兜底？这篇文章把 Agent 可观测性拆成三件套：Trace 追踪调用链、Eval 量化行为质量、Guardrail 拦截风险输出，配合主流工具（Langfuse、Braintrust、Guardrails AI）给出一套可落地的监控方案。

Elazer (石头) 2026年4月20日

LLM评估体系

AI · 方法

LLM评估体系

BLEU分数0.45，用户投诉率30%——你信哪个？传统NLP评估指标在LLM时代几乎崩塌。本文构建三层LLM评估体系：RAGAS自动化评估、LLM-as-Judge、人工评估，附完整代码实现。

Elazer (石头) 2026年1月27日

LLMOps体系全景

AI · 观点

LLMOps体系全景

大多数团队上了LLM之后，第一个月在写Prompt，第二个月在数钱，第三个月才意识到没有工程体系撑不住。本文系统讲解LLMOps与MLOps的本质差异、五大核心组件和成熟度模型。

Elazer (石头) 2025年8月5日

LLM成本控制与优化

AI · 方法

LLM成本控制与优化

Demo阶段花了50美元，规模化之后账单是5万美元——这不是特例。本文系统讲解模型路由、缓存策略、Prompt压缩、Batch API和本地化替代五大成本优化策略，附完整代码示例。

Elazer (石头) 2025年5月28日

未在播放