跳到正文
全部标签

# ai质量保障

共 1 篇文章

  • LLM评估体系 MAX

    LLM评估体系

    BLEU分数0.45,用户投诉率30%——你信哪个?传统NLP评估指标在LLM时代几乎崩塌。本文构建三层LLM评估体系:RAGAS自动化评估、LLM-as-Judge、人工评估,附完整代码实现。