跳到正文
#
拾穗
beta
登录
首页
资讯
方法
会员
观点
专题
职场认知
职业成长
商业洞察
数据工程
AI
数据分析
数据治理
求职面试
Media
Podcast
Videos
社区
知识库
#
拾穗
beta
首页
资讯
方法
会员
观点
专题
Media
社区
知识库
登录
首页
资讯
方法
会员
观点
专题
职场认知
职业成长
商业洞察
数据工程
AI
数据分析
数据治理
求职面试
Media
Podcast
Videos
社区
知识库
全部标签
llm评估
#
llm评估
共 4 篇文章
PRO
数据分析
·
方法
医疗数据分析实战指南
通过本指南,你将掌握:。理解医疗数据的独特性和分析挑战。掌握患者风险评估的核心指标体系。学会构建医院运营效率分析框架。建立预测性风险模型的完整方法论。掌握临床试验数据的统计分析技巧。运用高级分析技术优化医疗资源配置。设计疾病爆发监测预警系统。实现医疗质量持续改进体系。医疗数据分析的复杂性在于其多维度、高风险和强监...
PRO
AI
·
方法
Agentic RAG工程实战
#为什么选 Corrective RAG 作为实战目标。#第二步:State 定义。#第四步:条件边(决策逻辑)。#第五步:图的编译与执行。#第六步:FastAPI 封装。#效果评估:与 Naive RAG 的对比。Agentic RAG进阶架构 介绍了四种 Agentic RAG 架构。选 Corrective...
AI
·
方法
LLM评估体系
传统 NLP 评估指标与人类判断之间的相关性,在 LLM 时代几乎崩塌了。BLEU 高不代表答案好,ROUGE 低不代表答案差。LLM 评估需要一套完全不同的体系。。#为什么 LLM 评估很难。#第一层:自动化评估(RAGAS)。#第二层:LLM-as-Judge。#评估驱动的开发工作流。1. 开放域输出,没有唯...
MAX
AI
·
方法
LLM评估体系
BLEU分数0.45,用户投诉率30%——你信哪个?传统NLP评估指标在LLM时代几乎崩塌。本文构建三层LLM评估体系:RAGAS自动化评估、LLM-as-Judge、人工评估,附完整代码实现。
未在播放
✕
0:00
0:00
✕
喜欢这里的内容?
加入社区免费交流,或升级会员解锁全部深度内容。
免费加入社区
了解会员