Concept · AI
Rubrics评测
AI 2026-05-08 · 1 min read · 2 backlinks
Rubrics评测
定义
对于内容质量等无法简单判定成功/失败的场景,生成一系列不同等级的评测用例进行分级评估。区别于标准型(pass/fail),Rubrics 型评测用等级梯度衡量质量水平。
适用场景
- AIGC 生成内容质量(图片、文案、PPT)
- UI 品味和视觉质量
- 自然语言回复的准确性和完整性
- 任何"好坏程度"而非"有无"的评估
示例
查询 OKR 场景:
- Level 1:查出来了(基础)
- Level 2:查出来且格式清晰
- Level 3:格式清晰+关键指标高亮
- Level 4:高亮+给出进度分析建议
与其他概念的关系
来源
Backlinks 2 references