智能体与自动化

OpenCompass

OpenCompass是上海人工智能实验室（上海AI实验室）于2023年8月正式推出的大模型开放评测体系，通过完整开源可复现的评测框架，支持大语言模型、多模态模型各类模型的一站式评测，并定期公布评测结果榜单。

访问官网更新于 2026/04/15

工具分类智能体与自动化按实际使用场景归类

官网入口opencompass.org.cn保留原站直达链接

收费方式官网可查看最终价格以官网为准

关注人数6A+ 优先推荐

OpenCompass 是什么

OpenCompass 是一款面向智能体与自动化场景的 AI 工具，上海人工智能实验室推出的大模型开放评测体系。

OpenCompass是上海人工智能实验室（上海AI实验室）于2023年8月正式推出的大模型开放评测体系，通过完整开源可复现的评测框架，支持大语言模型、多模态模型各类模型的一站式评测，并定期公布评测结果榜单。OpenCompass包含 CompassKit（评估工具包）、CompassHub（基准社区）和 CompassRank（评估排行榜）三大核心部分。OpenCompass支持多种模型（如 Hugging Face 模型、API 模型等），涵盖语言、知识、推理等八大能力维度，提供零样本、少样本等多种评估方法。OpenCompass具备分布式高效评估、灵活扩展等特点，已吸引众多知名企业和高校合作，致力于推动大模型评估的标准化和规范化发展。模型评估工具（CompassKit）：提供丰富的评估基准和模型模板，支持零样本、少样本等多种评估方式，方便用户根据需求灵活扩展。

主要能力

01AI模型评测

模型评估工具

02核心能力 02

基准社区

03核心能力 03

评估排行榜

04核心能力 04

高效评估系统

05核心能力 05

访问官网

06核心能力 06

选择功能模块

适合场景

知识

OpenCompass 可用于知识，适合先用一个真实任务验证输出质量。

少样本等多种评估方法

OpenCompass 可用于少样本等多种评估方法，适合先用一个真实任务验证输出质量。

分布式高效评估

OpenCompass 可用于分布式高效评估，适合先用一个真实任务验证输出质量。

灵活扩展等特点

OpenCompass 可用于灵活扩展等特点，适合先用一个真实任务验证输出质量。

少样本等多种评估方式

OpenCompass 可用于少样本等多种评估方式，适合先用一个真实任务验证输出质量。

OpenCompass

OpenCompass 是什么

主要能力

适合场景

如何开始使用 OpenCompass

常见问题