AI导航/智能体与自动化OpenCompass
智能体与自动化

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

更新时间 2026/04/156 次关注官网可查看

OpenCompass 是一款面向 智能体与自动化 场景的 AI 工具,上海人工智能实验室推出的大模型开放评测体系。

OpenCompass是上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。OpenCompass包含 CompassKit(评估工具包)、CompassHub(基准社区)和 CompassRank(评估排行榜)三大核心部分。OpenCompass支持多种模型(如 Hugging Face 模型、API 模型等),涵盖语言、知识、推理等八大能力维度,提供零样本、少样本等多种评估方法。OpenCompass具备分布式高效评估、灵活扩展等特点,已吸引众多知名企业和高校合作,致力于推动大模型评估的标准化和规范化发展。 模型评估工具 (CompassKit):提供丰富的评估基准和模型模板,支持零样本、少样本等多种评估方式,方便用户根据需求灵活扩展。

OpenCompass是上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。

98编辑评分
AI模型评测
01

什么是 OpenCompass?

OpenCompass是上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。OpenCompass包含 CompassKit(评估工具包)、CompassHub(基准社区)和 CompassRank(评估排行榜)三大核心部分。OpenCompass支持多种模型(如 Hugging Face 模型、API 模型等),涵盖语言、知识、推理等八大能力维度,提供零样本、少样本等多种评估方法。OpenCompass具备分布式高效评估、灵活扩展等特点,已吸引众多知名企业和高校合作,致力于推动大模型评估的标准化和规范化发展。 模型评估工具 (CompassKit):提供丰富的评估基准和模型模板,支持零样本、少样本等多种评估方式,方便用户根据需求灵活扩展。

OpenCompass是上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。

02

OpenCompass 的主要功能

功能亮点 01

模型评估工具

功能亮点 02

基准社区

功能亮点 03

评估排行榜

功能亮点 04

高效评估系统

功能亮点 05

访问官网

功能亮点 06

选择功能模块

功能亮点 07

提交模型或基准

功能亮点 08

安装与配置

03

如何使用 OpenCompass

  1. 01
    进入 OpenCompass 官网并完成基础设置

    先通过官网进入产品,按照当前账号体系完成登录、试用或订阅开通,确认你要处理的任务类型。

  2. 02
    从最接近业务目标的功能开始

    优先使用它最擅长的能力,例如 模型评估工具,先验证输出质量和稳定性。

  3. 03
    结合标签和场景逐步形成固定用法

    围绕 AI模型评测 相关需求建立自己的提示词、模板或操作路径,减少重复摸索。

  4. 04
    把结果接入你的实际流程

    当结果稳定后,再把 OpenCompass 放进文档生产、设计创作、开发协作或内容分发流程,而不是只停留在单次试用。

04

OpenCompass 的应用场景

场景 01

OpenCompass 适合用于知识,如果你正好有这类任务,它会比泛用型工具更省时间。

场景 02

OpenCompass 适合用于少样本等多种评估方法,如果你正好有这类任务,它会比泛用型工具更省时间。

场景 03

OpenCompass 适合用于分布式高效评估,如果你正好有这类任务,它会比泛用型工具更省时间。

场景 04

OpenCompass 适合用于灵活扩展等特点,如果你正好有这类任务,它会比泛用型工具更省时间。

场景 05

OpenCompass 适合用于少样本等多种评估方式,如果你正好有这类任务,它会比泛用型工具更省时间。

05

常见问题

OpenCompass 适合哪些人?

OpenCompass 适合需要处理 智能体与自动化 相关任务的人群,尤其适合 知识、少样本等多种评估方法、分布式高效评估、灵活扩展等特点、少样本等多种评估方式 这类高频场景。

OpenCompass 是否需要付费?

当前收录信息显示它的收费方式为“官网可查看”。如果你只是评估是否适合团队使用,建议先从免费额度或试用入口开始。

OpenCompass 的优势主要体现在哪里?

OpenCompass 当前最突出的地方在于 模型评估工具、基准社区、评估排行榜、高效评估系统、访问官网、选择功能模块、提交模型或基准、安装与配置,所以它更适合有明确任务目标的人直接拿来落地,而不是只做泛泛体验。