[{"data":1,"prerenderedAt":81},["ShallowReactive",2],{"tool-open-llm-leaderboard":3},{"tool":4,"relatedTools":43},{"id":5,"name":6,"slug":7,"tagline":8,"description":9,"websiteUrl":10,"logoText":11,"pricing":12,"editorScore":13,"clickCount":14,"featured":15,"latest":15,"updatedAt":16,"category":17,"tags":26,"overview":28,"highlights":29,"useCases":38},"de6998cb503020f4a8d30d98586a4538","Open LLM Leaderboard","open-llm-leaderboard","Hugging Face推出的开源大模型排行榜单","Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单，基于 Eleuther AI Language Model Evaluation Harness（Eleuther AI语言模型评估框架）封装。","https:\u002F\u002Fhuggingface.co\u002Fspaces\u002FHuggingFaceH4\u002Fopen_llm_leaderboard?utm_source=ai-bot.cn","OPE","官网可查看",98,9,false,"2026-04-15T04:26:34+08:00",{"id":18,"name":19,"slug":20,"description":21,"iconLabel":22,"accentColor":23,"toolCount":24,"sortOrder":25},"d6d303a9f41677e5f1a5f9b12c520225","智能体与自动化","agents","适合搭建业务工作流、插件编排和多步骤自动化，用来把 AI 接进真实流程。","AUTO","#6C7A2D",216,7,[27],"AI模型评测","Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单，基于 Eleuther AI Language Model Evaluation Harness（Eleuther AI语言模型评估框架）封装。Open LLM Leaderboard通过多种基准测试（如 IFEval、BBH、MATH 等），从指令遵循、复杂推理、数学解题、专业知识问答等多个维度对模型进行评估。排行榜涵盖预训练模型、聊天模型等多种类型，提供详细的数值结果和模型输入输出细节。Open LLM Leaderboard 能帮助用户筛选出当前最先进的模型，推动开源社区的进步。 多维度基准测试 ：包括多种基准测试（如 IFEval、BBH、MATH、GPQA 等），涵盖指令遵循、复杂推理、数学解题、专业知识问答等多个领域，全面评估模型能力。",[30,31,32,33,34,35,36,37],"多维度基准测试","多种模型类型支持","详细结果展示","社区互动","可复现性支持","IFEval","BBH","MATH",[39,36,37,40,41,42],"多种基准测试（如 IFEval","GPQA 等）","复杂推理","数学解题",[44,57,68],{"id":45,"name":46,"slug":47,"tagline":48,"description":49,"websiteUrl":50,"logoText":51,"pricing":12,"editorScore":13,"clickCount":52,"featured":53,"latest":53,"updatedAt":16,"category":54,"tags":55},"a638bfd4cc081d0294d7d12975a727dd","GPT-4","gpt-4","OpenAI旗下最新的GPT-4模型","GPT-4（Generative Pre-trained Transformer）是 OpenAI 开发的自然语言处理模型 GPT 家族中的第四个版本，该模型依靠强大的神经网络来理解和生成类似人类的语言。","https:\u002F\u002Fcn.bing.com\u002Fsearch?q=GPT-4&ensearch=1","GPT",2356,true,{"id":18,"name":19,"slug":20,"description":21,"iconLabel":22,"accentColor":23,"toolCount":24,"sortOrder":25},[56],"AI训练模型",{"id":58,"name":59,"slug":60,"tagline":61,"description":62,"websiteUrl":63,"logoText":64,"pricing":12,"editorScore":13,"clickCount":65,"featured":53,"latest":53,"updatedAt":16,"category":66,"tags":67},"a23e89d9e4203bd1c683c41e837f370e","LMArena","lmarena","AI模型评估平台","LMArena是加州大学伯克利分校推出的创新AI模型评估平台，基于让用户对不同AI模型的回答进行匿名投票，衡量模型的表现。用户输入问题后，平台提供两个模型的回答，用户根据偏好选择更优答案，投票结果直接塑造公共排行榜。","https:\u002F\u002Flmarena.ai\u002F?utm_source=ai-bot.cn","LMA",681,{"id":18,"name":19,"slug":20,"description":21,"iconLabel":22,"accentColor":23,"toolCount":24,"sortOrder":25},[27],{"id":69,"name":70,"slug":71,"tagline":72,"description":73,"websiteUrl":74,"logoText":75,"pricing":76,"editorScore":13,"clickCount":77,"featured":53,"latest":53,"updatedAt":16,"category":78,"tags":79},"32bb7d109995125694dc4a175a840117","Coze","coze","海量AI智能体免费用，一键复制同款","Coze是字节跳动推出的AI办公助手，能通过AI技术简化工作流程，提升工作效率。通过Agent Skills技能系统和Agent Plan长期计划功能，实现从单一工具到智能工作伙伴的转变。","https:\u002F\u002Fwww.coze.cn\u002Foverview?utm_medium=daohang&utm_source=aibot&utm_term=49156769m","COZ","免费",316,{"id":18,"name":19,"slug":20,"description":21,"iconLabel":22,"accentColor":23,"toolCount":24,"sortOrder":25},[80],"AI开发平台",1776262185695]