
OpenCompass司南
评测榜单旨在为大语言模型和多模态模型提供全面、客观且中立的得分与排名,同时提供多能力维度的评分参考,以便用户能够更全面地了解大模型的能力水平。
SuperBench是什么SuperBench 是由清华大学基础模型研究中心联合中关村实验室在 2024 年共同发布的大模型综合能力评测榜单,致力于为大模型领域提供科学、客观的评测标准,促进大模型技术、生态和应用的健康发展。其官网首页显示 “致力于打造一个公平、公正、公开、系统的评测体系,以推动国内大模型研究与应用的进步”,并提供了 “加入评测” 和 “最新榜单” 等按钮,方便用户参与和查看最新信息。链接:https://fm.ai.tsinghua.edu.cn/superbench/