查看原文
其他

中文大模型对战平台「SuperCLUE-琅琊榜」开启,首期入围近20个模型


SuperCLUE中文通用大模型评测基准自5月9日发布以来,引发了社区的热烈讨论,收到了大量反馈和宝贵建议,讨论最多的是如何在AI大模型百家争鸣的时代,构建公正、客观、有效的大模型评测基准。中文通用大模型评测基准SuperCLUE发布更新,新增Claude、清华GLM千亿模型

为此,SuperCLUE团队发起中文大模型对战平台「SuperCLUE-琅琊榜」,平台会选取目前国内外具有代表性的大语言模型进行两两对战。「SuperCLUE-琅琊榜」对战平台旨在为中文通用大模型提供一个公平、公正、开放的评测平台,目标是纳入国内外绝大部分具有代表性的可用模型,为用户提供清晰、客观、有效的模型对比结果。琅琊榜会按定期或按月更新。

特邀您作为出题人和裁判,参与对战平台评测,与我们一起煮酒论英雄。参与地址:www.SuperCLUEAI.com

(对战平台界面)


1.出题


通过www.SuperCLUEAI.com 进入对战平台。需要您输入自己感兴趣的问题,帮助我们考验中文大模型通用与专业能力,包括但不限于:上下文理解、百科常识、逻辑推理、数学计算、代码生成、内容创作等,难点刁钻都可以。


2.评判


提交问题后,匿名模型会两两对战,分别生成相关答案,需要您对答案做出评判,从4个评判选项中选择一个,分别为模型A更好、模型B更好、平手都很差。


3.放榜


我们将用一周时间收集到足够数量的有效反馈,届时会发布第一期琅琊榜排名,敬请期待。

谁是英雄,您来评判。期待您的参与,贡献您的智慧。
「SuperCLUE-琅琊榜」官方唯一地址:
www.SuperCLUEAI.com

(若二维码失效,可在公众号后台回复SuperCLUE加入交流群)

                       

琅琊榜首,众雄争王。

清华复旦南北望,

星火天工混元强。

文心通义日日新,

孟子盘古舞凤凰。

名之梦,百川扬。

言深处,西湖旁。

悟道本源,三六成邦。

光年之外,序列华章。

谁是英雄,决,琅琊榜!

                                                      —— SuperCLUE 团队

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存