【SBB-058】マルクス兄弟ベストセレクション50タイトル4時間 全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模子前二
发布日期:2024-08-02 16:00 点击次数:163
快科技8月2日音讯【SBB-058】マルクス兄弟ベストセレクション50タイトル4時間,凭据国内巨擘大模子评估平台OpenCompass(司南)近日公布的CompassArena周榜,GPT-4o和科大讯飞的星火大模子区别占据了名次榜的前两位。
榜单接受专科用户投票式样,吞并了用户对各款大模子的着实体验,更具客不雅性和劝服力,可谓是含金量裕如。

OpenCompass的评测体系涵盖了学科、说念话、学问、清楚、推理等多个维度,大约全面评估大模子的概括能力。
在最新三期的评比中,讯飞星火以Elo-1078和Elo-1081的高分调处三周位列前三,并两次赢得第二,涌现出其在大模子范围的刚劲竞争力。

值得预防的是,另类图片 亚洲科大讯飞在本年6月27日发布的星火V4.0版块上,已完成了对GPT-4 Turbo的全体杰出。
凭据八个国外主流测试集的横向评测,讯飞星火V4.0排名第一,在文本生成、说念话清楚、学问问答、逻辑推理、数学能力等方面完成了全体杰出。
此前,讯飞星火在《麻省理工科技褒贬》的横评中也赢得了高分,凭借当先的说念话能力、数学、理综等多项中枢能力,斩获国产主流大模子榜首席位。
当今,讯飞星火的安卓端APP累计下载量已跨越1.31亿次,位各国内器具类通用大模子APP第一【SBB-058】マルクス兄弟ベストセレクション50タイトル4時間,执续领跑国内大模子第一梯队。
相关资讯