单词乎下载
首页 手机游戏 手机应用 资讯 攻略 合集

AI大模型高考评测:语英成绩优异,数学全军覆没

2024-06-20 10:09:13 标签:AI高考

  据新浪科技报道,上海人工智能实验室旗下的司南评测体系OpenCompass对七个大型语言模型进行了高考“语数外”全卷能力测试,并发布了首个大模型高考全卷评测结果。

AI大模型高考评测:语英成绩优异,数学全军覆没

  此次测试的语文、数学和英语三科总分为420分。测试结果显示,阿里巴巴通义千问2-72B以303分的成绩排名第一,OpenAI的GPT-4以296分紧随其后,位居第二。上海人工智能实验室的书生浦语2.0排名第三。这三个大模型的得分率均超过70%。法国初创公司Mistral的大模型排名末尾。

AI大模型高考评测:语英成绩优异,数学全军覆没

  从测试结果来看,大模型在语文和英语考试中的表现普遍较好,但在数学科目上表现欠佳,最高分仅为75分,全部未能及格。

AI大模型高考评测:语英成绩优异,数学全军覆没

推荐内容

  • 《潜行者2》PC版优化问题 30系显卡似乎全军覆没
    备受瞩目的《潜行者2》现已正式解锁并发售,Steam国区标准版售价为268元人民币,并且贴心地配备了简体中文界面。游戏一经上市便受到了广大玩家的热烈关注,目前在Steam平台上收获了“多半好评”的评价,总计3992篇评价中好评率高达77%。然而,在中文区域,该游戏的评价略显低迷,好评率仅为61%,呈现出“褒贬不一”的局面。
    2024-11-21
  • 丹麦研究:AI模型利用生活数据精准预测死亡时间
    最近,一项由丹麦技术大学和哥本哈根大学领导的研究揭示了一个引人注目的发现,即利用大量个人生活数据(包括教育、职业、住房、收入、健康等方面)来训练大型生成式语言模型,例如ChatGPT,这类人工智能模型可以以高精度预测一个人未来生活的发展,甚至能够估计死亡的时间点。
    2023-12-21
  • 40系N卡用户将从帧生成新AI模型中受益
      英伟达员工Jacob Freeman透露,新一代40系列NVIDIA显卡的用户将能够从一项创新的AI模型中获益。这项新AI模型将被集成到DLSS 3中,并支持所有RTX 40系列显卡。
    2025-01-15
  • Google推出史上最卓越的AI模型-Gemini 2.0
      今日,科技领域传来重磅消息,谷歌正式推出了专为新时代智能体设计的下一代AI模型——Gemini 2.0。这一发布标志着谷歌在AI领域又迈出了重要一步。
    2024-12-12
  • 高手玩家以木质匠心制作钢普拉模型
      钢普拉因其精巧细致而闻名,然而,一些热衷的玩家已经将这一爱好推向了新的高度,他们亲手制作的全木质版钢普拉不仅拥有独特的韵味,而且在性能上也不逊于官方版本。
    2025-01-14
相关推荐
App排行
最新App
单词乎下载频道为你分享最新的手机APP! www.dancihu.com App上传