单词乎下载
首页 手机游戏 手机应用 资讯 攻略 合集

AI大模型高考评测:语英成绩优异,数学全军覆没

2024-06-20 10:09:13 标签:AI高考

  据新浪科技报道,上海人工智能实验室旗下的司南评测体系OpenCompass对七个大型语言模型进行了高考“语数外”全卷能力测试,并发布了首个大模型高考全卷评测结果。

AI大模型高考评测:语英成绩优异,数学全军覆没

  此次测试的语文、数学和英语三科总分为420分。测试结果显示,阿里巴巴通义千问2-72B以303分的成绩排名第一,OpenAI的GPT-4以296分紧随其后,位居第二。上海人工智能实验室的书生浦语2.0排名第三。这三个大模型的得分率均超过70%。法国初创公司Mistral的大模型排名末尾。

AI大模型高考评测:语英成绩优异,数学全军覆没

  从测试结果来看,大模型在语文和英语考试中的表现普遍较好,但在数学科目上表现欠佳,最高分仅为75分,全部未能及格。

AI大模型高考评测:语英成绩优异,数学全军覆没

推荐内容

  • 《潜行者2》PC版优化问题 30系显卡似乎全军覆没
    备受瞩目的《潜行者2》现已正式解锁并发售,Steam国区标准版售价为268元人民币,并且贴心地配备了简体中文界面。游戏一经上市便受到了广大玩家的热烈关注,目前在Steam平台上收获了“多半好评”的评价,总计3992篇评价中好评率高达77%。然而,在中文区域,该游戏的评价略显低迷,好评率仅为61%,呈现出“褒贬不一”的局面。
    2024-11-21
  • 丹麦研究:AI模型利用生活数据精准预测死亡时间
    最近,一项由丹麦技术大学和哥本哈根大学领导的研究揭示了一个引人注目的发现,即利用大量个人生活数据(包括教育、职业、住房、收入、健康等方面)来训练大型生成式语言模型,例如ChatGPT,这类人工智能模型可以以高精度预测一个人未来生活的发展,甚至能够估计死亡的时间点。
    2023-12-21
  • ‌Chrome未经允许下载近4GB AI模型,用户批评“先斩后奏”
      近期有安全专家披露,谷歌Chrome浏览器在用户不知情的情况下,会未经许可自动下载并运行一个约4GB容量的Gemini Nano AI模型文件。
    2026-03-06
  • 美国电影协会强烈指责 AI 模型 Seedance 2.0
    近日,抖音母公司字节跳动推出的 AI 视频生成工具 Seedance 2.0 刚面向公众上线即招致激烈批评,美国电影协会已就此事发表严正声明并表达深切忧虑。该协会指出,这款升级版 AI 服务虽然在视频内容生成的质量层面达到了“显著突破”,但投入使用仅一日内,就已经观察到数量庞大的涉及版权法规违背的侵权行为,其中尤为突出的一段通过 AI 仿制而成的“汤姆·克鲁斯与布拉德·皮特上演屋顶对决”短片,目前正在各大社交平台上加速传播。
    2026-02-13
  • 腾讯马化腾评述AI模型与游戏成就
    在腾讯公司年度员工大会内部讲话中,董事会主席马化腾阐述了对多个业务板块的看法。谈及人工智能领域,他对阿里巴巴旗下“通义千问”与内部生态整合的做法予以肯定,但同时指出完全捆绑的AI产品未必受到用户普遍青睐。对于字节跳动研发的豆包手机所采用的屏幕录屏传输技术,马化腾则明确表示安全风险过高、处理方式不妥,并强调腾讯对此持坚决反对态度。
    2026-01-27
相关推荐
App排行
最新App
单词乎下载频道为你分享最新的手机APP! www.dancihu.com App上传