首页手机游戏手机应用资讯攻略合集

当前位置：首页 > 新闻 > APP资讯 > 8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

2024-07-18 15:29:09 标签：AI 大模型

　　一道小学生难度的数学题难倒了一众海内外AI大模型。

　　问题是：“9.11和9.9哪个更大?”就此问题，记者测试了12个大模型，结果显示阿里通义千问、百度文心一言、Minimax和腾讯元宝答对了，但ChatGPT-4.0、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了。每个错误的原因都各有不同。

8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

　　大部分大模型在问答过程中错误地比较了小数点后的数字，认为9.11大于9.9。考虑到数字涉及的语境问题，记者将其限定为数学语境下，但像ChatGPT这样的高级模型也依然答错。

8个大模型竟答错 9.11和9.9大小比较不出

　　这反映出大模型在数学能力上的不足，这是一个长期存在的问题。有行业人士认为，生成式语言模型从设计上更偏向文字思维而非数字思维。然而，针对性的语料训练或许能在未来逐步提升模型的理科能力。

推荐内容

国产大模型“质价双升” 开启落地应用时代
　　国产大模型发展步入新阶段，竞争焦点正从单一的性能比拼转向综合能力的较量。随着核心技术持续迭代和开源协作生态的成熟，国产大模型不仅在多项关键评测任务上表现与顶尖海外产品相当，更在特定细分领域建立了特色优势，展现出强大的工程化与成本控制能力。
2026-05-18
英伟达发布Nemotron 3 Nano Omni多模态AI模型
英伟达正式推出Nemotron 3 Nano Omni多模态AI模型，首次在单个模型中实现视觉、语音与文本的统一处理，使AI智能体效率提高至9倍，已在多个平台发售。
2026-04-29
国内4月AI大模型密集更新，行业竞争进入白热化
4月国内AI大模型赛道呈现“日更”节奏，月之暗面、阿里、腾讯、DeepSeek等公司相继发布或更新模型，行业竞争进入白热化阶段。国产开源大模型下载量突破100亿次。
2026-04-29
国产开源大模型下载量突破100亿次，中国AI专利全球占比达60%
Hugging Face最新报告显示，过去一年全球41%的大模型下载量来自中国研发的模型。中国已成为全球人工智能专利最大拥有国，专利申请量全球占比达60%。
2026-04-28
火山引擎豆包大模型日均Token调用量达120万亿全球前三
　　在“2026 Force Link AI 创新巡展-武汉站”的活动中，火山引擎总裁谭待向外界披露了一组关键数据：其豆包大模型每日的Token使用量已攀升至‌120万亿‌。值得一提的是，实现这一突破仅耗时三个月，相比之前的数据直接翻了一番，有力地印证了整个AI行业正在以前所未有的速度向前迈进。
2026-04-02

相关推荐

抓个大怪兽
安卓版 | 99.37MB
详情
一起做个大餐
安卓版 | 119.99MB
详情
造个大烟花
安卓版 | 90.54M
详情

App排行

1邯郸教服平台
学习教育
110M
详情
2天下龙泉
实用工具
64.6M
详情
3心臣优选
生活消费
75.29M
详情
4测测心理师
实用工具
162.28MB
详情
5神奇召唤师
休闲益智
37.84M
详情
6企叮咚商城
实用工具
68.5M
详情
7星讯音乐
学习教育
89.27M
详情
8小智社区
生活消费
89.54M
详情
9全知识
学习教育
192.9MB
详情
10火柴人激斗英雄
动作冒险
113.54M
详情

热门内容

夏日游戏节盛况前瞻：聚焦新游与独立佳作《流放之路2》近期更新引发玩家吐槽苹果人工智能战略泄露重构Siri底层基础设施 iOS 18.1正式版更新 iPhone现在能够通话录音了鸿蒙微信测试版遭吐槽：红包功能缺失微信内测新功能推荐删除人用于辅助用户更好判断 OpenAI被前研究员炮轰表示ChatGPT正在破坏互联网梦幻西游蝴蝶仙子上线 BOSS直聘推出婚恋交友App，服务职场适婚青年《射雕英雄传》电影想看人数破30万，肖战饰演郭靖

最新App

1圈地充饥
休闲益智
56.0M
详情
2美国之音
新闻阅读
1.61M
详情
3掏矿达人
休闲益智
35.98M
详情
4考证宝典安卓版
学习教育
49.3M
详情
5WiFi连网神器
实用工具
6.31M
详情
6出片啦相机
拍摄美化
40.62MB
详情
7跑酷勇者游戏
动作冒险
116.4MB
详情
8养花录
实用工具
12.9M
详情
9直升机模拟器3D
射击枪战
143.02MB
详情
10黑暗密语2
冒险解谜
101.7M
详情

最新文章

洛克世界S2阵容：蚊象花鸟队玩法详解 Steam一周销量榜出炉《超变色龙》再度登顶燕云十六声新版本破招连携攻略 ‌虚幻引擎5.8发布，重点修复稳定性与卡顿问题‌别急着吐槽！AMD确认将大幅提升Steam主机性能千层恋心确认将登陆Steam Niko圆梦Major！打破十余年无冠魔咒微软Xbox部门将遭大清洗 ‌KK平台速览：Dota1新模式详解与边玩边赚攻略‌‌《领航员计划》登录新品节，美少女相伴畅游太空‌

单词乎下载频道为你分享最新的手机APP！ www.dancihu.com App上传

浙ICP备2023010697号-1

浙公网安备 33010502007447号