【环球新视野】五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

发布时间：2023-06-08 21:26:38 来源：搜狐科技

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

(相关资料图)

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__

责任编辑：

标签：

【环球新视野】五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

解读《新时代的中国绿色发展》白皮书：坚定不移走绿色低碳发展之路

国务院新闻办公室近日发布了《新时代的中国绿色发展》白皮书。白皮书向国内外讲述新时代推动绿色发展的...

新兴食品现身市场 “植物肉”产品能否“俘获”消费者的胃？

最近一段时间，部分超市和电商平台售卖的植物肉纷纷推出促销优惠活动，销量看涨。不过也有消费者表示，...

绍兴招才引智云对话活动举行 诚邀天下英才“会盟”绍兴

懂人才是大学问，聚人才是大本事，用人才是大智慧。近年来，绍兴市大力实施人才强市战略，持续深化人才...

江苏省自然资源厅出台指导意见 推进老旧小区改造工作

省自然资源厅近日出台《关于大力推进城镇老旧小区改造工作的指导意见》，针对城镇老旧小区改造中规划和...

2021年中国心血管健康指数排名：江苏位列前五

进行了排名，江苏位列前五。北京、上海、江苏等地居民心血管更健康这项发表在《中国疾病预防控制中心周...

科研人员揭示5种豆科植物的核型数据及亲缘关系

近日，四川农业大学林学院副教授罗小梅团队在遗传学领域期刊《基因》(Genes)，在线发表了题为《基于5S ...

“烟火气”十足的“江苏味道” 河西CBD顶流商圈开街迎客

开街啦!5月18日上午，在河西CBD金融城融媒路上，2022江苏省新能源汽车&信息消费创新产品推广系列活动启...

首个锌金属的伴侣蛋白诞生 有助于解决缺锌公共卫生问题

据17日发表在《细胞》与《细胞报告》杂志上的两篇论文，美国研究人员发现了第一个锌金属的伴侣蛋白，并...

科学家首次揭示糖尿病卵母细胞起源 有助于减少生育缺陷

5月19日，记者从浙江大学获悉，浙大医学院附属妇产科医院黄荷凤院士团队与中国科学院徐国良院士团队合作...

前4月河北省电信网络诈骗案件发案数连续4个月同比下降

记者从省政府新闻办5月18日举行的河北省打击治理电信网络诈骗犯罪工作新闻发布会上获悉，今年1至4月，全...

重庆：到2025年25个重点领域企业能效全部达到基准水平

3月18日，重庆日报记者从市发展改革委获悉，日前，市发展改革委、市经济信息委、市生态环境局、市市场监...

重磅！2021“发现重庆之美”获奖名单揭晓

3月19日，2021发现重庆之美颁奖典礼在线上举行，最美城市管理人、最美坡坎崖、最美街头绿地、垃圾分类时...

去年重庆回收废弃农膜1.4万吨 农膜回收率达89.31%

3月16日，市五届人大常委会第六十九次主任会议听取了市政府关于《重庆市人大常委会对市人民政府农业面源...

申报分两批！今年国家级博士后科研工作站新设站工作启动

3月19日，重庆日报记者从市人力社保局获悉，为推动产学研深度融合，加强博士后工作平台建设，我市将开展...

浙江鄞州：“水、电、气、数”通办专窗实现城乡公共服务均等化

近日，在宁波市鄞州区邱隘镇公共事务服务中心，66岁的邱隘镇沈家新村居民邱秀月在一个窗口相继办理了不...

打开“浙里办” 浙江1000家农贸市场农产品可线上比价

今天哪个菜场的五花肉最便宜?食品安全抽检结果怎么样?这些问题，浙江居民只需打开浙里办APP上的浙里市场...

浙江鉴湖国家湿地公园规划发布 打造乡村数字旅游

19日上午，鉴湖国家湿地公园规划发布暨东鉴湖农旅观光体验启动仪式在绍兴市越城区陶堰街道举行。当天，...

总投资超10亿元！6个石化装备运维项目在岱山签约

日前，总投资超10亿元的6个石化装备运维项目在岱山经济开发区集中签约。此次签约的项目占地106亩，规划...

如何避免成为“买而不做”的“装备党”祝 杰

自恋是人的天性，人们总是希望自己是更好的，那么自己拥有的事物，也就相应地被自我赋予了更高的价值，...

山西临汾：率先在全省建起农村集体经济开发区

3月17日，临汾市农村集体经济发展(集团)有限公司在临汾经济开发区揭牌。以此为标志，临汾率先在全省建起...

一线工作近22年的缉毒警：我知道坏的是毒品不是人性

“影子”般的缉毒警：一线工作22年，我知道坏的是毒品不是人性 如果我不继续干，别人也要干，缉...

广东肇庆“毒驾连撞5车致1死”肇事司机被批捕

1月5日14时30分许，广东肇庆市端州区一男子赵某毒驾连撞5车，致一人死亡。 1月10日，澎湃新闻(ww...

江西最大文物倒卖案宣判：倒卖国家二级文物 9人获刑

中新网南昌1月10日电 (冷峥嵘 张一怡)江西省共青城市人民法院10日发布消息称，近日，该院依法审结...

青海保障门源地震后生活必需品应急物资

中新网西宁1月10日电 (记者 孙睿)记者10日从青海省商务厅获悉，青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关 入境需网上预约

中新社防城港1月10日电 (翟李强)自2022年1月10日零时起，广西东兴口岸和边民互市贸易区恢复人员、...

呼和浩特：寒假期间有条件的学校要开展校内托管服务

“中国最后一个原始部落”翁丁老寨火灾原因公布

北京市十五届人大五次会议胜利闭幕

天津市委市政府致全市父老乡亲的慰问信：我们一定能够打赢

天津米面油存量由20天提高至30天 超市菜市场进货量翻倍

兰州名师话“美育”：“尚乐立人”分层培优 以“美”润教

子夜直击，天津寒天战“疫”

重庆姐弟被生父扔下坠亡案上诉期结束 一审法院暂未收到两被告人上诉状

天津：划定封控区 全市开展全员核酸检测

江歌母亲江秋莲：尊重法院判决，法律认定在我意料之中

中国边疆“北方第一所”：9名民警守护“生命禁区”

辟谣！网传“封控区管控区相继解封”通知并非西安

河南安阳9日12时至24时新增11例本土确诊病例

老人5折环卫工8折生活困难免费 这家面馆背后有个暖心事

铁路公安以110幅优秀书画作品庆祝人民警察节

本周中东部冷空气频繁 东北等地有降雪

河南新增本土确诊病例60例

“打拐”民警眼里的百态人生：见证一份份不愿放弃的爱

迎腊八北京晴天上线 阵风6至7级体感冻人

多省份倡议春节“非必要不离开”，这地补贴1000元

伪造国家机关证件典型案例发布 有力打击制假贩假行为

15年照顾170多个新生儿 金牌月嫂“漂”到海外去看娃

江歌母亲江秋莲诉刘鑫案一审将于今日宣判

河南省安阳市两地划为高风险地区 一地划为中风险地区

员工迟到一次罚一千引争议 单位惩戒员工法律边界何在？

以体育人 秀出“青年范儿”

保安、厨师曾被竞业限制 企业滥用竞业限制让员工很苦恼

反诈老陈破圈：人民群众在哪 就把反诈宣传开展到哪

一所中职学校的育人实践

绍兴招才引智云对话活动举行诚邀天下英才“会盟”绍兴

江苏省自然资源厅出台指导意见推进老旧小区改造工作

首个锌金属的伴侣蛋白诞生有助于解决缺锌公共卫生问题

科学家首次揭示糖尿病卵母细胞起源有助于减少生育缺陷

去年重庆回收废弃农膜1.4万吨农膜回收率达89.31%

浙江鉴湖国家湿地公园规划发布打造乡村数字旅游

如何避免成为“买而不做”的“装备党”祝杰

　　“影子”般的缉毒警：一线工作22年，我知道坏的是毒品不是人性　　如果我不继续干，别人也要干，缉...

　　1月5日14时30分许，广东肇庆市端州区一男子赵某毒驾连撞5车，致一人死亡。　　1月10日，澎湃新闻(ww...

　　中新网南昌1月10日电 (冷峥嵘张一怡)江西省共青城市人民法院10日发布消息称，近日，该院依法审结...

　　中新网西宁1月10日电 (记者孙睿)记者10日从青海省商务厅获悉，青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关入境需网上预约

　　中新社防城港1月10日电 (翟李强)自2022年1月10日零时起，广西东兴口岸和边民互市贸易区恢复人员、...

天津米面油存量由20天提高至30天超市菜市场进货量翻倍

兰州名师话“美育”：“尚乐立人”分层培优以“美”润教

重庆姐弟被生父扔下坠亡案上诉期结束一审法院暂未收到两被告人上诉状

天津：划定封控区全市开展全员核酸检测

老人5折环卫工8折生活困难免费这家面馆背后有个暖心事

本周中东部冷空气频繁东北等地有降雪

迎腊八北京晴天上线阵风6至7级体感冻人

伪造国家机关证件典型案例发布有力打击制假贩假行为

15年照顾170多个新生儿金牌月嫂“漂”到海外去看娃

河南省安阳市两地划为高风险地区一地划为中风险地区

员工迟到一次罚一千引争议单位惩戒员工法律边界何在？

以体育人秀出“青年范儿”

保安、厨师曾被竞业限制企业滥用竞业限制让员工很苦恼

反诈老陈破圈：人民群众在哪就把反诈宣传开展到哪

各地严惩恶意欠薪保障农民工及时拿到工资

中学生成剧本杀行业潜在消费人群多方助推行业“净化”

琉璃河遗址两段铭文共证北京三千年建城史

琉璃河遗址两段铭文共证北京三千年建城史

河南郑州调整五地为中风险区域公路入郑需核酸检测阴性证明

《传奇2》网游著作权纠纷案峰回路转最高法五份裁决四份改判一份发回重审

“团圆”行动刑侦专家吕游每一个案例都有单独的技术方案

开考古书店日均两三个顾客流量时代她决心仍是只卖书

“520”南京消费券又来了用真金白银为推动消费市场加油