技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

10款大模型做北京中考数学题，4款国产大模型表现超ChatGPT

时间：2024-09-30分类：人工智能作者：TechWeb.com.cnAI导航网

6月26日消息，2024年北京市初中学业水平考试今天结束，中考数学向来是学生和家长关注的重点，而数学试卷主要考查学生对初中数学主干知识的掌握情况和在知识学习过程中核心素养的发展情况。

此前，我们曾用“9款大模型做高考数学题”，但是效果一般。

现在，降低难度，用大模型做北京中考的数学题，它们的表现又如何呢？

选取百度文心一言、阿里通义、腾讯元宝、字节豆包、chatgpt，百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi，好未来九章大模型总计10款大模型来答题。

其中，零一万物万知PC端不支持上传图片/拍照，这里采用了万知微信小程序来参与答题。

一共选择数据卷中的3道题进行测试。

1、选择题

正确答案：A

2、填空题

正确答案：

第一空 60

第二空 C-A-B-D

3、解答题

正确答案：符合。因为改造后A类物质排放量为34mg/km，小于标准要求的不超过35mg/km。

统一测试方法：在大模型对话框输入上述3道题的图片，大模型进行图片识别后，再进行答题，最终看答题结果是否正确。解答题除了看结果外，还要考察解答过程是否正确。

测试结果如下：

1、九章大模型、元宝、百小应、智谱清言答对3问，表现较好；

2、通义、豆包、Kimi、chatgpt答对2问；

3、文心一言、万知小程序只答对1问。

下面附上各AI产品对三道题的答题情况：

文心一言3.5解答结果

1

2

3

通义

1

2

3

元宝

1

2

3

豆包

1

2

3

百小应

1

2

3

万知

1

2

3

智谱清言

1

2

3

Kimi

1

2

3

九章大模型

1

2

3

1

2

3

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：ChatGPT Mac版应用已向所有用户开放下一篇：一键处理阴影、脏污等十余个图像问

相关推荐

外媒：库克和苹果亟需在中国找到AI合作伙伴

10月25日消息，苹果公司首席执行官蒂姆·库克（Tim Cook）本周对中国进行了访问，这已是他今年第二次到访中国。

作者：网易科技时间：2024-10-25

小鹏AI天玑5.4.0全球首发，智驾云端大模型竞争拉开序幕

10月24日消息，今日，在小鹏P7+AI智驾技术分享会上，小鹏汽车副总裁、自动驾驶负责人李力耘博士、小鹏汽车智能体验负责人于桐，分别介绍了小鹏端到端大模型的技术优势，和首发搭载在小鹏P7+上的AI天玑5.4.0版本。与此

作者：TechWeb.com.cn 时间：2024-10-24

现代起亚与首尔大学等设立机器人研发实验室专注于可移动的双臂机器人

10月24日消息，据外媒报道，现代汽车集团旗下的现代和起亚这两家公司在当地时间周三宣布，他们已同首尔大学、浦项科技大学和韩国科学技术研究院，联合设立了机器人研发实验室。

作者：TechWeb.com.cn 时间：2024-10-24

苹果阐述分阶段发布Apple Intelligence原因：隐私优先，逐步实现智能化服务升级

苹果公司的软件主管Craig Federighi近日在接受媒体采访时，详细阐述了对Apple Intelligence功能的发布策略。他解释了为何这一功能将分阶段推出，以及苹果在这一过程中所秉持的理念和策略。

作者：TechWeb.com.cn 时间：2024-10-24

AI手机看荣耀：荣耀MagicOS 9.0正式发布，开启手机自动驾驶新时代

10月23日，荣耀在MagicOS 9.0发布会及开发者大会上正式发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0，推出全新自研魔法大模型家族，并宣布YOYO助理正式升级为YOYO智能体。发布会上，荣耀全新智能

作者：TechWeb.com.cn 时间：2024-10-24

让AI像人类一样操作电脑！Anthropic上新Claude 3.5 Sonnet模型新能力

10月23日消息，OpenAI竞争对手Anthropic宣布推出升级版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。

作者：TechWeb.com.cn 时间：2024-10-23

OceanBase 4.3.3发布 CEO杨冰：一体化数据库是AI时代的数据底座

10月23日消息，随着AI技术发展，越来越多的AI应用不再局限于纯文本来生成回答，涉及的数据类型日益复杂，并且常存储于IT架构的不同数据库中，这对数据库提出了新的要求，包括提升性能与响应速度，要求数据库处理和存

作者：TechWeb.com.cn 时间：2024-10-23

ColorOS 15体验：系统丝般润滑 AI随叫随到

十月，这个充满科技气息的月份，无疑成为了各大手机厂商激烈角逐的战场。10月9日，联发科(MediaTek)顺应AI时代的潮流，推出了全新的5G旗舰AI芯片——天玑9400。这款芯片的亮点之一就是其NPU（神经网络处理单元）的算

作者：TechWeb.com.cn 时间：2024-10-23

Claude 3.5深夜觉醒，编程干翻o1，Agent一夜变天

编辑：编辑部 HYZ 太科幻了，深夜上线的Claude，可以像人类一样使用计算机了？查看屏幕、移动光标、点击按钮、输入文本，还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈，下一个爆破点，就是AI操作电脑！

作者：新智元时间：2024-10-24

AIGC时代如何打击图片造假诈骗？合合信息文档篡改检测有妙招

近日，第七届中国模式识别与计算机视觉大会（简称“PRCV 2024”）在乌鲁木齐举办。大会由中国自动化学会（CAA）、中国图象图形学学会（CSIG）、中国人工智能学会（CAAI）和中国计算机学会（CCF）联合主办，新疆大学承

作者：编程之家时间：2024-10-22

小编推荐

苹果市值2025年有望达4万亿美元