网站地图官方微信:
网站首页 龙山镇 小将镇 黄洲镇 炬光乡 勐班乡 扎唐镇

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 寒武纪十年首度盈利,股价为何不涨反跌?_国产_芯片_公司 |

    寒武纪十年首度盈利,股价为何不涨反跌?_国产_芯片_公司...

    查看详情>>
  • | 2nm芯片时代全面开启!四强争霸_Rapidus_产能_技术 |

  • | 王兴不想做老登_公司_组织_互联网 |

  • | 美国终于害怕了?稀土价格暴涨68倍,多家美企停工停产_白宫_我国_中国 |

  • | 领克给魅族上眼药_Flyme_整合_系统 |

  • | 黄仁勋彻底杀疯了!英伟达财报炸裂,Q4营收狂增73%_预期_收入_同比 |

  • | 刘强东,要给普通人造游艇!问过普通人了吗_王健林_万达_东哥 |

  • | 苹果主动让步,国区“苹果税”终于降了_Apple_Store_应用 |

  • | AI成为面试官后,大部分的岗位都在被算法凝视_工作_招聘_求职者 |

  • | OPPO,官宣调价!小米要涨价吗?雷军:尽量降低消费者接受难度!业内:手机厂商也是“受害者”,***购成本实在“负担不住”_内存_售价_价格 |

  • | AI美女,正在“击穿”擦边博主的世界_***_CarynAI_内容 |

  • 英伟达在短短三个月内向Nebius和CoreWe***e累计砸下40亿美元,且均剑指2030年超过5吉瓦的算力部署,显示了其AI霸主地位的巩固逻辑:通过资本纽带将新兴AI云厂商深度绑入生态,既锁定了下一代芯片…...

    2026-03-12
  • 网友热衷养AI“龙虾” 全新AI智能体都有哪些本领?_OpenClaw_软件_任务...

    2026-03-11
  • 独家|字节叫停豆包 AI 眼镜,大厂 AI 硬件进入祛魅时刻_项目_Meta_入口...

    2026-03-16
  • 雷军披露:小米机器人已进厂打工,在汽车厂拧螺丝、搬运料箱_螺母_人形_上件...

    2026-03-02

关注我们

添加微信好友,关注最新动态