您的位置 首页 科技

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

出品|搜狐科技作者|郑松毅千呼万唤下,Gemini 3来了!北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。

出品|搜狐科技

作者|郑松毅

千呼万唤下,Gemini 3来了!

北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。

相较于早期试探性的“小步快跑”,Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍,“它不仅是全球领先的多模态理解模型,更是迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型——而这一切都构建在最先进的推力能力之上。”

看过Gemini 3评测表现的网友纷纷表示,“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。”

不给对手机会,碾压式领先重夺王位

刚一发布,Gemini 3几乎霸榜所有评测集,以1501分的成绩重夺LMArena大模型竞技场第一,反超昨日马斯克xAI才发布的Grok 4.1模型。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

展开全文

从测试结果不难看出,凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro,且对OpenAI最新模型GPT-5.1呈“碾压”式领先。

其中,在“人类终极考试”中,Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中,Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中,以23.4% 达到了最先进水平,在数学领域为前沿模型树立了全新标杆。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。

在AI界的图灵测试“ARC-AGI-2”中,Gemini 3 Pro拿下31.1%的高分,远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式,能够在从未见过的任务模式下进行推理,而非凭借死记硬背。

OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”,马斯克表示“干得很好”。

即日起,Gemini全面融入谷歌的产品生态,这也是Google首次在产品发布当日就将Gemini 引入搜索。此外,Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。

从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。

本次Gemini 3 Pro的深度思考版本模型尚未全面开放,但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示,将在未来几周向Google AI Ultra订阅者开放,目前还在安全评估。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

对于Gemini 3的发布,皮查伊有信心地认为,“这是一款能将用户任何想法变成现实的模型。”

知识学习、运动教练、游戏开发样样通

透过测试成绩,再来看看Gemini 3具体能做些什么。

Gemini 3可以编写代码来可视化托卡马克中的等离子体流动,并能创作一首诗来捕捉聚变的物理原理。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

如果有用户想学习家族传统菜肴,Gemini 3可以解读并翻译不同语言的手写食谱,生成可与家人分享的食谱。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

如果用户想学习一个新领域知识,可以把学术论文、讲座视频等素材一并喂给Gemini 3,它可以生成交互式记忆卡片、可视化或其他格式的代码,以帮助掌握相关知识。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

Gemini 3甚至还可以充当教练角色,观看打球运动视频以指出可以改进的地方,并生成训练计划。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

搜索模式下,现在使用 Gemini 3 可以实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟,所有这些都是根据查询即时生成的。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

此外,Gemini 3还能够编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界、更具实用性的网页等。

一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?

在极客论坛,一众前端开发者感叹,“Gemini 3不仅能高效写代码,还能够理解审美,动画效果恰到好处,确实令人生畏。”

全新智能体开发平台亮相,新一轮竞争打响

2025 年 AI 行业“模型即智能体”热潮席卷全球,将大模型从被动的 “预测引擎” 升级为主动的 “行动实体”,赋予模型自主决策和执行能力。

然而,尽管玩家扎堆入局,to C 智能体产品却普遍面临“叫好不叫座”的困境,鲜有产品能实现可靠好用的用户体验,其背后考验的是基础模型推理、工具运用与任务规划的综合硬实力。

Gemini 3可以说率先完成了突破,成了第一个在模型界面完成融入通用Agent能力,并且支持执行多种复杂任务的产品。

Gemini团队介绍,“Gemini 3的工具使用能力相比2.5 Pro提升了30%,不仅意味着它能更准确地选择正确工具使用,更重要的是,它能理解什么时候需要不同工具组合来完成复杂任务。”

本次发布中,Google还带来了全新Agent开发平台——Google Antigravity。

借助Gemini 3的高级推理能力、工具使用和智能编码能力,Google Antigravity将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。

尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表开发者自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

结尾谷歌提到,Gemini 3 是迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性,更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。

Gemini 3的胜利还有一点是值得一提的:训练完全基于自家TPU,当全世界的 AI 公司都在苦苦等待英伟达 GPU 发货时,Gemini有着肆意扩张参数的底气。

随着Gemini 3加入模型“角斗场”,Google向世界宣告王者归来,也让AI真实地朝着人们期待的方向迈出显著一步。显然,围绕大模型的新一轮竞争已全面打响。

本文来自网络,不代表大火龙新闻网立场,转载请注明出处:/69835.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部