您的位置首页科技

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

wczz1314 2025年11月19日 16:57 阅读(3) 评论(0)

出品｜搜狐科技作者｜郑松毅千呼万唤下，Gemini 3来了！北京时间11月19日，Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品，早在10月就已在业内掀起波澜，如今终于揭开面纱。

出品｜搜狐科技

作者｜郑松毅

千呼万唤下，Gemini 3来了！

北京时间11月19日，Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品，早在10月就已在业内掀起波澜，如今终于揭开面纱。

相较于早期试探性的“小步快跑”，Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍，“它不仅是全球领先的多模态理解模型，更是迄今为止最强大的智能体（Agentic）和氛围编程（Vibe Coding）模型——而这一切都构建在最先进的推力能力之上。”

看过Gemini 3评测表现的网友纷纷表示，“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。”

不给对手机会，碾压式领先重夺王位

刚一发布，Gemini 3几乎霸榜所有评测集，以1501分的成绩重夺LMArena大模型竞技场第一，反超昨日马斯克xAI才发布的Grok 4.1模型。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

展开全文

从测试结果不难看出，凭借领先的推理能力和强大的多模态功能，Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro，且对OpenAI最新模型GPT-5.1呈“碾压”式领先。

其中，在“人类终极考试”中，Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中，Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中，以23.4% 达到了最先进水平，在数学领域为前沿模型树立了全新标杆。

除了文本能力，Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩，在 Video-MMMU 上达到 87.6%。同时，该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分，展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。

在AI界的图灵测试“ARC-AGI-2”中，Gemini 3 Pro拿下31.1%的高分，远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式，能够在从未见过的任务模式下进行推理，而非凭借死记硬背。

OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”，马斯克表示“干得很好”。

即日起，Gemini全面融入谷歌的产品生态，这也是Google首次在产品发布当日就将Gemini 引入搜索。此外，Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。

从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。

本次Gemini 3 Pro的深度思考版本模型尚未全面开放，但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示，将在未来几周向Google AI Ultra订阅者开放，目前还在安全评估。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

对于Gemini 3的发布，皮查伊有信心地认为，“这是一款能将用户任何想法变成现实的模型。”

知识学习、运动教练、游戏开发样样通

透过测试成绩，再来看看Gemini 3具体能做些什么。

Gemini 3可以编写代码来可视化托卡马克中的等离子体流动，并能创作一首诗来捕捉聚变的物理原理。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

如果有用户想学习家族传统菜肴，Gemini 3可以解读并翻译不同语言的手写食谱，生成可与家人分享的食谱。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

如果用户想学习一个新领域知识，可以把学术论文、讲座视频等素材一并喂给Gemini 3，它可以生成交互式记忆卡片、可视化或其他格式的代码，以帮助掌握相关知识。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

Gemini 3甚至还可以充当教练角色，观看打球运动视频以指出可以改进的地方，并生成训练计划。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

搜索模式下，现在使用 Gemini 3 可以实现新的生成式 UI 体验，例如沉浸式视觉布局、交互式工具和模拟，所有这些都是根据查询即时生成的。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

此外，Gemini 3还能够编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界、更具实用性的网页等。

一文看懂谷歌最新模型Gemini 3：不靠英伟达，发布即屠榜，马斯克、奥特曼夸赞；看谷歌为何会成股神巴菲特的“最后一舞”？

在极客论坛，一众前端开发者感叹，“Gemini 3不仅能高效写代码，还能够理解审美，动画效果恰到好处，确实令人生畏。”

全新智能体开发平台亮相，新一轮竞争打响

2025 年 AI 行业“模型即智能体”热潮席卷全球，将大模型从被动的 “预测引擎” 升级为主动的 “行动实体”，赋予模型自主决策和执行能力。

然而，尽管玩家扎堆入局，to C 智能体产品却普遍面临“叫好不叫座”的困境，鲜有产品能实现可靠好用的用户体验，其背后考验的是基础模型推理、工具运用与任务规划的综合硬实力。

Gemini 3可以说率先完成了突破，成了第一个在模型界面完成融入通用Agent能力，并且支持执行多种复杂任务的产品。

Gemini团队介绍，“Gemini 3的工具使用能力相比2.5 Pro提升了30%，不仅意味着它能更准确地选择正确工具使用，更重要的是，它能理解什么时候需要不同工具组合来完成复杂任务。”

本次发布中，Google还带来了全新Agent开发平台——Google Antigravity。

借助Gemini 3的高级推理能力、工具使用和智能编码能力，Google Antigravity将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。

尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境（IDE），但其智能体已被提升到一个专属的界面，并被赋予直接访问编辑器、终端和浏览器的权限。现在，智能体能够代表开发者自主规划和执行复杂的端到端软件任务，并在此过程中自行验证代码。

结尾谷歌提到，Gemini 3 是迄今为止最安全的模型，并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性，更高的抗提示注入能力，并强化了抵御网络攻击滥用的保护措施。

Gemini 3的胜利还有一点是值得一提的：训练完全基于自家TPU，当全世界的 AI 公司都在苦苦等待英伟达 GPU 发货时，Gemini有着肆意扩张参数的底气。

随着Gemini 3加入模型“角斗场”，Google向世界宣告王者归来，也让AI真实地朝着人们期待的方向迈出显著一步。显然，围绕大模型的新一轮竞争已全面打响。

本文来自网络，不代表大火龙新闻网立场，转载请注明出处：/69835.html

0赞

作者: wczz1314

发表回复取消回复