您的位置 首页 科技

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

出品|搜狐科技作者|郑松毅大模型王位,再次易主。数小时前,马斯克旗下人工智能公司xAI放出最新模型Grok 4.1,主打“智商情商双在线”,正面硬刚GPT-5.1。

出品|搜狐科技

作者|郑松毅

大模型王位,再次易主。

数小时前,马斯克旗下人工智能公司xAI放出最新模型Grok 4.1,主打“智商情商双在线”,正面硬刚GPT-5.1。

据xAI介绍,本次Grok 4.1共有两个版本:Grok 4.1 Thinking(推理)和Grok 4.1(非推理)。目前,Grok 4.1已向全网用户开放,可在Grok官网、X平台以及iOS和Android应用中免费体验。

从测试结果看,在公认大模型排名榜单LMArena中,Grok 4.1 Thinking以1483分的成绩一举加冕全球大模型之王,超越Gemini 2.5 Pro 31分。而非推理模式的Grok 4.1,也直接杀到榜单第二。

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

值得一提的是,Grok 4.1的情商进步明显,具备了更高的理解力、洞察力、同理心和人际交往能力。

展开全文

在情商测试EQ-Bench3中,Grok 4.1 Thinking以1586分的成绩同样霸榜,Grok 4.1位居第二,排名第三的是国产模型Kimi K2。

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

从实测效果看,对比上一代Grok模型,Grok 4.1变成了一位更具耐心的倾听者,且共情能力凸显。细节的是,还在回复结尾位置比了个心。

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

此外,Grok 4.1的创意写作能力较上一代足足提升了600分,语言表达流畅有画面感。而且,基于训练方法的优化,模型幻觉率比之前降低了3倍(从12.09%降至4.22%)。

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

据介绍,为实现上述提升,xAI在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征。并且,xAI开发了全新方法,能够利用前沿智能体式推理模型作为奖励模型,从而实现大规模自主评估和迭代响应。

xAI负责后训练的Dustin Tran分享了更多细节,他表示,新模型的改进主要在强化学习上,将RLHF推向了前所未有的新高度。

“在过去的几个月里,我们由十几个人组成的团队利用用户在真实对话中的偏好,以及基于强大推力能力进行评分的智能体奖励模型,对强化学习的算法进行了全面改进。此外,我们还将强化学习的规模扩大10倍。”

作为AI赛道的后起之秀,xAI能取得今天的成绩与老马的人才战略也密不可分。最近xAI的团队合影在社交平台疯传:满屏望去清一色黑头发黄皮肤的华人面孔。另有消息称马斯克已经辞退了Grok团队的最后一名白人成员,硬是把团队打造成了“全华班”。

马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”

比起Grok 4.1,很多人更好奇为何宣传已久的Grok 5迟迟不来?

有报道称,“xAI 推迟发布Grok 5,部分原因在于开发过程中遇到的资源限制和极其严格的测试需求。”

马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok 5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。因此,Grok 5的全面测试和开发工作需要更多时间才能达到预期的高标准,将在明年发布。”

整体来看,本次Grok 4.1的发布不仅是技术迭代,也是马斯克AI战略的强力宣言,为 Grok 5和最终实现AGI目标铺设道路。但也有业内人士认为,“它仍可能不是今年最好的模型型号,等着看谷歌即将发布的Gemini 3.0模型表现。”

本文来自网络,不代表大火龙新闻网立场,转载请注明出处:/69502.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部