您的位置 首页 通讯

刚刚!AI大牛股,重磅发布!四大创新来袭,多家国产芯片“入列”

今日下午,“全球大模型第一股”智谱正式发布了GLM-5技术报告。智谱表示,GLM-5能够实现性能的大幅跃升,主要得益于四大技术创新。GLM-5在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。

今日下午,“全球大模型第一股”智谱正式发布了GLM-5技术报告。智谱表示,GLM-5能够实现性能的大幅跃升,主要得益于四大技术创新。GLM-5在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。

股价表现方面,周五(2月20日),智谱股价单日大涨42.72%,报725港元/股,股价再创新高,总市值达3232亿港元,上市43天股价累计涨幅已超500%。消息面上,在发布GLM-5后,由于供不应求,智谱宣布上调GLM Coding Plan套餐价格,中国区涨价30%,海外版涨价超100%。

智谱最新发布

2月22日下午,据智谱官微消息,智谱推出了GLM-5,这是一款旨在推动编程范式从“VibeCoding”(氛围编程)转向“AgenticEngineering”(智能体工程)的下一代基础模型。GLM-5在前代模型GLM-4.5的智能体、推理与编程(Agentic,ReasoningandCoding,ARC)能力基础上,采用稀疏注意力(DeepSeekSparseAttention,DSA)以大幅降低推理成本,同时保持长上下文能力无损。

刚刚!AI大牛股,重磅发布!四大创新来袭,多家国产芯片“入列”

为了让模型更好地与各类任务对齐,智谱构建了一套新型异步强化学习(RL)基础设施,通过将生成过程与训练过程解耦,从而大幅提升了后训练的迭代效率。此外,智谱还提出了全新的异步Agent强化学习算法,进一步提升强化学习的效果,使模型能够更有效地从复杂、长程交互中学习。

智谱称,基于上述创新,GLM-5在主流的开放基准测试中实现了SOTA性能。最关键的是,GLM-5在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。

智谱指出,GLM-5在性能与计算效率上实现了跃升,不仅在ArtificialAnalysis.ai、LMArena文本与代码等主要榜单中均达到SOTA水平,更重塑了真实世界的编程标准。它突破了SWE-bench等传统静态测评的考察边界,在处理复杂的端到端软件开发任务时,展现出了前所未有的强大能力。

四大技术创新

展开全文

据GLM-5技术报告,GLM-5能够实现性能的大幅跃升,主要得益于以下四大技术创新:

第一,引入DSA稀疏注意力机制(DeepSeekSparseAttention,DSA)。这一全新架构极大降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此, 智谱将模型参数规模成功扩展至744B(7440亿),同时将训练Token规模提升至28.5T(28.5万亿)。

第二,构建全新的异步RL基础设施。基于GLM-4.5时期slime框架“训练与推理解耦”的设计, 智谱的新基建进一步实现了“生成与训练”的深度解耦,将GPU利用率推向极致。该系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。

第三,提出全新的异步AgentRL算法。该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中, 智谱研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。

第四,全面拥抱国产算力生态。从模型发布伊始,GLM-5就原生适配了中国GPU生态。 智谱已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。

智谱表示,“凭借上述进步,GLM-5不仅是一个更强大的模型,更是下一代AI Agent 更高效、更实用的基础模型。我们向社区开源GLM-5,以进一步推动高效的、面向 Agent 的通用人工智能的发展。”

智谱致歉

昨日(2月21日)晚间,智谱在“智谱开放平台”微信公众号发布GLM Coding Plan致歉信,并公布处理和补偿方案。

智谱称,这次改版主要犯了三个错:规则透明度不够、GLM-5灰度节奏太慢、老用户升级机制设计粗糙。

据了解,GLM Coding Plan上线即售罄,国产AI编程模型的付费套餐被抢空,在行业中颇为罕见。

需求火爆导致GLM Coding Plan的用户体验受到影响。在致歉信中,智谱解释称,其近期遭受灰产号池和黄牛党冲击,恶意占用了公司大量资源。同时,GLM-5发布后,流量超出预期,公司扩容节奏没有跟上,不得已将GLM-5按照Max、Pro、Lite的顺序逐步开放。

目前Max用户已经全面开放,Pro用户虽已开放,但高峰期可能会因集群负载较高遇到限流,Lite用户将会在节后非高峰期逐步灰度开放。

针对受到影响的Lite和Pro用户,智谱支持自主申请退款。

此前在2月12日,智谱发布新一代旗舰模型GLM-5,并在海外走红。在Coding与Agent能力上,GLM-5取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus4.5,擅长复杂系统工程与长程Agent任务。

在发布GLM-5后,由于供不应求,智谱宣布上调GLM Coding Plan套餐价格,中国区涨价30%,海外版涨价超100%,成为国内首家对大模型商业化服务进行提价的AI原生企业。

责编:杨喻程

排版:汪云鹏

校对:苏焕文

本文来自网络,不代表大火龙新闻网立场,转载请注明出处:http://522051.cn/98836.html

作者: wczz1314

为您推荐

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部