
AI拓展世界模型,具身智能走入现实
为了让AI更全面地认识和理解世界,2025年涌现了大量关于多模态AI的讨论和探索,预计2026年业界会进一步探索具备原生架构和物理模拟能力的多模态世界模型,推出能够正确理解并模拟真实世界规律的能力。北京智源人工智能研究院院长王仲远表示,世界模型的价值在于模拟真实的人脑认知方式,理解物理常识、时间、空间等基本的世界运行规律,使得AI可以更好地解决人类眼中简单但机器至今难以处理的问题。
2025年具身智能呈现出百花齐放的盛况,不过2026年可能出现很大改观。报告中指出,当前中国共有超过230家具身智能企业,其中人形机器人企业超过100家,产业力量颇具规模。不过在全球经济形势动荡、资本投入日趋谨慎的大环境下,2026年具身智能领域可能会迎来一轮洗牌。采用 “通用开源大模型+运动控制”模式,在单场景下进行操作优化的企业可能仍有空间,但后续的进化仍受制于上游基础模型的演进;具身小脑尝试在传统运控算法之上,通过提升操作侧的泛化能力来应对特定场景下的非标问题,不过由于适配实际环境困难,距离落地商用仍然较远。报告认为应考虑引入世界模型,并在仿真或现实中通过强化学习机制进行自我修正,形成自我进化的新路线。
随着技术逐渐成熟,报告预计人形机器人有望在2026年进一步迈进真实世界。比如Tesla Robotics发布Optimus 2.5人形机器人已应用于工厂生产、农场运营等场景,蚂蚁集团旗下的灵波科技自研具身基础大模型、服务机器人Robbyant-R1已在餐饮、导览、医疗问答等生活服务领域投入应用。据悉,业内已出现多笔亿级订单,人形机器人销量已突破万台,跨入初步商业化阶段。
多智能体崛起,科学智能亟待推进
随着AI应用深入复杂场景,从单智能体到多智能体的升级将成为必然。报告中指出,多智能体系统能够更好地适应复杂工作流,并通过自我反思、互相辩论以降低幻觉。从认知科学的视角出发,群体的认知能力总和通常会超越该群体中最聪明的个体。有学者已经证明了多智能体系统在复杂任务上相对单智能体系统具有明显优势。为加快多智能体的发展,2026年,Agent之间的通信协议将在各大厂商的推动下逐渐成熟,进而走向生产场景实践阶段。
在科研领域,2025年出现了AI Scientist——一种能够模拟乃至自主执行 “假设提出、实验设计、数据分析、结论推断” 完整科研链路的智能体系统,这不仅是科研效率的量变,更是科学发现模式的质变。这背后有三大技术引擎驱动:一是科学基础模型提供了理论基础,又通过对海量科学文献、数据的分析,形成了对特定科学问题的内在理解;二是代理工作流将理解能力转化为行动力,使AI系统能够像人类科学家一样,自主规划并执行复杂的多步骤研究任务,灵活调用数据库、模拟器和文献检索等外部工具;三是AI的认知能力接入自动化实验设施,完成了从数字模拟到真实实验验证的闭环,使得AI自主下的科学发现成为可能。针对这一趋势,美国在2025年11月启动了”创世纪计划(Genesis Mission)”,决定搭建集成化的AI实验平台、建立跨部门的协调机制、建立高效的科学数据共享机制,以AI技术加速科研进程。
报告中指出,中国在AI for Science领域还没有做出及时反应。目前中国在AI应用方面占据相对优势,但在支撑AI for Science落地的算力、数据与模型三大基础设施维度仍面临不同程度的挑战。算力基础设施方面,受限于国外限制和国产替代缺口短期难以弥补等问题,整体储备不及美国;数据方面,中国逐步建立起以中科院带头、教育部、交通运输部等下属研究所参与的国家科技资源共享服务平台 – 国家基础学科公共科学数据中心,进展良好;模型层面,中国的科学基础模型稍显滞后,亟待各方资源倾斜和整合。
个人应用日益成熟,行业应用有待继续探索
2025年AI个人应用发展迅猛,”多行业API接入+基础模型”的模式成为主流,业界更倾向于发展“AI超级应用”,打破各种app之间的藩篱,为个人用户提供“一站式”的服务。比如2025年11月,ChatGPT上线了Buy it in chatgpt功能,该应用打通了多个电商平台和支付平台,让用户可以用一句话启动流程,直达最符合心意的商品,并在ChatGPT应用内完成下单操作。报告中指出,AI超级应用需要极高的算力支撑,且依赖庞大的存量用户进行模型数据迭代,因此需要对巨头企业更为有利,且有望催生出AI时代的新巨头。
围绕AI行业应用,国内外已经进行了大量探索,比如对话类AI在客户服务、代码辅助、营销等场景下趋于成熟,不过更复杂的自主决策AI Agent应用仍处于探索阶段。报告中预计,2026年AI行业应用将迎来“低谷期”,大量探索中的项目会走向失败,原因包括欠缺高质量数据、多智能体不够成熟、成本过高等等。报告指出,数据质量和既有系统集成是迫切需要解决的问题,安全则是必要条件,然后才是成本、多智能体的演进等问题,而这一切需要AI产业联合各方共同予以解决。
“合成数据”破解资源难题,AI安全有迹可循
AI技术的持续演进需要高质量的数据做学习、训练,但高质量文本数据预计会在2026年耗尽,低质量文本数据以及视觉数据预计会从2030年起逐步耗尽,这种资源短缺将推动AI技术路线从“堆数据”转向”合成数据 + 强化学习”。Frost&Sullivan披露的信息表明,中国合成数据市场规模在短短四年间从11.8亿元跃升到47.6亿元,预计到2030 年,全球合成数据的体量将正式超越真实数据,成为模型训练的主导性燃料和战略性资产。比如特斯拉正在与清华大学合作研发OccWorld4D,在完全由世界模型生成的仿真环境中测试极端路况,替代传统的真实场景实验。科学探索与具身智能领域也将越来越多地采用合成数据,包括在虚拟世界中瞬间完成亿万次分子生物学试验,通过仿真来改进机器人设计。
从依赖真实数据到更多地采用合成数据,世界模型与强化学习将是两把关键钥匙,前者是生成极具价值数据的引擎,强化学习则是大幅降低数据毒性的过滤器,二者结合可以为AI技术的进化提供充足的合成数据。
随着AI的大范围应用,AI的安全性逐渐受到关注。Future of Life Institute发布的报告表明,全球领先的大模型在”防范灾难性滥用或失控”方面都表现欠佳。基于大模型构建的 Agent不仅继承了大模型本身的安全风险,还增加了记忆等外部模块的不稳定性,以及模块和模块间、模块和工具间、工具与工具间通信过程中的安全风险。为此业界在2025年开展了一系列研究,一方面采用了基于多智能体系统的自演化攻防演练方法,另一方面尝试主动从内部读懂AI。比如蚂蚁集团构建起了”线上服务攻防对抗,线下终端安全加固”的技术体系,360则构建了类脑分区协同安全大模型架构,快速识别威胁和攻击行为。

微信扫一扫打赏
支付宝扫一扫打赏
