
划重点
1.VLA未必是终局,但现阶段效果最好。
2.无论合成数据还是仿真数据,都无法真正适配真实场景的复杂需求,最终还是要依赖真实数据,采集成本已做到马斯克团队的1/10。
3.中美模型差距没那么大,国内能追上,但中国的供应链和应用场景优势,美国短期难赶超。
出品|搜狐科技
作者|郑松毅
编辑|杨锦
当多数人还将00后视为“新生代”时,这个群体已在具身智能赛道扛起大旗。出生于2001年的灵初智能联合创始人陈源培,正是这股年轻势力的典型代表。
从华南理工土木调剂生跨界RoboMaster全国冠军,从北大杨耀东门下的学术探索者到斯坦福 “AI 教母” 李飞飞的门徒,再到拒绝华为 “天才少年” 邀约、以最年轻 AI 创业者身份跻身福布斯榜单,陈源培的每一步都在突破边界。
这位00后少年凭借超越年龄的行业清醒,将目光锁定灵巧手核心技术,在这家“科学家密度最高” 的具身智能创企,其团队将真实数据采集成本降至马斯克公司的 1/10,破解了行业数据瓶颈。公司更是剑指2026年百万小时级全球最大灵巧手操作数据集,力求打造具身智能领域的 “ChatGPT”。
凭借 “学术大牛+产业老兵” 的跨代团队优势,灵初智能2024年成立即获高瓴创投、蓝驰创投领投的天使轮融资,且跻身英伟达初创加速计划,与智元机器人达成深度合作。
00后创业如何平衡技术理想与商业落地的现实?亲历中美顶尖科研体系,如何看待两国具身智能的发展差异?近日,搜狐科技与陈源培展开深度对话,解码年轻力量背后的技术野心与产业思考。
以下为对话精编:
一、从跨专业到成为李飞飞门徒创业
搜狐科技:你从放弃土木工程跨界机器人,到拒绝斯坦福深造和华为 “天才少年” 橄榄枝选择创业,这些选择在你看来算不算冒险?
陈源培:回头看其实都挺冒险的,当时也没有想那么多。转过行或者专业的人都知道,重新学一个东西还是挺需要勇气的。很多节点可以说是能力和运气的叠加,不能说我每次选的都是对的,很多时候也是运气不错。
搜狐科技:你本科读的是华南理工土木工程,后来是怎么加入北大杨耀东老师团队的?
陈源培:当时在打RoboMaster竞赛,我们战队水平还是比较强的。刚好看到杨老师回国任教,就主动联系了一下,没想到聊得很投缘。
搜狐科技:也就是说,你虽然学的是土木,但私下一直在自学机器人算法相关知识?
陈源培:对,平时上课我基本坐在最后一排写代码,考前两周才会翻书备考。
搜狐科技:你曾在美国师从 “AI 教母” 李飞飞,在你眼里,她是一位怎样的老师?
陈源培:经验丰富,且很有耐心。虽然在业内已很出名,也在忙于创业,但仍会在教育一线给学生提供指导。
搜狐科技:作为福布斯榜单上的00后创业者,创业过程中是否有人因你的年龄、非博士学历提出能力质疑?
陈源培:会有。自我认同感很重要,要对自己的能力和判断有信心。
很多人拿学历说事其实是一种偏见,我发表的论文数量并不少,对行业的认知也不比别人差。这种刻板印象确实存在,但我觉得无所谓。
搜狐科技:作为00后创业者,你觉得年轻一代在具身智能领域的优势是什么?
陈源培:学习能力。在AI时代,对新事物的学习能力甚至比专业能力还要重要。哪怕是行业大佬,也需要不断学习新知识,不然是跟不上的,AI出来后把很多东西都颠覆了。
二、为什么做灵巧手?
搜狐科技:为什么会选择做灵巧手?马斯克认为手部是通用机器人的“终极接口”,你怎么看这个说法?
陈源培:马斯克说的非常到位。我刚接触灵巧手是在2022年,当时世界上几乎还没有什么人做。最初的原因说出来可能出乎意料,唯一的理由就是觉得灵巧手很帅,后来发现强化学习能在(五指)上面做一些非常灵巧的操作,就一直做下来了。
搜狐科技:有业内人士说“让机器人后空翻需1年,可拧好瓶盖要10年”。你觉得做好灵巧手的挑战在于什么?
陈源培:后空翻、跳舞这类动作的核心是预设轨迹的精准复现,对应的是人体小脑的功能,执行已经规划好的动作,不需要复杂的环境反馈和决策。
而灵巧手的核心任务是与未知物体的交互,比如抓握鸡蛋、拧瓶盖、分拣零件,对应的是人体大脑的功能——整合视觉、触觉、力觉信息,进行判断、决策和实时调整,而不是简单的动作执行。
搜狐科技:所以业内如何评判什么是好的灵巧手?看灵活度、精度还是别的?
陈源培:这是个很好的问题。从技术上说,高精度和视触觉融合是下一代灵巧手竞争的关键。但这里存在一个技术悖论:增加了自由度,就要损失稳定性;增加了精度,就要损失动态响应特性。所以整体而言,落地好用是评判的第一标准,其他指标可以根据实际场景需求再优化。
三、VLA值得做吗?
搜狐科技:当前具身智能行业面临 “数据缺口” 瓶颈,行业对合成数据和真实数据的应用存在分歧,灵初智能为何坚定押注真实数据?
陈源培:终局一定还是要依赖真实数据,无论是合成数据还是仿真数据,都会在数据迁移到机器人身上时出现embodiment gap(具身差距)问题,无法真正适配真实场景的复杂需求。
搜狐科技:但真实数据采集成本高昂的问题怎么解?
陈源培:灵初近期发布的Psi-SynEngine,从便携式手套硬件、到数据管线、再到跨本体迁移算法,提供整套完整方案。设备方便分拣工、快递员等不同职业的人随身穿戴,能在低成本情况下完成数据规模化采集,成本约为马斯克团队的1/10。
搜狐科技:你们计划明年将数据集规模扩展到百万小时级别,这是什么概念?达到这个规模后,对训练具身智能大模型会带来什么质的变化?
陈源培:基本可以说是全球最大的灵巧手数据集了,然后会拿它来训练基础模型——构建具身智能领域的ChatGPT。
搜狐科技:业内对分层架构、VLA、世界模型的技术路线也存争议,王兴兴称 VLA 是 “傻瓜式结构”,依赖数据而非因果逻辑,灵初为何坚持 VLA 路径?
陈源培:VLA未必是终局,但现阶段效果最好。现在整个行业的数据规模还没起来,谈架构都是空谈。再过个三五年,有了足够数据,才能验证选出哪个架构更强。
四、行业‘过热’了吗?
搜狐科技:国内现存数十家灵巧手玩家,行业存在“过热”(泡沫)迹象吗?
陈源培:肯定有。新兴行业初期共识分散,后期趋同扎堆,泡沫是发展必然,很正常。
搜狐科技:未来3年,行业会是“赢家通吃”,还是保持多玩家竞争格局?
陈源培:“赢家通吃”。软硬件技术路线都会收敛,例如谁先拥有大规模的数据占据生态位,后面就会更有优势。
搜狐科技:机器人已“进厂打工”,ToC家庭场景规模化落地还要多久?
陈源培:至少10年。
搜狐科技:兼具中美技术视野,你认为中美机器人行业有技术分野吗?谁更具优势?
陈源培:差异源于国情,美国主攻模型突破,中国强在制造与应用。中美模型差距没那么大,国内能追上;但中国的供应链和应用场景优势,美国短期难赶超。机器人赛道拼的场景与软硬件相耦合,中国优势非常大。

微信扫一扫打赏
支付宝扫一扫打赏
