1957年,在一场国际会议上,一位男士通过操作机械臂,为打字员女士点燃了一支香烟,这个机器臂名叫Atomic Robot a Handy Guy(原子机器人),是第一个能完成复杂操作的机器人,这场带有“真人秀”性质的表演被视为人类历史上机器操作的起源。
Atomic Robot a Handy Guy 视频来源:网络
1966-1972年,斯坦福研究院研发出了一台名为Shakey的机器人,它可以尝试简单的英文指令,如“Push the box off the platform.(将盒子推下平台)”,并且遇到障碍能转身、见到旗帜能停车。这是人类历史上第一次尝试让机器人理解语言指令并行动,这台小车也被视为机器人“有思考能力”的开端。
除了灵巧手和人形机器人,灵初智能还配套发布了全国首个高自由度高度拟人灵巧手数采设备PsiBot DC 1和具身灵巧操作量身定做的数据平台Psi Data。PsiBot DC 1确保了真机数据的1:1映射采集,Psi Data则在灵初智能建设高质量数据飞轮的过程中起到了至关重要的作用。
灵巧手数采设备PsiBot DC 1,图源:灵初智能
目前,绝大多数的大模型还停留在网络上给网友画画、聊天,却不能打破屏幕,走到现实世界里。根本原因是这些大模型克服不了模态鸿沟,无法理解自身的动作,难以和环境动态交互。和环境交互的能力不仅仅是推理智能的体现,更是对具身智能体的根本要求,灵初智能自研的Psi R1模型第一次实现了CoAT(Chain of Action Thought),能够将动作模态融入大脑思考的一环中,真正实现了具身思考,并与环境进行高质量高速度的交互。
回顾具身智能的发展历程,从1957年需要人来操控Atomic Robot a Handy Guy,到1966年笨拙的Shakey,再到今天灵初智能可以弹钢琴、打麻将的机器人,大家见证了人类对赋予机器"感知-思考-行动"能力的不懈追求。这半个多世纪的旅程,是从单一能力到多模态融合的蜕变,也是从简单指令实行到复杂环境理解的跃升。