人工智能的未来发展方向是具身智能+AI大模型。2024年见证了多家初创企业在这一领域的迅速崛起,具有代表性的包括千寻智能、星海图、WorldLabs和穹彻智能(Noematrix)。这些进展预示着具身智能将在未来几年内广泛渗透到人类生活的多个方面。

  千寻智能:千寻智能在成立半年内完成两轮融资,专注于构建高泛化、高通用的人形机器人,利用视觉语言模型ViLa和部件约束模型CoPa解决数据获取难题,并计划将产品应用于商用、服务和家用场景。

  银河通用:银河通用研发了第一个基于机器人单视角视频流的端到端导航大模型。该大模型无需建图、无需除RGB相机外的其它传感器信号,率先验证了具身智能领域的第一个纯视觉“FSD”模型的可行性。该模型的动作数据完全来自于对真实世界的仿真合成,在未用一条真实世界动作数据的情况下,实现了在真实世界中zero-shot的跨场景泛化能力。

  星海图:提出“一脑多形”的概念,其具身基础模型EFM和空间智能引擎RSR实现了从少量演示中学习复杂任务的能力,并成功推出了全尺寸轮式双臂具身本体R1。

  World Labs:由“AI教母”李飞飞联合创办,强调空间智能的重要性。World Labs的首个“世界模型(creating the world)”于12月4日凌晨正式发布,该模型是空间智能技术在现阶段的落地表现形式。它能够通过单张图像生成详细的3D场景,并支持实时渲染和可控相机效果。用户只需提供一张2D图像就能够自动生成一个详细的3D场景。

  穹彻智能:专注于力控智能技术,使得机器人能够在物理环境中执行精确任务。力控智能强调AI系统在物理世界中的感知、推理和交互能力,特别关注力学传感器和控制算法的应用。卢策吾教授指出,真正的力控智能不仅需要强大的算法支持,还需要对硬件有深刻的理解,以实现物理世界的高效操作。

  字节跳动:阿里巴巴原“通义千问”大模型技术负责人周畅离职,随后带领团队加盟字节跳动。根据相关新闻,周畅在字节准备做的事情,可能正是类似李飞飞的“大世界模型”,用一张图片生成一个3D世界。

  军用特种机器人迎合未来战争无人化和智能化的发展趋势。军用机器人能够在复杂战场环境中执行侦察、巡逻、物资运输和战斗支援等任务,有效降低人员伤亡风险,提高作战效率。同时,这些机器人具备自主决策和多场景适应能力,能够在高危区域代替人类完成任务,成为未来智能化战争体系中的重要组成部分。在美国:波士顿动力、帕兰泰尔技术公司、Open AI等知名都宣布与美国军方合作。在中国:从去年开始,中国兵装下场,军工机器人启航。中国军用机器人采用国企+民营模式,“机器狼”引领军用机器人新需求。

  投资建议:具身智能+Ai领域,有望借助大模型赋能多个产品形态的机器人,目前算法训练大多数还是基于视觉算法+Ai大模型,关注视觉算法领域有卡位属性的奥比中光。机器人+军用领域有望成为新兴应用场景,相关军用机器人领域相关公司如建设工业、凌云股份、东华测试;其余民用四足机器人领域,以及受益Ai大模型进步的相关公司如中坚科技

  风险提示:具身智能相关模型算法进步不及预期、军用、民用领域的机器人需求不及预期