“人形机器人训练的问题归根结底就是数据的问题”。多位采访对象向新京报贝壳财经记者表达了相似的观点。
从不同企业近期的一些战略布局动作来看,数据的重要性正在提升。3月17日,傅利叶正式开源全尺寸人形机器人数据集Fourier ActionNet,并发布全球首个全流程工具链,首批上线超3万条高质量真机训练数据;3月10日,智元机器人正式发布首个通用具身基座大模型—智元启元大模型(GenieOperator-1),借助人类和多种机器人数据,让机器人获得学习能力;1月9日,银河通用机器人发布端到端具身抓取基础大模型GraspVLA,利用合成数据学习测试。
萨摩耶云科技集团AI机器人行业研究员郑扬洋认为,“数据未来会成为拉开企业差距的重要因素,拥有高质多样化数据集的企业,能在训练、优化机器人模型上取得优势,提高自己的市场竞争力。”
供具身大模型学习的数据远低于通用大模型可学习的数据
从行业发展的历史来看,人形机器人并不是一个新鲜的事物,但在ChatGPT发布以后,市场将AI带来的想象空间和具身智能进行了结合,希望大模型可以赋予机器人更高的智能水平,热度开始上涨。
人形机器人本质上是一个智能体,要想做出和人类一样的动作,需要庞大的数据作为训练的基础,培育出性能优秀的具身智能大模型,机器人才有可能实现泛化的能力。
“我们可以随意拿起一个水瓶或者咖啡杯,但对机器人来说,这是两个完全不同的物体,用多大的力,摩擦系数的大小是多少都不一样,这些都是需要机器人通过学习的数据计算而来。”银河通用机器人公司某算法工程师告诉贝壳财经记者。
大语言模型之所以可以快速发展,和数据量充足有着直接关系,网络上的文本、图片、视频以及各种公开资料都是模型可以学习的。但到具身大模型领域,可供学习的数据并不多。
清控金信资本高级投资经理万安在接受贝壳财经记者采访时指出,“机器人训练所需要的是对三维空间的运动描述的数据,而现在这些可供机器人学习训练的数据量远远不够。”
“具身智能大模型的发展远落后于通用大模型的发展。”宇树科技创始人王兴兴曾公开表示。
但如今各家企业已经开始发力解决“数据饥渴”的问题。傅利叶将开源全尺寸人形机器人数据集Fourier ActionNet,据介绍,该数据集囊括了傅利叶GRx系列所有机型的各类任务训练,完整记录机器人在真实环境中的任务执行数据;智元机器人此前发布的智元启元大模型将结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解;银河通用机器人将利用仿真数据进行训练学习。
去年12月底,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出了一个大规模多构型具身智能数据集和Benchmark——RoboMIND,支持多本体任务并具备通用性。
“数据集可以通过提供高质量的训练数据提升机器人的性能和适应性,降低开发成本,推动行业标准化和技术创新,从而加速机器人企业的商业化进程。”郑扬洋指出。
既要比拼数据类型,又要比拼数据成本
虽然各家企业在使用哪种数据进行训练的方面有不同选择,但他们共同需要考虑的一个问题就是数据的成本问题。过去数据采集的成本居高不下,人力、物力以及时间成本都制约了高质量数据的获取。
据相关媒体报道,2024年8月,特斯拉为了解决数据不足的问题开始招聘了“数据收集操作员”,具体工作时间则是“三班倒”,预期时薪为25.25美元至48美元。特斯拉的Optimus(擎天柱,特斯拉开发的一款人形机器人)社交媒体账户曾发布过一段视频,展示了该岗位的具体工作内容,在视频中,一名操作员穿着动作捕捉服,戴着触觉手套和VR头显拾取物体,而虚拟版特斯拉Optimus机器人则执行相同的动作。
万安告诉贝壳财经记者,“现在最大的成本就来自人力成本,动作数据的复杂程度很高,要实现预期的训练效果需要海量高质量数据。例如一个简单的‘倒水’动作就需要学习几百条数据。”
在郑扬洋看来,除高成本之外,数据采集还存在数据质量参差不齐,如不同传感器存在采样精度差异的问题,行业缺乏数据集的处理标准,对数据的处理方法不一将导致数据难以共享和通用。
相较于具身大模型的发展和突破,机器人硬件本体的创新会相对更加容易一些。宇树科技之所以可以在这一次机器人热浪中受到较高的关注,就在于本体的运动控制。王兴兴曾指出,因为有了四足机器狗的技术积累,做人形机器人相对来说会比较容易,硬件等一些零部件是可以通用的。
多位受访者将当下人形机器人的发展阶段与早期自动驾驶技术的发展进行类比,丰富海量的数据和足够的算力是自动驾驶技术得以普及的关键因素。人形机器人未来想要普及,数据的突破至关重要。
“不同企业之间在训练数据上不仅要比拼数据类型,还要比拼数据成本。至于数据类型和成本哪个更重要,取决于企业的需求和应用场景。”郑扬洋认为。
在她看来,仿真数据的采集成本相对较低,但可能需要额外的资源来缩小仿真与现实之间的差距,企业在选择数据采集方式的同时,也需要考虑到成本的影响,在采集方式和成本之间找到平衡。数据将会成为未来拉开企业差距的重要因素。
但万安也坦言,“现在数据的收集还处在较为初期的阶段,这些数据在人形机器人实际操作落地的阶段将会起到哪些作用,还没有看到显著的差异化,还需继续观察。”
新京报贝壳财经记者 张晗
编辑 陈莉
校对 柳宝庆