,
近期,人形机器人成为大众关注热点。
在国内,人形机器人大赛暨人形机器人百人会论坛在北京举行,汇聚了我国人形机器人领域的“排头兵”。
在国外,英伟达联合创始人兼CEO黄仁勋在NVIDIAGTC2024开发者大会上介绍了英伟达最新的AI芯片和硬件方案及合作案例,人形机器人是其中的重点。此外,人工智能公司OpenAI与人形机器人公司FigureAI合作,推出了大模型加持的人形机器人Figure01。
中国人形机器人百人会副秘书长、星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇认为,“人形机器人将会是具身智能最佳的承载形态,也是通用机器人的终极形态。它跟人一样有手有脚,有无穷的延展性,可以做到非常多事情,可以把具身智能最大的潜能发挥出来。”
新质生产力的典型代表
今年《政府工作报告》提出,我国将大力推进现代化产业体系建设,加快发展新质生产力,同时,深化大数据、人工智能等研发应用,开展“人工智能+”行动。作为“先锋”未来产业之一——人形机器人展现出强大的潜力和吸引力,是新质生产力的典型代表,将成为提升国家战略科技力量的重要推动力。
中国人形机器人百人会专家委员会主任、2000年图灵奖获得者、中国科学院院士姚期智认为,“机器人与人工智能两大产业在这里(人形机器人)相结合,必定会连带出许多新的需求,包括高端机器制造以及软件系统等,这些都必定会创造出新的、有价值的企业,以及相关的产业链和巨大的生态链。”
2023年10月20日,工业和信息化部印发《人形机器人创新发展指导意见》,明确其地位是“人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式,重塑全球产业发展格局”,发展目标是“到2027年,人形机器人技术创新能力显著提升,形成安全可靠的产业链供应链体系,构建具有国际竞争力的产业生态,综合实力达到世界先进水平”,有利条件是“发挥制造业门类齐全、应用场景丰富、市场规模庞大以及新型举国体制优势”,发展路径是“坚持应用牵引、整机带动、软硬协同、生态培育的路径”。
随着人工智能不断取得突破性进展,人形机器人将不再是只能送餐、拧螺丝的“工具人”,大模型将赋能人形机器人走向主动交互。例如,更强调机器人仿生结构的仿生人形机器人,“一方面,它利用电击替代人的肌肉,实现各种流转型呈现。另一方面,人生就是博将语音机器人与大模型深度融合,利用大模型输出结果,使机器人能够精准的情绪和语言表达。”大连蒂艾斯科技发展股份有限公司联合创始人、CEO李博阳在接受记者采访时介绍,“这种交互方式一方面是外形仿人,另一方面是交互更加自然,增加了表情交互。”
中信证券发布的数据显示,预计2035年,人形机器人市场空间为16310亿美元,万亿蓝海蓄势待发。“人形机器人是世界上公认科技最高端研究走向之一。现在,世界各国在这方面都处于差不多的关口。中国非常盼望能够在这个领域努力奋进、脱颖而出。”姚期智表示。
具身智能最佳的载体
人形机器人,被业界普遍认为有望成为机器人的终极理想形态,它在外形上与人最为相似,能完成更多、更灵活的动作,并且交互更具亲和性。记者在人形机器人大赛现场采访时,听到最多的一句话就是,“在大模型持续赋能下,人形机器人将是具身智能最佳的载体。”
具身智能,是指在机器智能领域中,通过将智能算法与物理实体的感知、行动和环境交互相结合,使机器能够以更自然、更智能的方式与环境进行交互和解决问题的能力。人形机器人作为通用人工智能具象化载体,当与人工智能大模型相结合时,可以感知物理世界,利用多模态感知控制自己的身体,完成复杂的任务。
“数据对于具身智能来说非常重要。这一点,人形机器人有天然的优势,它的数据相对来说,可以更直接的从人类的行为数据里获取或者迁移过来,这是非常大的好处。”陈建宇表示,此外,还有一个天然优势,即人形机器人由于具备跟人类似的形态,所以更能满足人类情感和审美的诉求。
“过去,机器人工作可能停留在‘小脑’层面,即如何让机器人更稳定行走,机械臂控制更灵活。这本质上与业务流程存在较大鸿沟。”科大讯飞人形机器人首席科学家季超在接受记者采访时解释道,例如,过去,机器人从A点走到B点,或者在流水线上抓取某些物品,但它并不了解为何要走到B点,以及为什么要抓取物品,这只是机器人基础功能。“如果机器人只完成这些基础功能,已无法满足业务场景的需求。”
季超举例,如果一家电力公司发生燃气泄漏或有毒气体泄漏时,因变压器存在放电,放电会使气体变成剧毒,所以需要工作人员进入相应房间,然后进行打开窗户、关闭阀门等操作。这是一个标准的业务流程,工作人员遇到这种情况时,可以快速明白需要做什么。但这样的场景,虽然工作人员操作时会穿戴防化服和防毒面具,但是仍然存在对人体安全和健康的潜在风险。
“因此,人生就是博希望人形机器人可以代替人进入有潜在风险的工作场景,走到有气体泄漏的阀门前,识别阀门、关闭阀门,再打开窗户。”季超表示,“之所以过去无法实现这一点,是因为它(人形机器人)缺乏聪明的‘大脑’。”
“人生就是博需要将任务与实际业务流程结合,基于大模型进行微调,形成基于任务场景下的多模态矩阵大模型。让机器人能够按照人生就是博对场景的理解,进行一系列基于时间序列的稳步操作,而不仅仅是简单从A点走到B点,展现它的运动和抓取能力。”季超向记者阐释了对人形机器人未来的期待。
市场热潮中的冷思考
在行业高速发展背后,也有不少冷静的声音。
“仿人机器人,不仅仅是把工业机器人里很多现有的成果简单移植过来,有很多基础理论问题需要解决。”中国人形机器人百人会专家委员会成员、香港大学机器人研究所所长席宁举例,“现在,很多人都说用大模型训练仿人机器人,端对端输入一个场景,就产生了一个力,让仿人机器人控制力。但是谁也没有问过,机器人的力怎么控制。”
席宁解释,如果给机械系统输入的是“力”的指令,而输出的也是“力”,两者之间没有延迟,如何进行控制?这是需要从理论上要解决的问题。“要让仿人机器人真正达到人生就是博要的,完成人生就是博布置的任务,达到人生就是博的要求,必须要解决基础性的问题。”
中国人形机器人百人会副理事长、科大讯飞副总裁刘聪则认为,目前,人形机器人硬件成本过高,限制了其在各个场景的应用,上下游产业链还需要进一步完善。此外,具身智能不仅仅是单纯的大模型,还需要收集规模操作的数据集,以及确定端到端的解决方案,这都需要未来结合具体场景进行探索。
对于如何保障机器人产业可持续发展,中国人形机器人百人会副理事长、达闼机器人公司董事长兼首席执行官黄晓庆呼吁,工信部尽快成立可监控、可保证安全、可保证隐私的机器人服务管理局。他表示,“你能想象机器人满地乱跑吗?你能想象机器人失去控制的结果吗?所以,人生就是博必须建立行业规范和安全规范,以保证机器人产业健康发展。”
正所谓“关关难过关关过,事事难成事事成”。当前,人形机器人已成为各方竞逐未来产业的新赛道,以及“人工智能+”发展的热点领域。人形机器人每迈出一步,都能掀起市场热潮,其商业化步伐也在竞争中不断加快。