熊蓉:人形机器人走进家庭,距离尚远
作者 何昕晔
发表于 2025年5月

继大模型之后,“具身智能”成为新一轮人工智能浪潮中最热的概念。有不少人认为,AI只有具备了物理层面的身体,像人类一样用身体去感知世界,在与环境的互动学习中成长,才能进化成通用人工智能(AGI)。

人形机器人被认为是具身智能的理想载体。人们期待未来的机器人不仅能说话,还能对复杂任务作长程动作规划并高效执行。

浙江人形机器人创新中心主任、浙江大学教授熊蓉是国内最早一批做人形机器人研究的学者。她专攻这一领域已有二十多年,曾自主研制出乒乓球对打机器人、小型足球机器人等系统,也经历了从“仿人机器人”到“人形机器人”的技术演变。

在熊蓉看来,目前很多强调具身智能概念的人形机器人,还不具备独立完成任务的智能水平。尽管已经有许多关于人形机器人进入家庭、完成护理工作的美好畅想,但未来机器人率先落地的场景仍将是工业领域,机器人进入家庭还面临安全性等诸多挑战。

熊蓉认为,机器人技术的发展旨在提升工作效率和生活质量,而非取代人类。它能够解决人力短缺问题,满足对工作质量的高要求,并创造新的工作岗位。机器人本质上仍然是工具,其发展目标是解放人类生产力,使生活更加便捷。

Yi YiMagazine

X 熊蓉

Yi 近两年具身智能兴起,其新特征和传统机器人有什么区别?

X 传统机器人在感知方面主要依赖人工特征提取,行为方面主要依赖专家建模的系统和准则,其感知和行为能力受限于预定义的规则,这在很大程度上限制了它们在复杂场景中的泛化能力。本轮大模型技术突破得益于深度学习技术的发展、互联网海量数据的积累以及算力的提升,使得机器人在感知智能上实现了泛化能力的显著提 升。

目前具身智能兴起,其核心在于机器人通过与环境的交互来获取知识,基于场景作出行为决策,并预测行为结果,从而动态调整自身行为,即强调实体机器人通过“感知—推理—交互”的闭环来实现自主作业能力。具身智能的技术进步主要体现在将“感知智能”延伸至“行为智能”,提升机器人的自主决策能力、环境理解能力和交互能力。

Yi 具身智能的兴起是否为机器人产业带来革命性突破?

X 具身智能浪潮的兴起标志着机器人产业步入一个转折阶段,但目前仍处于技术产业化的起始点。实际上,具身智能的技术进步是过去多年各项技术积累的结果。

深度学习技术从2011年开始取得关键突破。2016年,Google利用14台机器训练,开发出能够从料箱中抓取物品的网络。当时的研究尚未使用大模型,但可以被视为行为智能发展的起点。到了2020年,大模型技术逐渐成熟,并迎来爆发式发展。随着大模型技术的融入,机器人在感知、理解和执行能力上取得了很大进步。

但是目前很多强调具身智能概念的人形机器人,其对外展示出的技术能力主要处于demo演示,是小范围场景行为复现。通过仿真平台或者实物数据学习训练行走、操作等交互行为,但目前的技术总体只解决了抗扰动性问题,还不具备我们期望的泛化智能水平。行为执行能力也偏弱,例如,目前许多机器人只能完成抓取、放置和移动等基础动作,而在执行涉及复杂视力触融合的任务(如开盖)时则显得力不从心。

Yi 你在2006年就开发出足球机器人,当时的归类是“仿人机器人”。2024年,你带领的浙江人形机器人创新中心发布领航者2号“人形机器人”。从“仿人机器人”到“人形机器人”,背后的技术路线有何变化?

X 早年我们研发的“仿人机器人”,重点在于模仿人类行为、功能或智能,其外形未必完全拟人化。

本文刊登于《第一财经杂志》2025年5期
龙源期刊网正版版权
更多文章来自
订阅