AI浪潮如何赋能人形机器人?

证券之星   2023-08-23 11:01:58

8月16日至21日,2023世界机器人大会在北京举行。大会期间,北京市政府发布了《北京市机器人产业创新发展行动方案(2023—2025年)》,提出着眼世界前沿技术和未来战略需求,加紧布局人形机器人,带动医疗健康、协作、特种、物流四类优势机器人产品跃升发展。

机器人的应用场景可谓极其广泛,人形机器人自然也不例外,在小米集团高级副总裁曾学忠的设想里,未来的智能制造体系中,70%的工作由自动化设备来完成;20%应当由仿真机器人来完成;剩下的10%需要人来完成。


(相关资料图)

今年以来,在AI浪潮的推动下,AI+人形机器人带来的“具身智能”受到了市场关注。工业和信息化部副部长徐晓兰表示,以人形机器人和通用人工智能为代表的新技术、新产品、新业态蓬勃发展,正成为全球科技创新的制高点。

人形机器人前景广阔

机器人的发展跟随制造业自动化程度不断提升,从最早的单任务起重机式臂到机器人,再到能够与人直接交互的协作机器人,再发展到与人工智能结合的人形机器人。

受全球劳动力缺口持续扩大影响,人形机器人替代带动巨大市场需求,东吴证券预计,在特斯拉人形机器人标杆引领作用下,全球在2025年初步实现人形机器人商业化,实现销量2万-3万台。到2030年,新增需求100万台,2035年销量有望突破1000万台。

随着人形机器人技术的不断发展和应用场景的不断拓展,市场规模有望不断扩大,其中,核心零部件方向是多家机构预计受益的重点方向。具体而言,人形机器人身体核心零部件可以分为谐波减速器、行星滚柱丝杠、伺服电机三部分;手部核心零部件可以分为空心杯电机、微型行星齿轮箱两部分。

结合2030年人形机器人需求数量,西南证券测算,五大核心零部件的市场空间于2030年市场规模如下:

1)谐波减速器:单台机器人谐波减速器数量为14个,2030年单价有望降到600元,乐观/中性/悲观情景下市场空间分别为168/126/67亿元;

2)行星滚柱丝杠:单台机器人行星滚柱丝杠数量为14个,2030年单价有望降到2000元,乐观/中性/悲观情景下市场空间分别为560/420/224亿元;

3)伺服电机:单台机器人伺服电机数量28个,2030年单价有望降到300元,乐观/中性/悲观情景下市场空间分别为168/126/67亿元。

4)空心杯电机:单台机器空心杯电机数量为12个,2030年单价有望降到400元,乐观/中性/悲观情景下市场空间分别为96/72/38亿元;

5)微型行星齿轮箱:单台机器人行星滚柱丝杠数量为12个,2030年单价有望降到200元,乐观/中性/悲观情景下市场空间分别为48/36/19亿元。

据国际机器人协会预测,2021年到2030年,全球人形机器人市场规模年复合增长率将高达71%。中国电子学会数据显示,到2030年,我国人形机器人市场规模有望达到约8700亿元。

I如何赋能“具身智能”?

从产业角度考虑,人形机器人是AI和机器人两大产业的共同发展方向,是技术、制造、服务三个核心能力的交汇点,也是软硬件跟AI技术融合的制高点。目前,人形机器人的硬件主要包括五部分:

1)感知系统,相当于机器人的“五官”,包括声音、光、温度、压力、定位、接触等传感器,用以将外部环境信号转换为机器人可以理解的信息或数据;2)驱动系统,相当于机器人的“肌肉”,电机驱动包括电机、减速器、编码器等;3)末端执行系统,相当于机器人的“手”,用以和外界环境进行交互;4)能源供应,电源或电池;5)运算系统及软件,相当于机器人的“大脑”。

各大科技巨头纷纷推出AI大模型,有望解决人形机器人的通用性问题。AI大模型对人形机器人的赋能可以从语音、视觉、决策、控制等多方面实现,形成感知、决策、控制闭环,使机器人具备常识。国泰君安认为,具体可以分为三个方向:

1)语音:语言大模型为机器人的自主语音交互难题提供了解决方案,在上下文理解、多语种识别、多轮对话、情绪识别、模糊语义识别等通用语言任务上,ChatGPT显著优于深度学习,表现出了不亚于人类的理解力和语言生成能力。

2)视觉:人形机器人的场景相对工业机器人更通用、更复杂,通用视觉大模型的All in One的多任务训练方案能使得机器人更好地适应人类生活场景。大模型的强拟合能力使人形机器人在进行目标识别、避障、三维重建、语义分割等任务时,具备更高的精确度;通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,提升场景泛化效果。

3)决策:基于多模态的预训练大模型将增强机器人可完成任务的多样性与通用性,让其不局限于文本和图像等单个部分,而是多应用相容,拓展单一智能为融合智能,使机器人能结合其感知到的多模态数据实现自动化决策。

多个难题依旧待解

在AI浪潮下,2023年,人形机器人受到了不同以往的密集关注,商业化落地的大方向是有的,但目前,产业发展还面临着诸多挑战。

清华大学交叉信息研究院院长姚期智指出,目前人形机器人还面临三个发展问题:首先,机器人还需要像大语言模型一样拥有一个具身模型,一步到位做好最底层的控制;其次,在计算能力方面,即使是谷歌的Robotic Transformer模型,也只能达到3个赫兹水平,距离真正需要的500个赫兹还有很大差距;此外,机器人多模态的感官感知融合和数据收集方面,还有大量的挑战和问题。

在AI部分,通用大模型本身并不是给通用人形机器人使用的,即使目前通用大模型已经能很好地处理文本或者基本文字逻辑,但是它对环境的认知和感知能力基本是零,无法认知物理环境,也没法抓取做操作,需要新的模型来训练。

除此之外,硬件性能与成本的平衡也是一大问题。

星动纪元创始人陈建宇表示,对硬件来说,行业希望机器人同时兼顾力量、速度、精度以及成本,但是目前所有技术都无法同时兼顾这几项,例如液压的技术速度和力量都很强,但是它成本太贵。

而高减速比谐波技术,可能精度比较高,但是灵巧性又降低;而新的转制期技术虽然成本比较低,但是却牺牲了载荷和精度,因此现在还没有一个能够兼顾所有达到满意的情况。

至于“具身智能”真正落地的时间,陈建宇表示,当前人形机器人、通用机器人还处于一个刚刚开始的阶段,问题不会很快得以解决,这是比较长期的过程,可能是5-10年,也可能更长。

热文榜单