AI大模型加持下,人形机器人正成为工厂新“打工人”

近年来伴随着机器人控制、智能传感、人工智能等技术的迅速发展,特别是AI大模型与生成式AI技术的突破式发展,人形机器人已成为多方竞逐未来产业的新赛道,并推动人形机器人的技术跃升与商业化落地。而且,AI大模型的加持,也为人形机器人进厂“打工”提供了强大的技术支持,开启了智能制造的新篇章。
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              
北京时间2024年3月13日深夜,一段由OpenAI投资的美国人形机器人初创公司Figure AI上传的视频开始在社交媒体平台上热传。视频显示,在OpenAI的视觉语言模型(VLM)的多模态能力赋能之下,Figure 01人形机器人可以与人类对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。这也被视作人形机器人实现智能化的重要突破。
 
 
事实上,近年来伴随着机器人控制、智能传感、人工智能等技术的迅速发展,特别是AI大模型与生成式AI技术的突破式发展,人形机器人已成为多方竞逐未来产业的新赛道,并推动人形机器人的技术跃升与商业化落地。
 
而且,AI大模型的加持,也为人形机器人进厂“打工”提供了强大的技术支持,开启了智能制造的新篇章。近期,Apptronik、Figure AI、优必选、Agility Robotics等多家人形机器人企业宣布其人形机器人已经进厂“打工”。
进厂“打工”的人形机器人
2024年3月16消息,德国车企梅赛德斯-奔驰(Mercedes-Benz)宣布与通用仿人机器人开发商Apptronik达成重要协议,将引入Apollo人形机器人到其工厂,主要从事搬运、装配零部件等繁重的低技能劳动,以测试人形机器人在汽车生产中的应用以及执行各种任务的能力。
图1 Apollo人形机器人(来源:Apptronik)
时间再往前,2024年2月22日,国内“人形机器人第一股”优必选对外透露,其工业版人形机器人Walker S已经在蔚来的汽车工厂进行“实训”。“实训”任务包括移动产线启停自适应行走、鲁棒里程计与行走规划、感知自主操作与系统数据通信与任务调度等。
 
2024年1月25日,在均胜集团2024年度盛典上,由均普人工智能与人形机器人研究院主导研发的名为贾维斯JARVIS(Joyson A Robot Vibrant Intelligent System,均胜机器人动态智能系统)的人形机器人首次亮相。而且,机器人贾维斯在均普智能工厂工作的视频也出现在其年度盛典现场。
 
图2 JARVIS人形机器人(图源:均普智能)
2024年1月18日,美国人形机器人公司Figure AI与宝马达成重要合作,将其第一款人形机器人Figure 01送入宝马位于美国南卡罗来纳州的斯巴坦堡汽车工厂进行试点应用,主要替代人类从事一些危险度高的任务。
 
2023年10月,亚马逊宣布在其位于西雅图南部的物流中心中尝试性引入Digit人形机器人进行应用测试,期待利用机器人来提高仓库内部的操作效率,进而推动配送服务的加速与提升。Digit是亚马逊投资的新创公司Agility Robotics开发的人形机器人产品。而且,2023年12月,全球最大的第三方合同物流供应商GXO Logistics也宣布引入Digit在佐治亚州Flowery Branch的SPANX工厂进行物流任务测试。
 
图3 Digit人形机器人(截图自Agility Robotics官方视频)
当然,将人形机器人送进工厂打工的,并不只是以上所提到几家人形机器人企业。公开资料显示,包括波士顿动力(Boston Dynamics)、智元机器人(AGIBOT)、特斯拉(Tesla)也都有表达过类似想法,或展示过人形机器人在制造业工厂的相关应用。
 
这实际上得益于人形机器人所具备的独特优势。特别是在人形机器人融合应用AI大模型技术之后,能够适应于制造业工厂广泛且复杂的场景和任务。
人形机器人在制造业工厂的应用
人形机器人,简单理解就是具有人的形态,能够完成人类肢体能完成的运动、作业,并具有类人的感知、学习和认知能力的机器人。“人形”被业界普遍认为有望成为机器人的终极理想形态,它在外形上与人最为相似,能完成的动作更多、更灵活,并且交互更具亲和性。
 
人形机器人是“具身智能”(Embodied AI)的重要载体。“具身智能”是指是在机器智能领域中,通过将智能算法与物理实体的感知、行动和环境交互相结合,使机器能够以更自然、更智能的方式与环境进行交互和解决问题的能力。人形机器人作为通用人工智能具象化载体,当与AI大模型相结合时,可以感知物理世界,利用多模态感知控制自己的身体,完成复杂的任务。
 
在制造业,与传统的工业机器人相比,人形机器人的优势在于不再需要根据预先规划来完成特定任务,而是通过感知周边环境进行理解、学习并做出决策,且不再受限于单个场景,在AI大模型技术的加持之下,拥有非常强的自主决策、柔性操作和交互能力。
 
综合来看,目前人形机器人在制造业工厂的典型应用主要包括物品搬运、拾取和放置、质量检测、贴标、装配、智慧巡检、高危作业等。
 
物品搬运:例如,特斯拉CEO马斯克在2022年AI Day上正式发布人形机器人“擎天柱(Optimus)”原型机时,就展示了人形机器人在汽车工厂搬运箱子的视频。在亚马逊仓库,Agility Robotics开发的Digit人形机器人,主要用于帮助仓库员工拾取和移动空手提箱。Apptronik公司推出的首款商用人形机器人Apollo,在演示视频中也展现出了其具有拿起、搬运、放下物体的能力,能够在仓库中搬运货物。此外,在波士顿动力(Boston Dynamics)发布的视频中,其人形机器人Atlas能够抓起比自己手臂还粗的汽车部件,搬运到目标位置。

图4 人形机器人Atlas抓取和搬运汽车配件

(来源:波士顿动力)

物品分类:Tesla Optimus官方号曾在X平台上分享了一段视频,展示了人形机器人“擎天柱”可执行各种任务,包括自动按颜色对方块进行分类。
图5 Optimus人形机器人进行物品分类(来源:特斯拉)
质量检测、贴标:在优必选官方微信视频号曝光的工业版人形机器人Walker S实训视频中,Walker S就在蔚来工厂参与了门锁质检、车灯盖板检测、安全带检测、贴标等工作。以在汽车前后门锁的质检为例,Walker S搭载了定制化AI质检管理系统,可以对汽车门锁进行实时图像采集与传输,门锁状态无误,Walker S则会在系统上标注“OK”。
 

图6 工业版人形机器人Walk S正在贴标

(来源:优必选)

装配作业:人形机器人通过灵活多变的机械手臂和精细的手指运动,能够用于完成各项装配任务,实时调整策略应对不确定因素,保证组装质量。
 
智慧巡检:人形机器人通常都搭载多种先进传感器和高清摄像头,具有高度的灵活性和自主导航避障能力,能够在复杂的环境中自主巡逻,灵活通过狭小或高空区域进行视觉检查,全方位监控周边环境,及时发现异常情况并进行报警。而且,也能通过激光雷达、红外摄像头、传感器、机械臂、通讯定位等功能辅助救援工作。
 
高危作业:在危险或恶劣的环境中,人形机器人可以用于代替人类执行任务,有效降低人身安全风险。
 
业内人士普遍认为,人形机器人在工业制造领域具有巨大的应用潜力和空间。据媒体公开报道,优必选创始人、董事长兼CEO周剑就曾表示,智能制造将成为人形机器人首个大规模应用的领域,人形机器人将重新定义AI时代的工人,把人从重复性的劳动中解脱出来。均普智能董事长周兴宥也在公开场合表达过类似观点。他指出,人形机器人的主要应用领域将在服务业,但在智能制造领域也潜力巨大。比如,人形机器人与工业大脑相连,可以代替工人从事一些巡检、装配、搬运等工作,人形机器人与产线实现“人”机有机融合。
不断进场的人形机器人企业
如果从1967年“仿人机器人之父”加藤一郎带领日本早稻田大学启动人形机器人WABOT研发项目开始算起,人类对人形机器人的研究已走过了半个世纪。然而,实际上直到2022年特斯拉首秀“擎天柱”Optimus之前,人形机器人的研究进展都相当缓慢。在这一过程中,日本早稻田大学、日本软银集团、Aldebaran Robotics、本田公司、波士顿动力、国内的国防科技大学等都堪称人形机器人研究的先驱。
 
随着2022年特斯拉在人工智能日(AI Day)上首次展示了“擎天柱”(Optimus)人形机器人产品,以及2022年11月OpenAI的大语言模型ChatGPT横空出世,人形机器人的研发才驶上快车道,并吸引人形机器人企业不断进场。
据不完全统计,目前国外主要的人形机器人研发企业包括Boston Dynamics(波士顿动力)、特斯拉、1X Technologies、Figure AI、Agility Robotics、Apptronik、Kawasaki Heavy Industries(川崎重工业株式会社)等。其中,Figure AI成立于2022年,自成立以来获得了多轮融资,已成为炙手可热的人形机器人明星企业之一。Figure最近的一次融资发生在2024年2月,其获得了来自亚马逊创始人杰夫·贝索斯(Jeff Bezos)以及微软、英伟达、OpenAI等大型科技公司的约6.75亿美元融资,目前估值已达26亿美元。
 
国内方面,目前主要的人形机器人研发企业包括优必选、傅利叶智能、开普勒、智元机器人、星动纪元、逐际动力(LimX Dynamics)、达闼科技、小米科技、小鹏汽车、宇树科技、MagicLab、均普智能、科大讯飞、蒂艾斯科技(EXrobots)、天太机器人、钛虎机器人、中国电科21所、 戴盟机器人(Daimon Robotics)、钢铁侠科技、纯米科技、乐聚机器人、帕西尼感知科技等。
 
通过分析可以发现,这其中绝大部分为人形机器人初创公司或人形机器人领域的新入局者。例如,智元机器人由华为“天才少年”稚晖君(本名彭志辉)于2023年2月联合创立,并于2023年8月发布首款人形机器人“远征 A1”。星动纪元由清华大学交叉信息研究院孵化,正式成立于2023年8月。傅利叶智能虽成立较早,但前期主要聚焦于康复机器人领域,2023年才发布其首款通用人形机器人GR-1。均普智能在2023年半年报首次提出将重点关注并积极布局人形机器人新领域,并在2023年9月正式设立人工智能与人形机器人研究院,首款人形机器人贾维斯(JAVIS)则于2024年1月首次亮相。
而且,国防科技大学、清华大学、浙江大学、北京理工大学、哈尔滨工业大学等国内高校也在开展人形机器人研究。其中,国防科技大学于2000年成功研制我国第一台仿人型机器人“先行者”,实现了机器人技术的重大突破。清华大学开发的THBIP-Ⅰ型和THBIP-Ⅱ自主式仿人机器人样机系统,可实现样机的平地行走和上下楼梯等动作。浙江大学控制科学与工程学院开发的仿人机器人“悟空”系列,可进行人-机、机-机对打乒乓球,目前正朝着实用化应用方向不断迭代和改进。北京理工大学研制的“汇童6”人形机器人,实现了“走、跑、跳、摔、滚、爬”多模态运动。

图7 人形机器人“悟空”亮相2023世界机器人大会

(来源:北京科技报社)

人形机器人领域的入局者还在增加。例如,博实股份就曾于2023年3月发布公告称,与哈尔滨工业大学签订了《战略合作框架协议》,共同设立人形机器人关键技术及原理样机产业化研发项目,并在未来共同推进相关技术成果和产品的产业化。2023年12月底,天奇股份与优必选下属全资子公司共同出资设立的合资公司无锡优奇机器人科技有限公司完成工商登记注册手续。据介绍,合资公司将依托双方优势,率先打造适用于汽车制造场景的人形机器人整机,未来将逐步拓展至汽车零部件、3C、智慧物流等其他智能制造领域及应用场景。随着人形机器人的商业化加速,韩国三星电子也开始关注人形机器人的开发,并研究制定进入机器人市场的战略。而且,OpenAI、微软、谷歌、英伟达、Meta、亚马逊、科大讯飞等科技公司由于在人工智能领域拥有深厚的技术积累,而人形机器人是具身智能的重要载体,近年来也纷纷加入人形机器人赛道。此外,智能手机制造商VIVO也表示,基于在大模型技术和混合现实技术上的积累,会顺势切入人形机器人领域。
规模化进厂仍需时日
然而,值得注意的是,虽然进入人形机器人赛道的“玩家”不断增多,而且人形机器人已经开始进厂“打工”,但是在制造业工厂的商业化落地和应用上,当前仍还处于探索验证阶段。
 
据介绍,优必选将工业版人形机器人Walk S送入蔚来工厂“实训”,并不是订单交付,因此还不属于正式落地应用。而人形机器人Figure 01在宝马斯巴坦堡工厂的“打工”生涯将从“少量工作”开始。随着时间推移,这些由AI驱动的人形机器人才会加入到更多的制造工作,包括箱子搬运、拾取和放置任务、托盘装载等工作。考核期结束后,未来12-24个月的时间,Figure 01集成到宝马的制造流程中,包括车身车间、钣金和仓库等工区。
 
这表明,人形机器人虽然已经展现了在制造业工厂的巨大应用空间和潜力,但离规模化进厂还为时尚早。实际上,短期内人形机器人大规模产业化的条件还并不成熟。高昂的成本以及技术上的瓶颈,是当前人形机器人企业需要着力解决的问题。
 
目前,人形机器人的造价都不菲,这取决于其高昂的硬件成本。有数据显示,波士顿动力的Atlas人形机器人,其预估成本就超过了20万美元。而高昂的造价实际上也是导致波士顿动力商业化落地缓慢,进而公司被屡经转卖的主要原因之一。在“远征 A1”智元具身智能机器人产品发布会上,稚晖君曾表示其长远目标是硬件成本控制在20万元以内。而据中泰证券研报数据,人形机器人BOM(物料)成本以远期20万元单价测算,单台人形机器人的核心零部件总价值量就达约10万元,其中力、视觉等传感器单机总价值量为2.3万元,滚动、滑动轴承对应单机总价值量分别为4200-9600元、750-1500元,无框电机为4.2万元,滚珠丝杠为2.1万元。
 
但即使硬件成本控制在20万元以内,以目前能实现的应用来看,人形机器人也并不具备价格优势。以目前制造业工厂正在越来越多应用的协作机器人为例,在市场高度“内卷”的情况下,如今协作机器人的价格最低已下探至万元以内。协作机器人同样能完成目前人形机器人在制造业工厂所能完成的作业任务,如物品配送与转运、物品拣选与分类,拾取与放置、操作机械、质量检测等;装上移动底盘,协作机器人化身移动复合机器人,还能满足更多复杂应用及细分场景需求。此外,自ChatGPT横空出世后,包括节卡、越疆科技等协作机器人企业以及微软、谷歌、阿里巴巴等科技企业也在积极探索AI大模型与协作机器人的融合应用,以实现更加智能化的应用。
 
技术上的瓶颈,也是制约人形机器人在制造工厂批量化应用的“拦路虎”。
双脚站立要比四足行走难得多。双足人形机器人需要解决平衡性问题,要能够实现稳定的步态控制,具备良好的避障能力。从目前的各形机器人产品发布会或演示视频可以看出,跑步、跳跃、后空翻、爬坡、爬楼梯、跳舞也是其展示的重点,同时也有部分企业推出了轮式人形机器人产品,这表明人形机器人的平衡性问题正在逐步被攻克。但是,人形机器人所面临的技术瓶颈也不限于此,也还包括运动协调性、感知、决策智能以及续航等问题。而且,人形机器人的安全性标准和操作规范等也需要建立和完善,以确保人机共存环境下的安全。
 
此外,人形机器人在AI大模型融合应用以及人机交互能力上,也仍有提升空间。虽然在Figure AI最新上传的视频中,在OpenAI的视觉语言模型(VLM)的多模态能力赋能之下,Figure 01人形机器人可以与人类对话,理解人类的意图,以及根据人的自然语言指令执行任务,并解释自己为什么这么做,在智能化方面取得了重大突破,但在人机交互流畅性和体验上仍有提升空间。而且,人形机器人需要理解复杂的人类语言和非语言交流信号,并做出适当的反应,才能更加胜任制造工厂的场景应用。
 
不过,正所谓“关关难过关关过,事事难成事事成”。如今,人形机器人已成为各方竞逐未来产业的新赛道,以及“人工智能+”发展的热点领域。2023年11月,工信部出台的《人形机器人创新发展指导意见》明确提出要以大模型等人工智能技术突破为引领;构建完善人形机器人制造业技术创新体系;聚焦3C、汽车等制造业重点领域,提升人形机器人工具操作与任务执行能力,打造人形机器人示范产线和工厂,在典型制造场景实现深度应用。
 
由于人形机器人模仿的是人的能力,因此理论上目前制造工人所能执行的工作和任务,未来人形机器人也能胜任。虽然目前人形机器人规模化进厂还为时尚早,但是相信在产业政策支持以及产业链多方共同努力之下,却也并不会太遥远。

THE END