智通财经APP获悉,在美东时间周二,OpenAI、微软与英伟达等众多科技行业领军者,以及亚马逊创始人贝佐斯等科技界大拿斥巨资支持的AI人形机器人初创公司Figure AI重磅发布第二代人形机器人Figure 02,正如其名称所暗示的那样,这一堪称目前最先进的人形机器人是2023年推出的Figure 01的后继产品。这一新款人形机器人全面融入OpenAI所推出的多模态AI大模型,科技界普遍将这一人形机器人视为“行走的ChatGPT”,具备模仿人类行为、深度学习与思考以及与人类进行自然且高效率沟通等诸多强大能力。
根据Figure AI介绍,这是Figure AI向全球市场所推出性能最强大且功能最全面的人形机器人,将人体形态的灵活性与OpenAI最先进的人工智能大模型相结合。这款人形机器人强大的模仿能力和深度学习能力意味着,它能够在企业生产和制造活动中精准执行各种复杂且危险的任务,在人类生产活动中扮演更具智能化的角色辅助人类提高生产率。并且在不久的将来,有望全面渗透至家庭,成为普及率堪比iPhone与iPad的消费电子产品。
有科技行业研究人员评论称,Figure AI新发布第二代人形机器人Figure 02,可能意味着人类社会逐步踏入“智械时代”。“智械时代”通常指的是一个人类社会广泛使用AI人形机器人以及人工智能技术全面普及的时代。
已有不少科幻以及影视作品展望“智械时代”可能不久后到来,在这一时代,AI人形机器人将能够自主进行决策、学习和适应复杂环境以及与人类进行自然且高效率的沟通,精准完成诸多生产制造活动,从而在许多领域中取代或辅助人类的工作。这种技术进步可能会对经济增长以及人类社会生产率产生积极的深远影响。
广泛推出Figure 02的时间表暂未公布,但是Figure AI在最新介绍中写道:“Figure机器人将人类形态的灵巧性与先进的人工智能技术完美结合,在商业应用以及不久后将在家庭中执行各种各样的任务。”
融合OpenAI大模型的Figure 02堪称“最强端侧AI”
此次Figure 02最引人注目的更新功能无疑是通过与OpenAI长期合作关系而实现的全面融合OpenAI多模态大模型,OpenAI在2月份帮助Figure筹集大约6.75亿美元的B轮融资,在当时使得这家南湾初创公司的估值达到26亿美元。
AI大模型的重磅问世对整个机器人行业来说可谓具备历史意义,人形机器人开发人员对这项技术特别感兴趣。这种外形的主要卖点之一是它能够在工厂车间与人类同事高效地沟通且并肩工作——当然,前提是采取了适当的安全措施。Figure 02具备基于OpenAI大模型的深度学习与模仿能力,且配备了扬声器和麦克风,可以在工作中与人们正常交谈。
像OpenAI GPT-4o以及谷歌Gemini这样的多模态大模型因其无比强大的自然语言能力和高效率解决问题的能力而备受推崇,开创了智能助理和聊天机器人领域的全新局面。为这些人形机器人系统配备这些功能是显而易见的趋势:这样做有助于人类便捷化指导机器人,仅仅一句话或者一个行为机器人就能够像人类一样瞬间作出反应,同时也为机器人在任何给定时间所做的事情增加透明度。
当处理天量并行化计算的服务器AI芯片部署规模达到最基本的算力需求以及基本性能支撑时,根据近年来的技术发展趋势,,在包括智能手机、人形机器人在内的消费电子等应用终端,以及电动汽车软件系统和工业生产等应用终端,AI大模型势必将最终融入这些终端,也就是端侧AI。而Figure AI重磅发布第二代人形机器人Figure 02,堪称目前所看到的“最强端侧AI”。
相比于云端AI,兼具高效率、极速响应以及个性化等显著优势的端侧AI更符合消费者实际需求,这也必然带来推理芯片需求激增。相较于AI训练,AI推理领域对于“海量数据轰炸”应用背景下的GPU并行化算力需求远远不及训练领域,推理进程涉及应用已经训练好的模型来进行决策或识别,极度擅长复杂逻辑处理任务和控制流任务的以CPU为核心的中央处理器足以高效率地调度化处理诸多推理场景。
在人形机器人融入AI大模型的这项工作中,Figure当然不是孤军奋战。去年年底,机器人公司Agility 展示了它一直在做的工作,即利用生成式人工智能来全面提升人类与机器人交流效率。在谷歌Everyday Robots 机器人团队关闭之前,神经网络的使用是该团队的一个重点项目。与此同时,特斯拉CEO马斯克所负责Grok AI和Optimus(“擎天柱”人形机器人)——这两个项目无疑迟早会相互衔接。
OpenAI在人形机器人领域可谓十分活跃,在该公司投资Figure AI之前,该公司曾投资挪威人形机器人公司1X。但毫无疑问,在过去的一年里,凭借令人深刻的机器人外形、灵活的行走步伐以及强大的模仿和学习能力而火爆全球的Figure AI在人形机器人行业最为活跃。投资Figure AI的其他顶级科技公司还包括微软、亚马逊、英伟达和英特尔等等。
Figure AI最近开始与宝马合作进行汽车制造试点合作。6月,该公司公布一段视频,展示了早期机器人在神经网络系统的帮助下自主地在地板上执行任务。该公司指出,Figure 02机器人已经参观了位于南卡罗来纳州斯巴达堡的汽车制造商工厂,以进行模仿、训练以及数据收集。
人形机器人与汽车制造商之间的合作近期可谓越来越频繁。Agility、Apptronik和Sanctuary AI已经宣布与汽车制造商进行类似的试点合作。特斯拉CEO马斯克一直将人形机器人“擎天柱”视为提升特斯拉汽车生产能力的关键因素,而波士顿动力公司(Boston Dynamics)的所有者现代汽车(Hyundai)则将目光投向波士顿动力的专有类人机器人。
与人类之间的沟通能力是Figure在01和02之间所指“自下而上的硬件和软件重新设计”的重要部分。该列表还包括六个RGB摄像头,以及一个板载视觉语言模型,加之改进的CPU/GPU算力硬件和改进后灵活度越来越趋近于人类的机器人手臂。
“AI教父”黄仁勋:下一波人工智能大浪潮将是机器人技术
随着能够理解和模拟运动中物理世界的OpenAI文生视频AI大模型Sora横空出世,AI大模型更加强大的物理世界模拟能力以及更加全面的基于多模态标准的推理能力或将全面促进人形机器人行业繁荣发展。
有着“AI教父”头衔的英伟达创始人兼首席执行官黄仁勋近日表示:“下一波人工智能大浪潮将集中于机器人领域,其中最令人兴奋的发展之一是人形机器人。”“我们正在推进整个NVIDIA机器人技术堆栈,为全球人形机器人开发人员和公司开放技术平台访问,以使用最适合他们需求的平台、加速库和人工智能大模型。”
英伟达近年来可谓将研发工作重点以及研发支出耗费在人形机器人领域,坚信人形机器人将是AI技术最核心的应用场景。英伟达7月底宣布为全球领先的人形机器人开发商、AI大模型开发商和软件制造商提供一套服务、模型以及机器人算力平台,以开发、训练和构建下一代人形机器人。
英伟达新推出的一系列服务产品包括用于人形机器人模拟和深度学习的全新NVIDIA NIM微服务和框架、用于运行多阶段人形机器人庞大工作负载的 NVIDIA OSMO编排服务,以及支持新型AI技术和人形机器人模拟的远程操作工作流程,允许开发人员使用极少量的人类真实演示数据来训练人形机器人。
据了解,英伟达新推出的NIM 微服务提供由 NVIDIA 强大推理算力软件支持的预构建容器,使人形机器人开发人员能够将机器人模拟方案的部署时间从长达数周缩短至仅仅几分钟。两项新退出的英伟达AI微服务将允许机器人开发专家增强NVIDIA Isaac Sim中生成式物理 AI的模拟工作流程, NVIDIA Isaac Sim 是基于NVIDIA Omniverse 平台构建的机器人模拟工程参考应用程序。
Markets And Markets近日公布的预测报告显示,2023年全球人形机器人市场规模预计仅仅约18亿美元,到2028年有望迅速扩张至138亿美元规模,复合年增长率有望超过50%。马斯克6月份在特斯拉股东大会上可谓语出惊人,他表示“擎天柱”人形机器人可能将成为特斯拉市值提升到25万亿美元的最核心催化剂。
7月份,马斯克在特斯拉业绩电话会上强调,擎天柱(Optimus)人形机器人将于明年投产,他预计到2025年,数千台擎天柱人形机器人将为该公司执行重要的生产制造任务,而第二版本预计将于2026年出售给外部的公司,未来“擎天柱人形机器人”也将和Robotaxi一样成为特斯拉最核心的创收利器。