专业人才服务

让具身智能走向水深之处:NVIDIA 发布Project GR00T人形机器人基础模型和Isaac机器人平台

自媒体 2024-03-23 浏览(113) 评论(0)
- N +

本文作者|茉莉责任编辑|桢桢毕业就和专业绝缘,这个规律在娱乐圈也相当常见。这阵子的热搜中,姚安娜可谓是个典型的例子。明明专业发展是靠拢自家企业,却偏偏要剑走偏锋,来混个演员的名头,生生把拙劣生硬的演技,让大众体会了一把什么是外行人乱来的效果。

在ChatGPT等生成式AI正引发人工智能新一轮浪潮的同时,AI领域的另一分支——具身智能(Embodied Artificial Intelligence)也引起了学术界和产业界的关注。

所谓具身智能(Embodied AI),是指有身体且可进行物理交互的人工智能体系,该智能体通过与环境的交互来获得信息、提取问题、制定决策并付诸行动。机器人、自动驾驶汽车、智能外骨骼等,都属于这一范畴。

相比其他仅以数字形式存在的AI,具身智能可弥补AI与物理世界的距离,能克服纯数字形式AI的多项局限,如缺乏感官等物理信息输入、难以获得微妙态势感知中包含的上下文细节而判断失误、严重依赖历史数据而难以快速应对不断变化的现实等。

让具身智能走向水深之处:NVIDIA 发布Project GR00T人形机器人基础模型和Isaac机器人平台

2023年,NVIDIA 创始人兼CEO黄仁勋就曾表示,AI领域的下一个浪潮将是具身智能。Virtue Market Research研究报告称,2023年全球具身智能市场规模约为159.6亿美元,预计到2030年将达591.8亿美元,在2023-2030年间预计将以17.8%的复合年增长率稳定增长。

此外据CGII统计,仅在人形机器人这一细分市场,预计2026年的全球市场规模就将超过20亿美元,市场渗透率预计将达3.5%,到2030年的市场规模或将超200亿美元。

中国也曾发布多项政策推动具身智能的发展,2023年5月,北京市人民政府办公厅印发的《北京市促进通用人工智能创新发展的若干措施》中指出,鼓励通过具身智能的研究应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。

纵览全球,许多公司已经在具身智能方面取得进展,如OpenAI推出的Neo机器人、亚马逊的 Alexa Arena机器人、谷歌DeepMind推出的控制机器人的视觉语言动作(VLA)模型RT-2、Meta 的人工视觉皮层 VC-1等。

而在2024年3月18日,NVIDIA 最新发布的多项进展,也将为具身智能的发展提供更强劲的动力。

发布Project GR00T 人形机器人基础模型

本次发布的人形机器人基础模型Project GR00T,专为人形机器人打造并旨在为其开发赋能。

由GR00T驱动的机器人,不仅可理解自然语言,还可以观察人类行为并模仿人类动作,从而快速掌握需协调、灵活性的多种能力,进而达到可自主导航、适应现实世界并与之互动。

黄仁勋在发布会上表示:“开发通用人形机器人基础模型是当今AI领域最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,以在人工通用机器人领域实现突破。”

Isaac机器人平台迎重要更新

当天,NVIDIA 还发布了Issac的多项更新。据了解,Isaac是 NVIDIA 在2018年推出的针对机器人打造的自主机器平台,该平台通过对机器人开发、模拟和部署功能的改进来加速其开发进程。Issac平台主要包括硬件、软件和虚拟世界的机器人模拟器。

(来源:资料图)

在硬件方面,Issac的核心是一款为机器人设计的计算机Jetson Xavier,它配有包含Volta Tensor Core GPU、8核ARM64 CPU、NVDLA深度学习加速器、图像处理器、视觉处理器、视频处理器等共计6种处理器以及超90亿个电晶体,可提供每秒30万亿次操作以上的性能。

软件方面其主要包括软件开发套件Isaac SDK,可提供全套工具、库、支持GPU的算法和教程,以加速机器人算法软体和运行框架的开发。

此次发布的Issac平台的更新,包括用于强化学习的Issac Lab和用于计算编排服务的OSMO工具包。

其中,Isaac Lab是一个可将GPU的速度加快、性能优化的轻量级应用,它基于Isaac Sim 构建而来。而OSMO可以将异构计算的机器人开发工作负载扩展,在分布式环境中完成协调数据生成、模型训练和软硬件在环工作流等工作。

(来源:资料图)

同时,NVIDIA 还发布了Isaac Manipulator和Isaac Perceptor等一系列机器人预训练模型、库和参考硬件。

其中,Isaac Manipulator可以为机械臂提供更灵活的性能和模块化AI功能,比如可以将路径规划加速80倍。Isaac Perceptor还能提供多摄像头和3D环绕视觉功能,在制造业和物流业中可更好地保护工人并降低错误率。

相信凭借更强大的Project GR00T基础模型和Isaac平台的加持,在不久的将来就能看到具形智能的新突破,NVIDIA 将助力更多行业全方面多角度地享受AI的赋能。