Hugging Face与Physical Intelligence联手推出了划时代的机器人基础模型Pi0,这是首个能将自然语言命令直接转化为机器人动作的开源模型,标志着机器人技术进入新纪元。
Pi0模型在七个不同机器人平台上经过训练,掌握了68种独特任务,能够执行从折叠衣物到收拾桌子等复杂操作。该模型采用创新的流匹配技术,以50Hz的频率生成平滑的实时动作轨迹,确保了极高的精确度。
更值得注意的是,研发团队同步推出了升级版Pi0-FAST,采用全新的频率空间动作序列标记方案,使训练速度提升5倍,并展现出更强的跨环境适应能力。
Hugging Face首席研究科学家Remi Cadene表示:"Pi0是最先进的视觉语言动作模型,它能将自然语言命令直接转化为自主行为。"模型现已在Hugging Face平台开源,开发者只需几行代码即可调用。
这一突破性进展可能重塑多个行业:制造工厂可通过口头指令重新配置机器人任务,仓储物流可部署更灵活的自动化系统,甚至小型企业也能更容易地采用机器人技术。不过,在计算资源需求、可靠性和安全性方面仍存在挑战。
对整个AI行业而言,Pi0的发布恰逢其时。随着通用人工智能研发竞争日益激烈,这一技术成功地在语言模型与物理世界之间架起了桥梁,为未来智能机器人的发展指明了方向。