一项令人瞩目的AI突破近日引发了游戏界和科技圈的广泛关注。研究团队成功开发出一款名为DIAMOND(Diffusion for World Modelling)的AI模型,能够在神经网络中模拟运行《反恐精英:全球攻势》(CS:GO)的简化版本。这一创新成果不仅展示了AI在游戏模拟领域的巨大潜力,更为未来虚拟世界的构建提供了全新思路。

DIAMOND模型的一大亮点在于其惊人的效率。在单块Nvidia RTX3090显卡的支持下,模型就能以每秒10帧的速度运行CS:GO模拟。更令人惊叹的是,研究团队仅用87小时的CS:GO游戏数据就完成了模型训练,这仅相当于类似项目GameNGen所用数据量的0.5%。如此有限的数据却能产生如此令人印象深刻的游戏模拟,充分展现了DIAMOND模型的强大性能。

image

DIAMOND的核心技术基于Transformer架构,它将玩家的移动视为"词元"(token),类似于句子中的单词。通过预测这些词元,模型学会了根据先前的动作来预判下一步移动。这种创新方法最初应用于雅达利游戏,现在成功迁移到了更复杂的CS:GO环境中。

研究者Eloi Alonso在社交媒体上展示了模型的能力。视频中,玩家们使用键盘和鼠标与模拟的CS:GO环境进行互动。模拟不仅包含了玩家交互、武器机制等基本元素,还涵盖了复杂的环境物理效果,展现出令人惊叹的真实感。

然而,DIAMOND模型仍存在一些明显的局限性和缺陷。例如,由于模型未能完全理解Source引擎的重力和碰撞检测机制,玩家可以无限跳跃。此外,一旦玩家偏离训练数据中常见的路径,整个模拟就会崩溃。这些问题凸显了AI模拟复杂游戏世界时面临的挑战。

研究团队对DIAMOND的未来发展持乐观态度。他们认为,通过增加数据量和计算能力,模型的表现将会进一步提升。更远大的目标是,他们希望这项技术能为开发能够在复杂现实环境中导航的AI模型铺平道路。

值得一提的是,DIAMOND的灵感来源于Google Research、Google DeepMind和特拉维夫大学共同开发的GameNGen系统。GameNGen能够在单个Google TPU芯片上以每秒超过20帧的速度完整模拟经典游戏DOOM的部分内容。

对于希望深入探索这项技术的开发者和研究者来说,DIAMOND模型的源代码已在GitHub上公开。这无疑将推动更多创新应用的诞生,加速AI游戏模拟技术的发展。

尽管DIAMOND在模拟CS:GO方面取得了突破性进展,但它也揭示了AI在复制复杂交互系统时面临的挑战。随着技术的不断进步,我们可以期待看到更加逼真、流畅的AI游戏模拟。这不仅将为游戏开发带来革命性变化,还可能为虚拟现实、训练模拟器等领域提供宝贵的技术支持。