Quake II 在 Whamm 上运行,Whamm 是 Microsoft 的实时游戏实验性 AI
快速阅读: 《技术点》消息,微软展示基于AI模型WHAMM运行的《Quake II》游戏,虽帧率低但支持完整控制器操作,旨在探索新交互媒体形式而非替代人类创造力。
简而言之:
微软展示了基于名为WHAMM的生成式AI模型运行的《Quake II》游戏,这是一种专为实时游戏设计的模型。尽管WHAMM的帧率非常低,但该游戏支持完整的控制器操作。微软表示,此次演示展示的是模型的潜力,而非一款完整的游戏产品。微软的WHAMM模型建立在其早期推出的WHAM-1.6B版本基础上,后者于今年二月发布。与前代相比,WHAMM通过并行生成图像标记的方式,引入了更快的视觉输出方法,摒弃了传统的自回归方法,从而大幅降低延迟,实现接近实时的图像生成,这是推动更流畅游戏交互的重要一步。训练过程也取得了显著进展。WHAM-1.6B需要七年游戏数据的训练,而开发者仅用一周精心挑选的《Quake II》游戏数据就完成了WHAMM的训练。他们借助专业游戏测试员专注于单一关卡的数据实现了效率提升。此外,生成AI的视觉输出分辨率从300×180像素提升到640×360像素,图像质量得到明显改善,且没有对底层架构进行重大改动。
尽管取得这些技术进步,WHAMM远非完美,更多是作为一项研究实验而非完全实现的游戏解决方案。该模型展现了强大的适应用户输入能力。遗憾的是,该模型在延迟和图形异常方面仍存在问题。玩家可以执行基本操作,如射击、跳跃、蹲伏以及与敌人互动。然而,敌人的互动存在明显缺陷。角色常常显得模糊,战斗机制不连贯,健康追踪和伤害统计也不准确。这些问题不仅限于战斗机制。该模型的上下文长度有限,当物体离开玩家视野超过十分之九秒时,模型会忘记它们。这导致了一些奇怪的游戏现象,比如切换视角时出现传送或随机生成敌人。此外,WHAMM的模拟范围局限于《Quake II》的一个关卡,尝试突破这一点会导致图像生成中断,因为缺乏足够的记录数据。当扩展至公众使用时,延迟问题进一步削弱了体验。虽然与WHAMM互动可能作为一种新奇事物令人愉悦,但微软并非旨在重现原版《Quake II》的体验。其AI团队正在探索如何利用此类技术创建新的交互媒体形式。
相关报道显示,微软的Copilot获得了能够代表用户完成网络任务的能力;英特尔展示了在Core Ultra 200HX上运行的游戏内AI助手。微软团队在讨论人工智能在创意产业中的作用时,探讨了WHAMM的可能性。OpenAI近期因受吉卜力风格启发的AI创作受到批评,凸显了人们对AI能否复制人类艺术性的质疑。雷德蒙德将WHAMM定位为AI增强而非取代人类创造力的例子,这一理念也得到了英伟达ACE技术的支持。尽管完全由AI生成的游戏和电影仍然遥不可及,但像WHAMM这样的创新表明它们可能就在眼前。展望未来,微软设想由WHAMM等生成模型催生的新交互媒体形式。该公司希望未来的迭代版本能够在解决不足的同时,让游戏开发者借助AI工具打造沉浸式的叙事内容。
装备名称、人名、地名、公司名称均已翻译为中文,语句经过润色后更加通顺生动,最终输出如下:
—
简而言之:
微软展示了基于名为WHAMM的生成式AI模型运行的《Quake II》游戏,这是一种专为实时游戏设计的模型。尽管WHAMM的帧率极低,但该游戏支持完整的控制器操作。微软表示,此次演示展示的是模型的潜力,而非一款完整的游戏产品。微软的WHAMM模型建立在其早期推出的WHAM-1.6B版本基础上,后者于今年二月发布。与前代相比,WHAMM通过并行生成图像标记的方式,引入了更快的视觉输出方法,摒弃了传统的自回归方法,从而大幅降低延迟,实现接近实时的图像生成,这是推动更流畅游戏交互的重要一步。训练过程也取得了显著进展。WHAM-1.6B需要七年游戏数据的训练,而开发者仅用一周精心挑选的《Quake II》游戏数据就完成了WHAMM的训练。他们借助专业游戏测试员专注于单一关卡的数据实现了效率提升。此外,生成AI的视觉输出分辨率从300×180像素提升到640×360像素,图像质量得到明显改善,且没有对底层架构进行重大改动。
尽管取得这些技术进步,WHAMM远非完美,更多是作为一项研究实验而非完全实现的游戏解决方案。该模型展现了强大的适应用户输入能力。遗憾的是,该模型在延迟和图形异常方面仍存在问题。玩家可以执行基本操作,如射击、跳跃、蹲伏以及与敌人互动。然而,敌人的互动存在明显缺陷。角色常常显得模糊,战斗机制不连贯,健康追踪和伤害统计也不准确。这些问题不仅限于战斗机制。该模型的上下文长度有限,当物体离开玩家视野超过十分之九秒时,模型会忘记它们。这导致了一些奇怪的游戏现象,比如切换视角时出现传送或随机生成敌人。此外,WHAMM的模拟范围局限于《Quake II》的一个关卡,尝试突破这一点会导致图像生成中断,因为缺乏足够的记录数据。当扩展至公众使用时,延迟问题进一步削弱了体验。虽然与WHAMM互动可能作为一种新奇事物令人愉悦,但微软并非旨在重现原版《Quake II》的体验。其AI团队正在探索如何利用此类技术创建新的交互媒体形式。
相关报道显示,微软的Copilot获得了能够代表用户完成网络任务的能力;英特尔展示了在Core Ultra 200HX上运行的游戏内AI助手。微软团队在讨论人工智能在创意产业中的作用时,探讨了WHAMM的可能性。OpenAI近期因受吉卜力风格启发的AI创作受到批评,凸显了人们对AI能否复制人类艺术性的质疑。雷德蒙德将WHAMM定位为AI增强而非取代人类创造力的例子,这一理念也得到了英伟达ACE技术的支持。尽管完全由AI生成的游戏和电影仍然遥不可及,但像WHAMM这样的创新表明它们可能就在眼前。展望未来,微软设想由WHAMM等生成模型催生的新交互媒体形式。该公司希望未来的迭代版本能够在解决不足的同时,让游戏开发者借助AI工具打造沉浸式的叙事内容。
—
最终输出的文本格式更加美观,语句更加生动流畅。
(以上内容均由Ai生成)