GPT-5闯关宝可梦,创9517步新纪录
快速阅读: GPT-5在《宝可梦水晶》中以9517步击败赤爷,远超前代o3的27040步,展现高效空间推理和目标规划能力,OpenAI联合创始人Greg Brockman称赞其表现。
AI新星GPT-5在一场精彩的宝可梦对决中,以9517步的佳绩成功通关经典游戏《宝可梦水晶》,击败了游戏中的终极对手赤爷(Red)。这场战斗让直播间瞬间沸腾,观众们纷纷在公屏上刷起“GG”(Good Game),将GPT-5的效率推向了一个新的高峰。
推特博主Clad3815统计,GPT-5的通关步数远远低于其前任o3的27040步,后者几乎是GPT-5的三倍。这表明GPT-5只需202小时就能完成这一挑战,而o3则需要近一个月的时间,AI的速度令人惊叹。
在游戏中,玩家需要从小镇出发,收集徽章,挑战道馆馆主,最终与赤爷对决。GPT-5如同小智一般,沿着主线一路推进,收集全部16枚徽章时仅用了9205步,而o3则耗费了22334步。更为惊人的是,从收集完徽章到击败赤爷的阶段,GPT-5仅需312步,而o3却花费了近5000步,效率提高了十几倍。
在四天王和冠军的挑战中,GPT-5同样展现了超高效率,仅用7329步,o3则用了超过18000步。值得一提的是,GPT-5在通关《宝可梦水晶》之前,还成功挑战了《宝可梦红》,同样取得了压倒性胜利。
OpenAI的联合创始人Greg Brockman对GPT-5的表现表示赞赏,认为其在宝可梦之战中的表现可圈可点。Clad3815总结了几大关键因素:1. 幻觉少,速度快:GPT-5在游戏过程中出现的“幻觉”现象明显减少,极大提高了速度;2. 空间推理强:GPT-5在复杂区域中几乎不迷路,能有效规划行动序列,节省了大量时间;3. 目标规划优越:在执行目标和任务规划方面,GPT-5展现出了卓越的能力。
有趣的是,宝可梦这款经典游戏被认为是AI能力的一个“新基准”,为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。不过,挑战这款游戏的成本不菲,一位网友估计GPT-5在通关《宝可梦红》时,花费了大约3500美元(约2万5人民币)的API额度。
(以上内容均由Ai生成)