近日,一位国外程序员Peter Whidden耗费5万小时精心调教了一款 AI 模型,试图引导 AI 掌握《宝可梦:火红》的游戏技巧。
Whidden使 AI 通过模拟器控制输入与游戏进行深度互动,设定每次游玩时长为两个小时,并通过加速技术使 AI 在短短六分钟内完成任务,甚至同时运行 40 个会话,以加速 AI 的学习进程。
鉴于 AI 算法本身并不关注游戏通关方法,Whidden特意设立了奖励目标,让 AI 在发现新事物时可以得到相应奖励点。该机制基于屏幕像素点变化触发,然而这也让 AI 长时间停留在动画效果的水面。
针对与新事物相关的奖励机制,AI 选择放弃战斗或捕捉宝可梦,Whidden因此增设了与宝可梦等级相关的奖励机制。然而这一系统出现了意外,AI 在宝可梦存放和替换过程中,奖励分数降低,导致 AI 完全避开宝可梦中心,使队伍无法得到治疗。无奈之下,Whidden只能再次调整奖励系统。
尽管 AI 在模仿人类行为方面并不擅长,但仍展现出更为复杂的行动方式。Whidden意识到 AI 选择了奇怪且具体的路径,实际上是为了确保仅用一个精灵球就能捕捉野生宝可梦,而非无意义的行为。
然而,在花费 7 千个小时战胜第一个道馆后,AI 在月见山迷失方向,耗时 5 万小时仍未找到第二个道馆。尽管如此,AI 还是贡献了许多神奇操作,例如购买鲤鱼王超过 1 万次,以及在野外捕捉到小拉达时,将其命名为“AI”。
声明:易商讯尊重创作版权。本文信息搜集、整理自互联网,若有来源标记错误或侵犯您的合法权益,请联系我们。我们将及时纠正并删除相关讯息,非常感谢!