科创板日报 郑远方
图片来源:由无界 AI工具生成
或许还有人记得四年前一场 Dota 2 的 5 v5 人机决战,AI 队伍“碾压”TI8(第八届 Dota2 国际邀请赛)世界冠军队 OG,连胜两局。而在这两局对战中,人类仅推掉了对面两座外塔,甚至在最惨烈的第二局中,OG 击杀人头数只有个位数。
这是人工智能第一次在电子竞技游戏中击败世界冠军。这支 AI 战队名为 OpenAI Five,此前它已战胜多位业余玩家,在这场人机对战的三个月之后,其背后公司正式获得微软 10 亿美元投资——OpenAI,在 2023 年的今天,这个名字对全球而言都不陌生。
游戏是 OpenAI 最初的愿景。公司当时计划开发一个机器人,让它从零开始,自己一遍遍玩游戏,直到自学成才成为高水平玩家。
由此,Dota 2 成为 OpenAI 的第一个重大项目。在这款极为复杂的游戏中,AI 一开始只会在地图上闲逛,但几小时后,它已学会基本技能。对于人类而言,需要 1.2 万 – 2 万小时的训练才可以成为专业选手,而 OpenAI 每天的训练量等于 100 个人类一生的训练量。
这便是 OpenAI 所采取的训练模式,即强化学习——在 Dota 2 中的经验也为日后的 ChatGPT 奠定了基础。OpenAI 首席科学家 Ilya Sutskever 将 Dota 2 项目视作 ChatGPT 的发展起点:
“从 Dota 2 的强化学习迈向人类反馈的强化学习,再加上 GPT 的技术基础,最终成就了今天的 ChaGPT。”
AI 与游戏的渊源
谈起 OpenAI Five 与 OG 的对局,不免会让人联想起 1997 年 IBM 深蓝(Deep Blue)打败世界国际象棋卫冕冠军 Garry Kasparov,想起 2016-2017 年 AlphaGo 击败李世石与柯洁。而国际象棋与围棋,很大程度上来说也算得上是战术性游戏。
若再向时间深处回溯,AI 与游戏的渊源甚至能追溯到计算机发展的历史尽头:
上个世纪 40 年代末 50 年代初,计算机科学之父 Alan Turing 便试图通过国际象棋游戏编程,来测试计算机能否“智能地”解决游戏中的问题;
IBM 计算机科学家 Arthur Samuel 发明了初版强化学习模型,将其用于跳棋游戏自我对战。
游戏成为了滋养 AI 的沃土,也是见证 AI 荣耀的竞技场。
一条通往通用人工智能的必经之路
正如人类多通过考试与竞赛证明自身能力,AI 同样也需要类似基准来测试智能水平。游戏由此脱颖而出,成为 AI 领域中最多用的“水平考试”,也铸就了 AI 发展的一个个荣耀勋章。
但与此同时也衍生出了一个问题,例如数学成绩突出的人不一定学得好语文或英语,会下国际象棋的 AI 不一定会下中国象棋,为某个特定游戏胜利所设计的 AI 并不一定能将经验迁移至其他游戏。
那到底什么样的游戏 AI 算聪明?通用电玩比赛(General Video Game Playing Competition)得以诞生,意在检验 AI 能否成功过关多种游戏。
正所谓“少林有七十二艺,功夫既有不同,练习之法,亦必各异。学者苟能尽之,则无敌于世矣。”通用游戏(General Game Playing)也被看作通向通用人工智能的必经之路。
值得一提的是,与 OpenAI Five 类似地,腾讯也曾推出策略协作性 AI“绝悟”,并在 2021 年举行过一场与职业选手对决的王者荣耀表演赛,马化腾将这场比赛形容为“最高水平的 AI 竞技”——从技术层面而言,这个升级版“绝悟完全体”已掌握了王者荣耀中所有英雄的全部技能,达到全英雄职业电竞水平。而 OpenAI Five 之前仅会操纵瘟疫法师、火枪、毒龙、冰女和巫妖 5 个英雄。
AI“反哺”游戏
当然,也许有人会说,在游戏中的种种亮眼表现不过是 AI 依靠算力堆积取得的胜利,不过是再次证明了计算机算力强过人类大脑。
但事实上,AI 也已开始对游戏展开“反哺”。随着 AI 技术发展,人们可以为游戏中设计出全新的核心玩法,设计出更好的音乐、画面、角色乃至剧情,还可以提供更为个性化的游戏体验。
在今年这场由 ChatGPT 掀起的 AI 风暴中,游戏已成为 AIGC 应用的主战场之一。微软、腾讯、育碧、Roblox 等一众大厂先后推出 AIGC 游戏生成工具,可以帮助创建虚拟城市等场景、创建 NPC、自动生成 NPC 脚本、编写剧情、创建任务内容、生成代码片段、生成游戏物件纹理等。
实际上,早在 2016 年,已有游戏公司将 AIGC 相关技术融入开发管线。
《无人深空》(No Man's Sky,也译作“无人之地”)是一款主打太空探索的第一人称动作冒险游戏。玩家可以自行探索随机生成的确定性开放宇宙,其中包括数以亿计的各类行星,而行星上都有各自的动植物群。
如此庞大的工作量背后,《无人深空》团队却仅有四个人,他们倚仗的便是 AI 技术。游戏主要靠程序自动生成,因此可以在短时间内生成数万亿个星球。为了提升系统生成效率,这个四人团队还积累了一整套世界生成规则。
结语
在 AI 发展历程中的每一个重要节点上,多能见到游戏的身影——OpenAI 依靠 Dota 2 赢得比尔・盖茨关注与 10 亿美元投资;深蓝与 AlphaGo 凭借棋局一战成名。
曾经对于普罗大众而言,AI 的发展进程也许只藏在晦涩难懂的论文数据之中、在深奥费解的代码背后,与日常生活似乎难有关联。也正是游戏,让 AI 离人们更近一些,让旧时王谢堂前燕,得以向寻常百姓家飞去。
正如《人工智能玩游戏(Playing Smart: On Games, Intelligence, and Artificial Intelligence)》一书所说,“游戏是人工智能的过去、现在与未来”。若日后某一天,哪款游戏又孕育出了可与 ChatGPT 媲美的 AI,或许也不足为奇。