2017年5月28日,举世关注的围棋世纪之战落下帷幕。世界排名第一的职业棋手柯洁尽管竭尽全力,甚至一度曾有胜机,但仍以0:3落败于“阿法狗”。
强大的阿法狗
精彩的比赛,充分展现了柯洁这位围棋天才的惊人实力,更是让世人看到了人工智能的可怕,并促使所有人都开始了思考。围棋号称“人类最后的壁垒”并不是没有原因的,自1997年国际象棋大师卡斯帕罗夫败给IBM的电脑“深蓝”之后,科学家们竭尽全力想在围棋上也完成这样的成就,但始终无法如愿。
相比起国际象棋,围棋棋盘上的变化要多得太多,而且对局势的判断一定程度上还需要依靠对“棋形”这种形象的把握,这是人工智能依靠穷举难以做到的,这突破了机能的极限。2012年日本的围棋大师武宫正树虽然输给了围棋软件ZEN,但那是前者让了4子的结果。根据那次对决,人们得出了人工智能要在围棋上完全打败人类还需要10年甚至20年的结论。
然而让几乎所有人都没有想到的是,只要短短的4年时间,以阿法狗为代表的人工智能就成功地摧毁了这个“壁垒”。现在还能有什么可以阻挡人工智能前进的脚步吗?答案可能会让人感到意外。
下一个挑战?
自阿法狗在围棋上战胜李世石之后,不知从何时开始,要让它去打一把电竞游戏的讨论就开始出现了,,而这最佳的选择当然就是《星际争霸》了。
《星际争霸》作为历史悠久的面向电竞的即时战略游戏,不仅考验玩家的操作,更多的是大局观和应变能力。在曾经作为电竞项目的那么多即时战略游戏里,《星际争霸》是公认最有资格能作为人类和人工智能的对决的选择。
事实上关于阿法狗在《星际争霸》上挑战人类,一直以来也确实有来自官方的声音,比如暴雪在去年的 WCS 中国区总决赛上就宣布存在着这样一个计划,而 DeepMind 公司创始人差不多同一时期也透露出想在《星际争霸》上试一试的意愿。
当被问到是否对挑战《星际争霸》感兴趣时,这位名叫丹米斯·哈撒比斯(Demis Hassabis)的“阿法狗之父”笑着回答:“可能是吧。”所以随着阿法狗在围棋界的不断活跃,围绕着阿法狗和《星际争霸》的话题就时不时地被人提起。有趣的是即使阿法狗在围棋上已经体现出了骇人的战斗力,人们对《星际争霸》的选手们仍旧充满信心,因为这两个项目还是有很大不同的。
有星际玩家就认为,即时战略游戏里是存在“战争迷雾”的,也就是说信息并不开放也不对等。在大量的信息都未知的情况下,人工智能还能不能像人一样有效举一反三,进行推理,并对任何突发状况都采取正确的对应,这些都是未知数。事实上哈撒比斯也是持同样的看法,他在一次采访中表示类似《星际争霸》这样的游戏是一种“不完全信息博弈游戏”,这种挑战是独特的。
有趣的结果
无论你对人工智能挑战《星际争霸》的结果有什么看法,最近的新闻都非常值得关注:开发出阿法狗的 DeepMind 公司近日正式宣布和暴雪公司展开合作,使用《星际争霸 2》作为辅助人工智能学习提升的手段。
据了解,研究者和暴雪将使用一种机器学习API,让科学家和开发者都能拥有这个游戏的权限。此外,暴雪还将首批提供约 65000 个对战录像文件供人工智能去学习,而且这在接下来的几周内,这个数字还将提高到超过50万。
总而言之,这就和阿法狗当初疯狂学习围棋棋谱是一样的。为什么选择《星际争霸 2》呢?DeepMind 的研究者认为它的游戏过程中具有多层性,即玩家在流程中除了胜利外,还要完成多个次要目标,比如在采集资源的同时,还要尽可能赢下一个个小战斗。
很多时候在一次长长的对局中,选手前期的行动直到最后才发挥了重要作用。结果也确实如不少星际玩家所预料,甚至人工智能的表现甚至比预想中还要差。人工智能在进行一些小游戏时表现还不错,但到了要进行完整的对战时就露怯了,甚至游戏内置的简单电脑都难以应付。
当然了,我们并不是说在体现人类智慧这方面《星际争霸2》要强于围棋,因为它们本质上是不同的东西。科学家认为《星际争霸 2》的可操作空间太大了,而且还需要在这个过程中不断对接下来的动作做出选择。对于一块很大的地图来说,这就意味着人工智能随时都要面临无数种抉择,更可怕的是很多操作都还需要同时去进行。
据了解,即使游戏地图仅有84x84这么小,人工智能随时都要面对 1 亿种可能的操作。面对这种现状,科学家们提出了一种新的方案,就是将操作分成一个个小任务,如采矿、移动视角等,不再需要人工智能去计算每一个微小的操作细节,从而减轻大量的选择对机能造成的负担。我们作为人类也不能过于乐观,毕竟我们在围棋上也曾经是这样,没想到科学家并没有死板地提升机能,而是利用机器学习达成了目的。现在的它连《星际争霸2》的普通电脑都打不过,但以后又怎样呢?