2017年5月25日,浙江乌镇,人机大战第二局在桐乡乌镇举行,柯洁投子认输。东方IC 图
柯洁执白,还是输了。不过,他似乎实现了第一场赛后发布会中所说的“让AlphaGo的主机稍微发烫一下”的心愿,一度局面十分占优,被AlphaGo评估为表现“完美”。因为打劫失误,柯洁中盘投子。
5月25日,人机大战的第二回合在浙江乌镇上演。继两天前柯洁执黑输给AlphaGo四分之一子后,不少人都在期待柯洁执白会给局面带来怎样的变化。毕竟,柯洁执白的胜率是人类最高。曾经的国内第一人古力九段在解说比赛时就称赞道:“执白柯洁说第二,没人敢说第一。”
第一手,AlphaGo执黑下在右下角,而非人类习惯的右上角。在开局阶段,AlphaGo几次陷入罕见的长考,双方用时差距要远远小于第一局。但接着,AlphaGo不停给柯洁出难题,白棋陷入困难的局面。双方的用时差距也逐渐拉开。随后,柯洁充分展现出“当今第一人”的风范,为白棋赢得不少机会,也让局面变得十分复杂。AlphaGo之父、DeepMind公司创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)在推特上写道:“不可思议。根据AlphaGo的评估,柯洁表现完美。”
此前,古力告诉澎湃新闻(www.thepaper),AlphaGo一般是在大局观上胜出,从未在复杂局面中击败人类。
这一次,柯洁以大胆激进的下法创造出的乱象为他赢得了一线生机。他下得越来越快,也越来越坚定,落子有声。柯洁一度长时间没有作出标志性的挠头动作,甚至在下完一子之后,他以手轻抚胸口,长长地呼气,显得有些激动。
不过,随后柯洁打劫失误,形势急转直下,中盘投子认输。
5月24日,AlphaGo背后的团队DeepMind披露了柯洁面对的AlphaGo大师版,比起2016年3月李世石面对的那个,已经有了三大升级:首先,AlphaGo大师版摈弃人类棋谱,单纯向AlphaGo李版的经验学习;其次,AlphaGo大师版的计算量只有AlphaGo李版的十分之一,只需在单个TPU机器上运行;最后,AlphaGo大师版拥有更强大的策略网络和价值网络。
脱出人类经验,以AlphaGo李版为师的AlphaGo大师版,比起AlphaGo李版棋力提升了三子。
在双方第一回合的较量中,柯洁虽然只落败了四分之一子,是中国围棋规则中的最小差距,但他在赛后承认“输得没脾气”。他指出,AlphaGo和去年判若两“狗”,去年它的下法还很接近人类,现在感觉越来越接近“围棋上帝”——围棋中永不失误的完美境界。
AlphaGo之父、DeepMind公司创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)也介绍道:“AlphaGo只会最大化胜率,不会最大化胜果。它只会选择风险最小的下法。”因此,四分之一子并不能说明AlphaGo“险胜”或柯洁“惜败”,只是AlphaGo选择最稳妥下法后的结果。