第38节(4 / 4)
“我们先来看它是怎么下棋的。我给个最直白的描述:阿尔法狗先记下几百万盘人类对局,用概率工具统计人类棋手在各种局面下的落子选择,用来模仿。然后用另外两个概率工具统计某种局面有多大概率胜利,以及某一手有多大概率导致这种局面。然后它就开始用这三个工具自己跟自己下,不断推演计算下一步。我们知道,围棋可能的局面数量比宇宙中的原子还多。阿尔法狗那么强大的计算硬件也不可能暴力穷尽所有局面。所以还要有第四个工具,作为框架支撑前三个:含有随机猜测的搜索算法,用有限的计算量倒推搜索,搜出获胜概率最高的下一手。
“完了。就这么简单。搞ai的人给这些工具取了各种酷炫的名字,深度学习卷积网络、估值策略函数、蒙特卡洛树,等等。不是我们想蒙人。这些概率学工具,你没有相关专业博士学位就没法理解它们的道理和窍门。总得有个名字吧——但它们的实质就是这么简单粗暴。
“所以当时那些又懂点ai、又会下棋的人就不高兴了,比如说我。这不是下围棋,我们下棋时想的不是这些。我们脑子里是定式、外势、实地、死活、棋型、轻重、缓急等等,一座逻辑和直觉交织而成的宫殿,无限复杂,无限美丽。这个最精妙的游戏被阿尔法狗变成了反复掷骰子,只因为它的记忆力和计算力超过我们亿万倍。
“2029年春节,我坐下想了十分钟,就抽了自己一巴掌。十二年前太无知了!阿尔法狗当然会下棋!实际上,我们每个人开始学棋的时候下法都跟它相同。我们先看别人下棋。然后有样学样,把第一子下在角上,并不知道为什么。然后学‘金角银边草肚皮’。这就是最简单的估值函数。然后学定式。这是统计优化之后的模仿,概率已经被定式书预先计算过了。然后学死活,这是带分支树的自我应对推演。阿尔法狗用什么工具,我们就用什么工具。这就是围棋最本源的下法。
“那么,为什么我们后来就整出那么多花样,跟阿尔法狗完全不同呢?”
中华田园估值函数:金角银边草肚皮
听众的嗡嗡声变大了。技术代表们非常专注,政府代表们一脸茫然,日本和韩国代表团全体兴奋,译员们被一连串围棋术语整得死去活来。 ↑返回顶部↑
“完了。就这么简单。搞ai的人给这些工具取了各种酷炫的名字,深度学习卷积网络、估值策略函数、蒙特卡洛树,等等。不是我们想蒙人。这些概率学工具,你没有相关专业博士学位就没法理解它们的道理和窍门。总得有个名字吧——但它们的实质就是这么简单粗暴。
“所以当时那些又懂点ai、又会下棋的人就不高兴了,比如说我。这不是下围棋,我们下棋时想的不是这些。我们脑子里是定式、外势、实地、死活、棋型、轻重、缓急等等,一座逻辑和直觉交织而成的宫殿,无限复杂,无限美丽。这个最精妙的游戏被阿尔法狗变成了反复掷骰子,只因为它的记忆力和计算力超过我们亿万倍。
“2029年春节,我坐下想了十分钟,就抽了自己一巴掌。十二年前太无知了!阿尔法狗当然会下棋!实际上,我们每个人开始学棋的时候下法都跟它相同。我们先看别人下棋。然后有样学样,把第一子下在角上,并不知道为什么。然后学‘金角银边草肚皮’。这就是最简单的估值函数。然后学定式。这是统计优化之后的模仿,概率已经被定式书预先计算过了。然后学死活,这是带分支树的自我应对推演。阿尔法狗用什么工具,我们就用什么工具。这就是围棋最本源的下法。
“那么,为什么我们后来就整出那么多花样,跟阿尔法狗完全不同呢?”
中华田园估值函数:金角银边草肚皮
听众的嗡嗡声变大了。技术代表们非常专注,政府代表们一脸茫然,日本和韩国代表团全体兴奋,译员们被一连串围棋术语整得死去活来。 ↑返回顶部↑