德扑最优策略GTO
德扑最优策略GTO
作者:RichZhu(智游城创始人之一)
如需系统学习GTO,请点击查看德州扑克GTO视频课程:https://www.moshike.com/a/4232.html
GTO这个词汇大概是过去两年中文扑克界使用频率最高的技术词汇了。奇怪的是,随着这个词汇的逐步大众化,越来越多的人却在问同一个问题:到底什么是GTO?好像谁都听说过,但问起来又没有什么人给个实在的答案。
此前一位业内知名的牌手在微博上这样问道:“有谁很认真的研究过GTO理论?求你们的解答……”。我是被旁人提示去看的这个微博里面的回复,看过后就想写一个GTO的通俗版。
前几天,我那篇关于AK的帖子又被翻出来,争论的还很激烈,回复之余我又想起了GTO,因为八竿子打不着的地方,回帖的人也要小心地解释一下,自己说的最佳“不是GTO那个最佳”。可以说,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,到了必须要“说道说道”的地步。
下面我就尽量使用人类听得懂的语言解释这个神话般的GTO。
1 什么是GTO
GTO是英文GameTheory Optimal的缩写。那么GameTheory Optimal翻译成中文是什么呢?随便查一下网络上的英汉字典不难知道:“GameTheory”是“游戏理论/博弈论/对策论”的意思,而“Optimal”是“最佳的/最优的/最理想的”意思。所以“GameTheory Optimal”很自然地会被翻译成:博弈论最优,至少这是百度翻译给出的,此外还有“最优游戏策略”等等类似的翻译。
问题是,到目前为止,所有这些翻译给我们普通人带来的正常理解,跟GTO理论本身的含义,是不同的,这是GTO给大多数人带来困惑的首要原因。这样,我们只能回头来,先不用管它中文怎么称呼,看看GTO到底是什么意思。
在博弈论中,有一个非常著名的纳什均衡理论,(Nash Equilibrium)大意是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。
如果上面的表述还显得饶舌,没关系。在游戏理论讨论中,英文常常还有一个非常平民化的词组来替代Nash Equilibrum,叫unexploitablestrategies。跟GTO不同,这个词组直译没有问题,就是:不被(对手)压榨的策略,或者说最佳防守策略。
GTO算是纳什均衡的另一个别名,不过它只是近些年在扑克理论界得到使用,跳出这个圈子,基本上没人知道。即便是扑克圈子,有些人也根本不用,还有些人用这个词汇,只是因为字母少,写起来方便。总之,这个词汇本身并没有任何新的含义或学术价值。
(著名数学家、博弈论创始人约翰纳什因其发现/证明纳什均衡而获得诺贝尔经济奖,他也是奥斯卡最佳影片《美丽心灵》的原型。他和夫人半年前遇车祸过世。笔者在此对纳什先生表示深深的敬意)
2 为什么GTO如此流行
经常会听到GTO狂热爱好者给你讲述GTO的两大优点:
1)使用了GTO,不管对手多么厉害,他都奈何不了你,你绝对不会吃亏。这个直觉上好像很容易理解,根据定义,对手单方面更改自己的策略不会带来任何好处,那你自然不会吃亏了。
2)当你使用GTO,而对手偏离GTO,他不但占不了你的便宜,还可能吃亏。
这两点结合在一起就厉害了。
如果仅仅是第一点,充其量不过是金钟罩、铁布衫之类的,没多大意思。谁学功夫只是为了不被人打死?
但这第二点就不同了,对手不但伤不了你,还可能因为想伤害你而自残。你都不用出招应变,对手就会一点点内力全失,无疾而终。金钟罩、铁布衫直接升级为葵花宝典。
不得不承认的是,跟欧美牌手相比,国人牌手多了一些浪漫和疯狂,少了一些理性与思考,所以会更经常地看到一些大白天做扑克梦的牌手,他们最大的愿望就是找到一条成为绝顶高手的捷径。这样,就没有什么比葵花宝典更有吸引力的了。
所以过去两三年凭空冒出一堆所谓的学院派或者代表当今最先进打法的大神,开口闭口GTO。要是碰巧招生做培训,招生简章第二段才提到GTO,那肯定是秘书大意出错了。
3 GTO这个词汇的是与非
本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,这里咱们就真的豁出去“说道说道”吧。
GTO这个词汇在扑克界的流行,一般认为,罪魁祸首是Mathematics of Poker(《扑克的数学》)。GTO具体是谁最先使用的无从考证,只是在MoP之前,扑克界就有人使用,在扑克界使用之前,游戏理论界就有人使用,这些都是可以查到的。
但业内开始流行使用,却是始于MoP,而在扑克界之外,现在也没有什么人使用。
前面说过,目前能查到的GTO这个词汇的中文翻译对刚接触这个词汇的玩家都有很强的误导,这一点不能完全怪翻译的人,因为英文本身就带有很强的误导作用,也就是说,不但中文玩家对这个词汇理解产生困惑,美国英国加拿大澳大利亚玩家也有这个困惑。究其原因,就是GTO(GameTheory Optimal)中的这个"Optimal"有点让人头痛。在2+2等英文论坛中,很多人质疑,也有些人在争论数学家和经济学家在词汇使用上的理解和习惯不同等等,越扯越远。
鉴于本文是通俗版,咱就不整这些没有用的了。简单说,大家一致的意见是,GTO这个词汇不好,容易引起大多数思想单纯的玩家的误解。不同的是,一部人悲观的认为生米已经煮成熟饭,也只能吃了;另一部分人认为可以将错就错,以后就用GTO这个词汇,不再是是什么的缩写,就是标准用词,不想再看到"optimal"在这种地方出现。
《扑克的数学》作者之一,Jerrod Ankenman,在各种场合多次表达了对自己使用GTO这个词汇的悔恨。他高调地说:如果当初我知道这本书真的有人会看,甚至还会真的谈论扑克,我肯定会使用"equilibrium"这个词(而不是使用"optimal"这个词),这样大家就不用头痛了。
Jerrod Ankenman
Ankenman不知道,在遥远的东方,他的用词不慎,给广大扑克爱好者带来更大的麻烦。不但翻译起来困难,更糟糕的是,在对Optimal一词误解的基础上,进一步的发挥创造。
我看到的最经典,最顽固,也是最好笑的,是GTO狂潮中产生的一个词汇和解释,以及它的流传广度和时间长度,就是“EO(ExploitativelyOptimal)”这个词组。把“ExploitativelyOptimal”输入到google,你不会得到搜索结果,但如果你百度这个英文词组,却可以看到搜索结果。如果作者理解了GTO的含义,根本就不应该有“EO”这个词,“exploitative”跟“optimal”是矛和盾、白天和黑夜的关系,无法一起构成一个有意义的词组。
咱们华人牌手自己创造的英语词汇,然后又缩写下来“出口转内销”介绍给了华语扑克界,不能不让人感叹国人想象力之丰富。可是在使用之前,不能网上随便验证一下英文中是否有这个词组的用法吗?我曾经在论坛和微博等多处指出不要使用这个英文词组,因为实在是说不过去,但在本文开头提到的微博留言里我还是又一次看到了这个用法和解释。可见错误的东西,一旦流行,是很难纠正的。
写到这里,我们回到本文最初的梦想之一,就是不要让GTO再来干扰其它跟GTO无关的词汇和讨论。
这里倡议,我们也可以像老外建议的那样把GTO当作一个专有名词,不要再使用各种翻译。或者,我们也可以翻译成“不被剥削策略”,甚至可以勉强使用更吸引眼球的“最佳防守策略”。这样当我们讨论牌局的时候说“这是我认为的最佳策略”,我们指的是EV最大的选择,或者是BR允许下EV最大的选择,诸如此类人类能正常理解的普通用法,也就不用诚恐诚惶地解释此“最佳”非彼“最佳”。
必须说明的一点,虽然GTO这么劣迹斑斑,但至少它客观上帮助传播了扑克理论和吸引更多玩家关注这个理论的探讨,这个“不慎”的用词还是在某些方面起了积极的作用。当然,网络扑克的发展,即便没有GTO这个词汇,扑克理论上的研究和应用也是会不断提高的,就如同没有moneymaker扑克boom也会出现一样。但GTO这个词用到今天,确实应该说清楚,有个了断了。
我希望GTO一词引起的混乱到此为止,这样我们下面就可以踏踏实实地开始讨论GTO的内容与应用了。当然,因为GTO不再据有极其吸引眼球效应的说法而不想了解GTO实质的,可以跳过本文剩余内容,直接到广告页面。(广告在制作过程中,马上回来)。
4 GTO的困境
两年前,我在某平台开免费公开课。在我回答学员提问时说:GTO这个概念还是要知道的,而且需要理解并在实战中有意识地应用,但并不需要把太多时间用在GTO上,否则路就走偏了,不值得。当时一位学员直接问我:“你懂GTO吗?我的教练就是靠GTO在PS高额桌赚钱,4bb/100手。”
请相信,这是我听到的关于GTO的一个比较低调的版本,大概对方觉得我免费讲课也不容易,说话给了点面子。人家这样客气,我就不知道该说什么了。不是所有的人都愿意或者能够接受你的好意,何必坏了人家的美梦呢?
我对GTO的保留态度是有原因的。当然我们说GTO的时候,需要区分两种情况:一种是简单的GTO概念和应用,原则上是一种定性的东西,上课的时候充其量花几分钟解释一下,更多的是处理牌的时候,比较“务虚”的考虑;另一种则是GTO原理指导下的具体操作策略,更多的是定量的东西。我在跟牌手交流时,对后者一直持谨慎和保守的态度是基于以下几点考虑:
1)GTO并非是真正的金钟罩
很多人忽略了纳什均衡里“那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处”的另外一层含义,就是如果不是单方面更改自己的策略,那么这些更改的人未必不会得到好处。所以,游戏中两位或更多位串通,可能给GTO策略使用者带来损失,自然GTO并不是真的不可打败。
需要说明一点,实际牌局中,并不需要两个骗子合谋,更常见的是玩家无意中偏离GTO。即便是无意的,GTO不可战胜的前提也已经不存在了,这在理论上跟蓄意欺骗也没什么本质的区别了。
所以,人们谈论GTO,常常限于两人对打,因为不存在第三方“搅局”的问题。但因此,GTO的用途也大大地打了折扣。
2)扑克多数情况下并非零和游戏
即便是两人对打,你至始至终使用GTO,结果会怎样?你可以保证对手不赢,但却不能保证自己不输,因为有抽水。或者说这实际上是一个准三人的游戏,牌室是一个傀儡玩家,只不过这个傀儡是个貔貅,只进不出,你必须做到从对手那里赢到的超过自己贡献给貔貅的,才能盈利。GTO只保证你这可怜孤独的对手赚不到你的,并不能承诺你可以从对手那里赚到足够支付貔貅的,自然也就不能保证你不输了。
3)知道GTO的存在和知道它是什么不是一回事
好了,你说你专攻headsup,而且可以找到不抽水的局,那是不是就终于可以畅快淋漓地使用GTO,证明你才是东方不败?不幸的是,还不行,而且是非常的不行。
尽管纳什理论上证明了包括扑克在内一系列游戏的纳什平衡是存在的,但对扑克而言,这个平衡策略是什么,绝大多数情况下,或者说任何常见牌局,还没有人(或机器)解答出来。
年初的时候,阿尔伯塔大学的一组研究人员发布了一个GTO扑克应用,这是个有限扑克两人对打,很多人天真地以为无限德州扑克的GTO计算机应用会很快解决。其实有限德州和无限德州在计算量上的差别是天文数字,两者根本无法相比。就像围棋,9路围棋很容易解,但19路围棋二三十年下来,重赏之下,还是没有一个可以达到职业初段水平的程序。有限德州和无限德州的差异要远远大于9路和19路围棋的差异,即便是两人对打的无限德州GTO求解也还早着呢。
4)人脑不是机器
即便有一天常见的扑克牌局有了GTO解法,并不等于说,我们能够在牌局中使用。比如说前面提到的有限德州GTO的程序应用,即便所有相关信息都摆在面前,人脑也是根本不可能完成这些记忆和运算的,连万分之一也做不到,更不用说无限德州了。
换句话说,你不要指望有一天看到某个天才或者有特异功能的人,在wsop终桌上表演着GTO,除非wsop修改规则,允许机器人参赛,而这样的机器人在有生之年,各位恐怕也是看不到的。何况真要是机器人参赛,wsop也该改名称了。
5)人不是机器
没错,4)和5)虽然一字之差,我要表达的意思却是完全不同的。
对于大多数牌手来说,打牌只是娱乐、交友,对他们来说GTO绝对不应该占用他们显著的时间,无聊,痛苦,也无效。
那么少数把扑克当成职业的,是否要花时间在GTO应用上面?这少数中的大多数仍然不该把时间放在这种地方,原因却是,这些职业、半职业牌手需要追求最大效率的赢钱,而不是毫无意义的“不可战胜”。
我们必须明白一点,当一个bot可以通过“伪GTO”战胜抽水的时候,它就具有实战价值,因为它可以不吃不喝不睡,几乎不消耗任何东西去积累盈利。但职业牌手不可以,你不但不能一直保持24/7的稳定发挥,就是简单连续打牌也做不到。你要有各种消耗,你还可能需要承担家人的消费,甚至你们未来退休金的积累。所以职业牌手第一追求的永远是赚钱的效率,而不是吹牛的资本(这里暂不考虑吹牛可以折现的情况,太复杂了)。平均每小时盈利低于某一下限,就无法支撑下去。所以对于一个职业牌手来说,寻找对手的弱点最大利益化要远比花大力气修补自己不明显的漏洞现实得多。
我比较确定自己还漏掉一些理由。单单考虑上面这些,我劝大多数牌手,尤其那些上入门课的新人,不要把精力和梦想放在GTO上面,也算是可以理解的吧?
FAQ
如何在电脑上玩 WPT Global 2024
如何在计算机上玩 WPT Global 下载软件 1。访问官方网站:访问 WPT Global 网站或使用扑克新闻网站提供的联属链接。 2。开始下载:单击特定于您的操作系统的“下载”按
WPT Global 有移动应用程序吗?
WPT Global 移动应用程序:功能、可用性以及如何下载 WPT Global 是增长最快的在线扑克平台之一,为 iOS 和 Android 设备提供方便且用户友好的移动应用程序。本文将指导您了解该