策略思维-第29章

小说：策略思维字数：每页3500字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　我们的其他工具，比如威廉斯的方法和上述图表，能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是，这些工具并不适用于任何非零和博弈，也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧，比如线性规划方法，可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围，我们还是可以利用其中得出的结果。
　　所有混合策略的均衡具有一个共同点：每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略，找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退，其实不然，因为它正好符合零和博弈的随机化动机：你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动，从你的角度观察，这只能表示他们选择了最糟糕的方针。
　　说到这里，我们已经解释了采取混合或者随机策略的好处，以及这么做的策略必要性。基本要点在于，运用偶然性防止别人利用你的有规则的行为占你的便宜。将这一原理用于实践则是一个更微妙的间题。下面五个部分可以看做是运用混合策略的迷你指南。
　　3　．为什么你应该选择正确的混合策略？
　　假如真能发现某个参与者打算采取一种行动方针，而这种行动方针并非其均衡随机混合策略，另一个参与者就可以利用这一点占他的便宜。在网球比赛的例子中，当发球者采取自己的均衡策略，按照40：60的比例选择攻击对方正手方和反手方时，接球者的成功率为48％。如果发球者采取其他比例，接球者的成功率就会上升。举个例子：假如发球者很傻，决定把所有的球都发向对方较弱的反手方，接球者由于早有预料，其成功率将会增至60％。一般来说，假如接球者认识发球者，确切了解他有什么癖好，他就能相应采取行动。不过，这么做永远存在一种危险，即发球者可能是一个更出色的策略家，好比台球桌旁的骗子，懂得在无关紧要的时候装出只会采用糟糕策略的傻样，引诱对方上当，然后在关键时刻发挥本色，打接球者一个措手不及。一旦接球者以为看穿了对方的惯用手法，而放弃自己的均衡混合策略，一心要占对方便宜，就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。
　　与正确的混合比例一样重要的是随机性的本质。假如发球者向接球者正手方发出4个球，然后转向反手方发出6个球，接着又向正手方发4个球，再向反手方发6个球，如此循环，确实可以达到正确的混合比例。不过，这是一种有规则的行为，接球者很快就能洞察其中奥妙。他可以相应做出正确的移动，成功率因此上升为（4/10）90％＋（6/10）60％=72％。发球者若想取得最大效果，必须使每一次发球都不可预测。前面故事里提到的棒球选手戴克斯特拉与史密斯，似乎没意识到这个原则。
　　4　．为什么不能依赖对手的随机化？
　　假如一个参与者选择的是他的最佳混合策略，那么，无论对手采取什么样的策略，他的成功率都是一样的。假设你是网球比赛例子里的接球者，而发球者已经选择了他的最佳混合策略，即40：60的混合策略。那么，无论你向正手方还是反手方移动，又或是时而正手方，时而反手方，你的成功回球率都是48％。意识到这一点，你可能打算免掉计算自己的最佳混合策略的麻烦，只随便选定一种行动，并指望对手选择他的最佳混合策略。问题在于，除非你选择自己的最佳混合策略，否则你的对手就没有动机选择他自己的最佳混合策略。举个例子：假如你选择向正手方移动，他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略？理由就是迫使对方继续使用他的最佳混合策略。
　　5　．你的技巧变化了，你的最佳混合策略怎样变化？
　　假设接球者努力改进自己的反手回球技巧，反手方的成功回球率从60％上升为65％。我们可以相应修改用于计算他的最佳混合策略的图表。请看图7…7。我们注意到，接球者向正手方移动的比例从30％上升为33。3％　
　　，而整体成功回球率也从48％上升为50％。
　　图7…7　接球手向正手移动的概率（％　）
　　随着接球者的技巧不断改进，他的成功率自然也会提高。不过，出人意料的是，这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中，我们说过这样的事情有可能发生；现在我们就来解释一下。
　　原因在于两位参与者的策略的相互影响。当接球者更善于反手回球，发球者就会多向他的正手方发球（向正手发球的比率达到43％，　
　　而不是原来的40％）。为了适应这个变化，接球者也会多向正手方移动。反手技巧改进了，正手技巧的威力也因此释放出来。好比拉里·伯德的例子，随着他的左手投篮得分率上升，对方防守他的策略不得不发生同样的改变，结果反而给了他更多机会右手投篮。
　　同样的情况还有一个例子：假设接球者刻苦训练，提高自己的灵活性，从而他在向正手方移动后迅速转向接住反手球的准确度提高了。他对付反手球的成功率从20％上升为25％。和前面提到的情况一样，他向正手方移动的机会也从30％上升到31。6％　
　　（若用威廉斯的方法，向正手方和反手方移动的比例从原来的30：70上升为35：65）。接球者多向正手方移动的原因在于他在这边的技巧改善了。相应地，发球者将会减少攻击对方的反手方的次数，以此减少对方的得益。
　　6　．怎样随机行动？
　　假如有人告诉你，你应该以相等的比例随机投出下坠球和快球，你该怎么办？一个办法是从1到10中随机挑选出一个数字。假如这个数字是5或在5以下，你就投快球；假如这个数字是6或在6以上，你就投下坠球。当然了，这在简化你的问题的方向上只走了一步而已。你怎样才能从1到10的十个数字里随机挑选出一个呢？
　　我们从一个更简单的问题开始，即写下连续投掷一枚硬币可能得出的结果。假如这个序列的确是一个随机序列，谁要是打算猜测你究竟写的是正面还是反面，他猜中的机会平均不会超过50％。不过，写下这么一个“随机”序列比你想像的要困难得多。
　　心理学家已经发现，人们往往会忘记这样一个事实，即投掷硬币翻出正面之后再投掷一次，这时翻出正面的可能性与翻出反面的可能性相等；这么一来，他们连续猜测的时候就会不停地从正面跳到反面，很少出现连续把宝押在正面的情况。假如一次公平的硬币投掷连续30次翻出正面，第31次投掷翻出正面的机会还是跟翻出反面的机会相等。根本没有“正面已经翻完”这回事。同样，在六合彩中，上周的号码在本周再次成为得奖号码的机会，跟其他任何号码相等。为避免一不小心在随机性里加人规律因素，我们需要一个更加客观或者更加独立的机制。
　　一个诀窍在于选择某种固定的规则，一但要是一个秘密的而且足够复杂的规则，人们很难破解。举个例子：看看我们的句子的长度。假如一个句子包含奇数个单词，把它当做硬币的正面；假如一个句子包含偶数个单词，把它当做反面。这就变成一个很好的随机数字发生器。回过头来计算前面的10个句子，我们得到反、正、正、反、正、反、正、正、正、反。假如我们这本书不够轻便，没关系，其实我们随时随地都带着一些随机序列。比如朋友和亲属的出生日期的序列。若出生日期是偶数，当做正面；若是奇数，当做反面。也可以看你的手表的秒针。假如你的手表不准，别人没办法知道现在秒针究竟处于什么位置。对于必须使自己的混合策略比例维持在50：50的棒球投手，我们的建议是，每投一个球，先瞅一眼自己的手表。假如秒针指向一个偶数，投一个快球；假如指向奇数，投一个下坠球。实际上，秒针可以帮助你获得任何混合策略比例。比如，现在你要用40％的时间投快球而用另外60％的时间投下坠球，那么，请选择在秒针落在1…24之间的时候投快球，落在25…60之间的时候投下坠球。
　　7　．独一无二的情况
　　至此为此，上述所有推理过程都适用于橄榄球、篮球或者网球这样的比赛，在这些比赛中，相同的情况多次出现，而且每场比赛对垒的都是相同的参与者。于是，我们就有时间和机会看出任何有规则的行为，并相应采取行动。反过来，很重要的一点，在于避免一切会被对方占便宜的模式，坚持自己的最佳混合策略。不过，若是遇到只比一次的比赛，又该怎么办？
　　考察一场战役攻守双方的选择。这种情况通常都是独一无二的，彼此都不能从对方以前的行动中得出任何规律。但是，派出间谍侦察的可能性会引出一个随机选择的案例。假如你选择了一个具体的行动方针，却被敌人发现了你的打算，他就能选择对你最不利的行动方针。你希望让他大吃一惊；最稳妥的办法就是让你自己大吃一惊。你应该留出尽可能长的时间考虑各种可能的方案，直到最后一刻才通过一种不可预测的从而也是不可侦察的方法做出你的选择。这个方法包含的相对比例应该符合这样的要求：敌人就算发现了这个比例，也不能以此占据上风。不过，这其实就是我们前面已经讲过的最佳混合策略。
　　最后给你一个警告。即便在你采用了自己的最佳混合策略的时候，你还是有可能得到相当糟糕的结果。即便棒球投手戴夫·　
　　史密斯真的不可预测，有时候莱恩·　
　　戴克斯特拉还是可以碰巧猜中他会投什么球，将球击出场外。而在橄榄球比赛中，第三次死球且距离底线只剩一码的时候，稳扎稳打的选择是中路推进；不过，重要的是投出一个出其不意的球，迫使守方不敢轻举妄动。一且这样的传球得逞，球迷和体育解说员们会为选择这一策略而欢呼雀跃，赞扬教练是一个天才。假如传球失败，教练就会遭到众人批评：他怎么可以把宝押在一记长传之上，而不是选择稳扎稳打的中路推进？
　　评判这名教练的策略的时机，是在他将这个策略用于任何特定情况之前。教练应该公告天下，说混合策略至关重要；中路推进仍然是一个稳扎稳打的选择，其原因恰恰在于部分防守力量一定会被那个代价巨大的长传吸引过去。不过，我们怀疑，哪怕这名教练真会在比赛之前将这番理论通过所有的报纸和电视频道公告天下，只要他仍会在比赛里选择一个长传且不幸落败，他还是免不了遭到众人批评，就跟他此前根本没费心教给公众有关博弈论的知识差不多。
　　8　．谎言的安全措施
　　假如你采用了自己的最佳混合策略，那么，另一个参与者能不能发现这一点无关紧要，只要他不能提前发现你通过自己的随机机制为某个具体情况确定的具体行动方针。对于你的随机策略，他无计可施，占不了你的便宜。均衡策略恰恰就是用来防

返回目录上一页下一页回到顶部赞（0）踩（0）

第29章

策略思维-第29章

你可能喜欢的