猜硬币的游戏

Guess

快两个月没更新了,成天瞎忙…… 我们来看一个简单的题目吧,选自俄罗斯大神阿诺德(Влади́мир И́горевич Арно́льд)出的一百道题。[1] 题目是这样的:

一位游戏者藏起一枚 10 戈比或 20 戈比的硬币,另一位游戏者猜。猜对了就可以把硬币赢走,猜错了就要付出 15 戈比。这是个公平的游戏吗?双方最佳的混合策略是怎样的?

乍一看这游戏似乎还可以玩玩,要是猜对的几率有一半,那么作为猜的一方——且慢,我一旦猜错要付 15 戈比,可对方手里要是总是 10 戈比,我就是猜对也补不上猜错的啊?!但作为藏硬币的一方,我既不想冒太多输掉 20 戈比的风险,又不能一直出 10 戈比导致对方找到了规律,这应该怎么办呢?

题目中提到了一个词“混合策略”,这个是相对于纯策略而言的。纯策略是说你看到了一个情况,如何应对就完全确定了。但是这种互相猜的游戏,当然是出得随机让对方找不到规律才行,确定性的纯策略显然是不适用的。混合策略是指在给定的情况下,只为各种策略分配一个概率。那现在的问题,就是如何搭配这个概率了。

假设藏硬币的一方出 10 戈比的概率是 \( p\),自然出 20 戈比的概率就是 \( 1-p\)。设猜硬币的一方猜 10 戈比的概率是 \( q\)。那猜硬币的一方赢钱数的期望就是把猜对猜错的几种可能搭配起来:

\[
\begin{split}
E &= 10pq + 20(1-p)(1-q) – 15p(1-q) – 15q(1-p) \\
&= 60pq – 35p – 35q + 20
\end{split}
\]

研究下这个式子,如果猜的人观察到了对方出 10 戈比的概率 \( p\),那么\( E = (60p – 35) q – 35p + 20\)。自己能控制的是 \( q\),怎样才能赢最多钱呢?显然,如果 \( p > \frac{35}{60} = \frac{7}{12}\),那 \( q\) 就应当取尽量大,也就是一直猜 10 戈比。反过来,如果 \( p< \frac{7}{12}\),就应当一直猜 20 戈比。 可藏硬币的一方也不是等闲之辈啊,他要让赢钱的期望尽量小——如果他观察到了猜者的 \( q\),同样的道理,如果 \( q > \frac{7}{12}\),那 \( p\) 就应当取尽量大,也就是一直出 10 戈比。如果 \( q< \frac{7}{12}\),就应当一直出 20 戈比。

综合下来,藏硬币一方的最佳策略就是以 \( \frac{35}{60}\) 也就是 \( \frac{7}{12}\) 的概率出 10 戈比的硬币,那么不管对方如何应对,自己的收益是一定的。这个时候猜的一方赢钱的期望是:

\[
E = – 35 \times \frac{35}{60} + 20 = – \frac{5}{12}
\]

所以这个游戏是不公平的,下次要是再遇到类似的路边摊可不要上当啦。


[1] Арнольд, В. И. “МАТЕМАТИЧЕСКИЙ ТРИВИУМ.” Успехи математических наук 46.1 (1991): 277.

2 thoughts on “猜硬币的游戏

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据