【ポケポケ】カスミが表を出す確率は1/2なのか?-その1:最尤推定-
最近リリースされ大人気の「ポケポケ」で最も話題になっているカードの一つが「カスミ」です。しかし、最近「カスミでコインの表が出る確率が下方修正されたのではないか」という声が聞かれます。そこで本ブログ記事では、実際にオンライン対戦でカスミを使って表が出続ける回数を集計し、コインの表が出る確率を統計的に推定します。
1 はじめに
先日、ポケモンカードのアプリ「Pokémon Trading Card Game Pocket」(通称ポケポケ)がリリースされました。
ポケポケで最も話題になっているカードのひとつがカスミではないでしょうか。
カスミの効果は「裏が出るまでコイントスをして、表が出続けた数だけ水エネルギーを獲得する」というものです。エネルギーはポケモンがワザを出すために必要なので、コイントスしだいで何個でもエネルギーを獲得できるカスミは非常に凶悪強力なカードです。
そんなカスミですが、最近のオンライン対戦では「表が出にくくなった」「弱体化された」という声が聞かれます。
実は、1枚のカスミが獲得する水エネルギーの個数は幾何分布という確率分布に従うことが知られています。幾何分布をポケポケの文脈で簡単に説明すると、「表が出る確率が\(p\)であるコインを投げ続けるとき、初めて裏が出るまでの回数」が従う確率分布のことです。
そこで本ブログ記事では幾何分布を利用して、実際にオンライン対戦でカスミを使って表が出続ける回数を集計し、コインの表が出る確率\(p\)を統計的に推定します。
カスミの期待値について取り上げた多くの記事では、コインの表が出る確率=1/2を所与としています。
CPU対戦においてカスミが表を出す回数を集計した記事。CPU対戦では確率はほぼ1/2であったようです。
2 幾何分布とは
幾何分布の概要
幾何分布とは「成功確率が\(p\)である独立なベルヌーイ試行を繰り返すとき、初めて成功するまでの試行回数\(X \)が従う確率分布」のことです。
幾何分布に従う確率変数\(X\)の確率関数は次のようになります。
\[P(X=k)=(1-p)^{k-1}p \qquad (k=1,2,3, \ldots)\]
はじめの\((k-1)\)回の試行で失敗し続け、\(k\)回目の試行で初めて成功する確率を表しています。
より詳細に理解したい場合は、例えば以下のページが参考になります。
3 カスミの確率モデル
幾何分布について大まかに理解したところで、カスミがコイントスする試行を定式化します。
設定
・ コインの表が出る確率を\(p\)とする
・ 1枚のカスミがコイントスを行う回数(初めて裏が出る試行も含む)を\(X\)とする
重要な仮定
カスミによる各コイントスは独立に同一なベルヌーイ分布に従うことを仮定します。簡単に言えば、いかなる場合でもコインの表が出る確率は等しく\(p\)であるという仮定です。
つまり、次のような可能性は無視するものとします。
・プレイヤーが意図的に表を出すことができる
・表が出続けるほど、表が出る確率が低くなっていく
・コイントスの回数に上限が設定されている
・カスミを使うターンによって表の確率が変わる
上記の仮定の下では、次のことがいえます。
・\(X\)は幾何分布に従う
・(1枚のカスミが獲得する水エネルギーの個数) \(=X-1\)
確率関数
1枚のカスミがコイントスを行う回数\(X\)の確率関数は次のように表されます:
$$ P(X=k)=p^{k-1}(1-p) \qquad (k=1,2,3, \ldots) $$
はじめの\((k-1)\)回のコイントスで表を出し続け、\(k\)回目で初めて裏を出す確率を表しています。
※一般的な幾何分布の確率関数とは\(p\), \(1-p\)が逆になっていることに注意してください。
4 データ収集
集計方法
・サンプルサイズ:\(N=100\)
・集計期間:2024/11/21~2024/11/24
・集計場所:オンライン対戦(すべて「最強の遺伝子 エンブレムイベント1」で集計
データの概要
オンライン対戦で収集した100枚のカスミによるコイントスの結果を簡単に紹介します。
実際に集計された「1枚のカスミがコイントスを行った回数」を \(x_i\ (i=1,2,…,N)\) と表すことにします。
カスミが獲得した水エネルギーの個数\((x_{i}-1)\)の分布は次のようになりました。
標本平均の計算
収集した100回分のデータ\(x_i\ (i=1,2,…,N)\)から計算される\(X\)の標本平均は$$ \bar{x}=\frac{\sum_{i=1}^{100}x_{i}}{100}=1.89 $$でした。
5 最尤推定
今回は、最尤推定という方法によって表が出る確率\(p\)を点推定したいと思います。
最尤推定の詳細な説明は省略します。例えば以下の記事が参考になります。
1: 尤度関数の定式化
1枚のカスミがコイントスを行った回数を \(x_i (i=1,2, \ldots ,N)\) と表すことにします。
今回は100回分のデータを集めたので、サンプルサイズは\(N=100\)です。
このとき、尤度関数\(L(p)\)は次のように表されます。
$$ L(p)=\prod_{i=1}^{N}P(X=x_{i})=\prod_{i=1}^{N}p^{x_{i}-1}(1-p) $$
最大化計算を行いやすいように対数尤度関数\(\mathcal{L}(p)\)を求めておきます。
$$ \begin{align*} \mathcal{L}(p) &=\log L(p)\\ &=\sum_{i=1}^{N} \log p^{x_{i}-1}(1-p) \\ &=\sum_{i=1}^{N}\{ \log p^{x_{i}-1}+\log (1-p)\} \\ &=\sum_{i=1}^{N} \{ (x_{i}-1)\log p+\log (1-p) \} \end{align*} $$
2: 尤度関数の最大化
最尤推定量を求めるために、対数尤度関数\(\mathcal{L}(p)\)を\(p\)で微分して\(=0\)とおきます。
$$ \begin{align*} \frac{d\mathcal{L}(p)}{dp} &=\frac{\sum_{i=1}^{N} \{ (x_{i}-1)\log p+\log (1-p) \}}{dp}\\ &=\sum_{i=1}^{N} (\frac{x_{i}-1}{p}-\frac{1}{1-p})\\ &=\frac{\sum_{i=1}^{N}x_{i}-N}{p}-\frac{N}{1-p}\\ &=0 \end{align*} $$
この式を\(p\)について解きます。
$$ \begin{split} \frac{\sum_{i=1}^{N}x_{i}-N}{p}=\frac{N}{1-p}\\ (1-p)(\sum_{i=1}^{N}x_{i}-N)=pN\\ (1-p)\sum_{i=1}^{N}x_{i}-(1-p)N=pN \\ \sum_{i=1}^{N}x_{i}-p\sum_{i=1}^{N}x_{i}=N\\ p\sum_{i=1}^{N}x_{i}=\sum_{i=1}^{N}x_{i}-N \end{split} $$
表が出る確率\(p\)の最尤推定量\(\hat{p}\)は以下のようになります。
$$ \begin{split} \hat{p} &=1-\frac{N}{\sum_{i=1}^{N}x_{i}}\\ &=1-\frac{1}{\bar{x}} \qquad \Big(\bar{x}=\frac{\sum_{i=1}^{N}x_{i}}{N}\Big) \end{split} $$
ここまでの式変形が煩雑に感じたかもしれませんが、最終的には\(p\)の最尤推定量は\(X\)の標本平均\(\bar{x}\)を用いた簡単な式で表すことができました。
3: 収集したデータの代入
いよいよ本題です。最尤推定量\(\hat{p}=1-1/\bar{x}\)に\(N=100\)と収集したデータ\(x_{1},x_{2}, \ldots ,x_{100}\)を代入して、カスミがコイントスで表を出す確率\(p\)の最尤推定値を求めます。
収集したデータから得られた標本平均は\(\bar{x}=1.89\)だったので、\(p\)の最尤推定値は
$$ \begin{split} \hat{p} = 1-\frac{1}{1.89} \approx 0.471 \end{split} $$
となります。
今回収集したデータからは、カスミがコインの表を出す確率は47.1%であると推定されました!
6 まとめ
本ブログ記事では、幾何分布を利用してカスミのコイントスを確率モデルで表現しました。さらに最尤推定量を導出し、実際にカスミを使って収集したデータを代入することで表が出る確率\(p\)を点推定しました。
今回収集したデータからは、カスミがコインの表を出す確率は47.1%であると推定されました。
「思ったよりも高いな」というのが100回分のカスミを集計した筆者の感想なのですが、皆さんはどう感じるでしょうか。1/2よりも低いという点では予想通りではあるものの、誤差の範囲内である気もします。
そこで、次回のブログ記事では、統計的仮説検定を用いて「カスミがコインの表を出す確率は1/2よりも低いといえるのか?」を検証します!
追記 (2024/11/29)
続きの記事を公開しました。
7 おまけ
今回収集した100回分のカスミの結果です。
最高記録は7回(対戦相手の方)でした。惨敗しました。