【MCMC①】MCMC(マルコフ連鎖モンテカルロ法)とは?

マルコフ連鎖モンテカルロ法とは?
マルコフ連鎖モンテカルロ法(Markov Chain Monte Carlo、MCMC)とは、「複雑な確率分布からのサンプリングを行いたい」ときによく用いられるものです。
そもそもサンプリングとは、ある集団(母集団)から一部の要素(サンプル)を選び出すプロセスのことです。選挙の出口調査がその一例ですね。「投票者全員に投票先を聞くのは難しいので、ランダムに選んだ一部の投票者を対象に行った調査から全体の結果を予測する」ということです。
目的の(手に入れたい)確率分布が複雑で、直接サンプリングすることが困難、または不可能である場合に、MCMCが役立ちます。代表的な例としては、ベイズ統計学においてパラメータの事後分布を求めることが挙げられます。ベイズ統計モデリングを使用する際、パラメータの事後分布は解析的に求められない場合が多いですが、MCMCによって事後分布からのサンプリングが行えるようになり、パラメータ推定や予測ができるようになります。

「マルコフ連鎖」×「モンテカルロ法」
はじめに、MCMCの名前の由来を見てみましょう。まず「マルコフ連鎖」とは、未来の状態が現在の状態にのみ依存する確率過程のことをいいます。つまり、過去の履歴に依存せず、現在の状態から次の状態への遷移が決まる性質を持つものです。次に、「モンテカルロ法」とはランダムサンプリングを利用して、数値的な近似を行う方法です。MCMCでは、マルコフ連鎖を用いて、目的の確率分布に従うランダムサンプルを生成します。
MCMCの応用例
MCMCは、複雑な分布からサンプリングを行うことを可能にするため、データサイエンス・機械学習分野にとどまらず、物理学、工学、経済学など様々な分野で応用されています。
以下に、その具体的な応用例をいくつか挙げます。
機械学習
ディープラーニングや他の複雑な機械学習モデルにおける不確実性の定量化やモデルのパラメータ推定に使用されます。
金融工学とリスク管理
資産価格や金融市場のリスク評価において、MCMCは市場データからの確率モデル推定に使われます。
物理学と化学
統計力学における熱力学的性質の計算や量子系の挙動のモデリングに使われます。
生態学と進化生物学
種の分布や生態系のダイナミクスのモデル化に使用されます。
画像処理とコンピュータビジョン
画像のセグメンテーションや物体認識、テクスチャ合成など、画像解析の多くの場合ででMCMCが使われます。
次の記事では、MCMCの3つの代表的なアルゴリズムについてご紹介します!