時系列解析でよく聞く定常性とは?検定方法やなぜ重要なのか解説
時系列分析を勉強しているけど定常性がなんで時系列解析でよく出てくるか分からない方はいませんか?どうしてその性質が大事なのか。今回は誰にでも分かるように解説したいと思います。
まずは簡単に時系列データの定常性とは何か解説します。
定常性の性質を例を用いて解説
時系列データは
①定常時系列データ
②非定常時系列データ
この2種類に分かれます。
また、時系列データの定常性とは、時系列データの統計的な特性が時間によらず一定であるという性質のことを指します。
【性質】
・平均が時間によらず一緒
・分散が時間によらず一緒
・自己共分散または自己相関が時間によらず一定
定常時系列データは下記の画像のような時系列データを指します。
引用元
時系列データの「定常性」と「3つの非定常性」 – セールスアナリティクス (salesanalytics.co.jp)
<ぱっと見たときの特徴>
・時間によらず平均が一定=トレンド(上昇傾向・下降傾向)がなさそうである
・ばらつきがランダムそうである
非定常時系列データは下記のような画像の時系列データを指します。
引用元
時系列データの「定常性」と「3つの非定常性」 – セールスアナリティクス (salesanalytics.co.jp)
<ぱっと見たときの特徴>
・時間が経過するにつれてトレンド(上昇傾向)がある
・時間が経過するにつれてばらつきが大きくなっている
なぜ定常性は時系列解析で重要な概念なのか
ではなぜ定常性は時系列解析で重要な概念なのでしょうか?
それは、時系列モデルではデータの定常性を仮定しているモデルがあるからです。
詳しくは他にもありますが、とりあえず最初はこの認識で大丈夫だと思われます。
定常性を仮定しているモデルで有名なものではARIMAモデルが該当します。
ARIMAモデルは昔から存在する王道的なモデルであり、親しまれていますね。
ではこのARIMAモデルに非定常であるデータを学習させてしまったらどうなるでしょうか?
結果、「定常である」という仮定から違うため、精度がものすごく悪いモデルが出来てしまいます。
このような結果を防ぐために、定常か非定常かを検定で判断し、もし非定常であるならば
非定常→定常時系列データにする前処理を行うのです。
定常性であるか判断する検定方法
定常性であるか判断するためには
①視覚的な分析
②統計的検定の分析
この2種類があります。
視覚的な分析はデータを最初にお見せしたようにプロットして視覚的に確認します。
統計的な分析ではADF検定(単位根検定)やKPSS検などがあります。
【定常性の調べ方】
①視覚的な分析
・データをプロットして視覚的に確認
・時間に対して一定の平均,分散
②統計的な分析
・ADF検定(単位根検定)
時系列データが非定常であるという帰無仮説を検定する
・KPSS検定
データが定常であるという帰無仮説を検定
定常化処理の方法
画像引用元:時系列データの「定常性」と「3つの非定常性」 – セールスアナリティクス (salesanalytics.co.jp)
主な定常化処理は以下のものがあります。
1.差分取得
これはデータセットの各時点での値から前の時点の値を引く処理です。差分を取ることで、データのトレンドや季節性が取り除かれる可能性があります。
2.季節差分
これは差分取得の一種で、周期的なパターンを持つデータに対して行われます。例えば月次データで季節性が年単位であれば、12ヶ月前のデータを引くような形で季節差分が取られます。
3.Box-Cox変換
この変換はデータを正規分布に近づけることを目的としています。
4.対数変換
対数変換はデータの分散を安定化させるために行われることが多いです。具体的には、yt′=log(yt) という形でデータを変換します。対数変換は乗法的なトレンドや季節性を加法的なものに変換する効果もあります。
まとめ
いかがでしたか?
こちらに今日解説した内容をまとめました。
1.定常性とは
時系列データの統計的な特性(平均、分散、自己共分散)が時間に依存しない状態を指します。
2定常性の重要性
定常性は時系列分析でよく使用されるモデル(例:ARIMA)がこの性質を仮定しているため、非定常なデータをそのまま用いると分析の精度が低下します。
3.定常か非定常かの判断方法
・視覚的な分析:データをプロットして確認
・統計的な分析:ADF検定やKPSS検定など
4.定常化の手法
差分取得:トレンドや季節性を排除
季節差分:周期性があるデータに対して用いる
Box-Cox変換:データを正規分布に近づける
対数変換:分散を安定化させる