時系列データや時系列解析とは?メリットや回帰分析との違いを解説
時系列データや時系列解析とは何か、また時系列解析の種類やメリット、主な活用方法についても解説しています。
主な分析の例として定常性を挙げ、最後に回帰分析との違いをまとめています。
目次
はじめに
時系列データはビジネスで多く活用されます。
時系列データや時系列解析とはそもそも何か、ざっくりとどのような分析をするのか知りたい方に基礎を解説したいと思います。
定常性についても軽く解説しています。
1.時系列データとは
時系列データとは時間の経過によって観測・記録したデータのことを指します。
よくあるデータとしては天気データや売り上げのデータが該当します。
時系列データは、経済学、気象学、医学など多岐にわたる分野で使用される重要なデータ形式です。
2.時系列解析とは
一般に,時系列解析は以下の目的で行われます。
【時系列解析の目的】
①過去のデータから未来を予測
②情報抽出(分析)
③異常値探知や意思決定
この中でも最もビジネスによく使用されるのは
①過去のデータから未来を予測です。
そのため、別の記事で予測モデル構築の仕方について詳しく解説したいと思います。
3.時系列データの種類
時系列データの種類は大まかに5つあります。 簡単に言いますと、このようになります。
【時系列データの種類】
1.連続か離散か:
- 連続時系列データ: 連続的に得られるデータのことを指します。例えば、センサーからの連続的な測定値や、毎秒ごとの株価などがこれに該当します。
- 離散時系列データ: 一定の間隔で得られるデータのこと。例としては、日ごと、月ごと、年ごとのデータなどがあります。
2.1変数か多変量か:
- 1変数時系列データ: 一つの変数のみの時間経過に伴う変動を示すもの。月ごとの気温の変動や日ごとの株価などが該当。
- 多変量時系列データ: 複数の変数の時間経過に伴う変動を同時に示すデータ。異なる変数間の関係性や影響を時間経過とともに観察可能。
3.定常か定常ではないか:
- 定常時系列データ: 平均や分散、共分散などの統計的性質が時間によって変化しないデータ。
- 非定常時系列データ: 上記の性質が時間に依存して変わるデータ。多くの時系列解析手法は定常性を前提としているため、非定常データは変換を行う必要があることが多い。
4.線形か線形でないか:
- 線形時系列データ: データ間の関係が線形の方程式で表せるもの。一般的な回帰分析などで扱われる。
- 非線形時系列データ: データ間の関係が線形では表現できないもの。非線形の動的システムやカオス理論などで扱われることが多い。
5.ガウス型かガウス型ではないか:
- ガウス型時系列データ: データの確率分布が正規分布(ガウス分布)に従うもの。多くの統計手法の前提としてこのタイプのデータ分布を想定している。
- 非ガウス型時系列データ: ガウス分布に従わないデータの分布を持つもの。これには、重い尾の分布やスパイクのような異常値を含むデータなどがあります。
これらの分類に基づき、時系列データを正確に理解し、適切な分析手法を選択することが可能となります。
4.定常性は時系列データで重要なポイント
定常性は時系列データでとても重要なキーワードになります。
定常性の性質としては
・平均が時間によらず一緒
・分散が時間によらず一緒
などがあります。
なぜ、重要かと言いますと「時系列の予測モデルでは定常性を前提条件としているモデルがあるから」です。そのため、定常を前提としたモデルを使用して予測モデルを構築する場合、非定常データを定常データに変換する必要があるのです。
5.時系列解析のメリット
時系列解析を用いてデータを分析することは、多岐にわたる分野での問題解決や意思決定の支援に非常に有効です。
具体的な活用例を紹介します。
1.株式取引の不正行為検知:
- 金融市場における株式取引のデータを時系列解析することで、不自然な価格の動きや取引パターンを検知し、不正行為やマーケットマニピュレーションを早期に特定することができます。
2.需要予測での発注の最適化:
- 将来の需要を時系列データを元に予測し、製品の発注量や生産計画を最適化することで、在庫の過不足を防ぎ、効率的な運営を実現できます。
これらの利用例を見ると、時系列解析はビジネスの効率化やリスク軽減に大きく貢献する技術として、データサイエンティストやビジネスパーソンには非常に価値のあるスキルと言えるでしょう。
6.時系列解析と回帰分析との違い
確かに、時系列解析と回帰分析は、データ分析の方法として似ている部分もありますが、異なる側面も多く存在します。
1.対象とするデータ:
- 回帰分析は、一般に2つ以上の変数間の関係を調べるために使用されます。これに対して、時系列解析は時間に関連するデータ、例えば月ごとの売上や日々の気温の変動などのデータを対象とします。
2.データの性質:
- 回帰分析は、データ間の因果関係や相関関係を明らかにするのが目的です。しかし、時系列解析では、時間の経過とともに変動するデータのトレンドや周期性、季節性などの要素を特定するのが主な目的となります。
3.定常性:
- 時系列解析においては、データの定常性が非常に重要です。データが非定常である場合、特定の方法を使って定常に変換する必要があります。これに対して、回帰分析では、このような前処理は必要ありません。 ※予測モデルで定常性が前提とされているモデルを使用する場合のみです
参考文献
・時系列データ 未来予測 – Bing images 閲覧日2023/10/30
・時系列データの予測モデルについて解説! | DeepSquare 閲覧日2023/10.30
・AI 不正・リスク検知サービス for アンチ・マネーローンダリング(AML) : FinTech |NEC 閲覧日2023/10/30
・CTC、AIを使ってサプライチェーンを最適化するシステム製品を販売、DataRobotを活用 | IT Leaders (impress.co.jp) 閲覧日2023/10/30
・引用元:時系列データの「定常性」と「3つの非定常性」 – セールスアナリティクス (salesanalytics.co.jp) 閲覧日2023/10/30