セミナー 印刷

時系列データ分析の基礎・モデル化と
異常検知・機械学習への応用

~時系列データの特徴を調べる~
~時系列データの変動パターンを数式で表現する~
~PythonやRによる実践方法も解説~

「時系列データ」を対象にし、データの個性を定量化する統計的分析や、数式として表現する時系列モデルを多数解説

更に応用として「将来予測」「異常検知」に着眼し、より高度な機械学習モデルを取り入れつつ、実務へ応用する

図解による分かり易さを重視し解説します!

フリーソフトのPythonやRによる実践方法も紹介
 
日時 2019年4月22日(月)  10:30~17:30
会場 東京・大田区平和島 東京流通センター 2F  第5会議室
会場地図
受講料(税込)
各種割引特典
48,600円 ( S&T会員受講料 46,170円 ) S&T会員登録について
定価:本体45,000円+税3,600円
会員:本体42,750円+税3,420円
S&T会員なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で48,600円 (2名ともS&T会員登録必須​/1名あたり定価半額24,300円) 
備考資料・昼食付
※講義中の録音・撮影はご遠慮ください。
※講義中のパソコン使用はキーボードの打音などでご遠慮いただく場合がございます。

セミナー講師

茨城大学 大学院 理工学研究科 機械システム工学専攻 教授 博士(理学) 鈴木 智也 氏
※CollabWiz(株) 代表取締役
※大和投信信託委託クウォンツ運用部 特任主席研究員
【専門】データサイエンス

セミナー趣旨

 近年、人工知能や機械学習が注目を集めていますが、技術的な大変化が突然起こったのではなく、過去の研究成果の積み重ねによって深層学習などの新しいモデルが誕生しました。つまりホットな技術を活用するためにも、基礎的な周辺知識は重要です。
 そこで今回のセミナーでは「時系列データ」を対象にし、データの個性を定量化する統計的分析や、数式として表現する時系列モデルを多数紹介します。更にこれらの応用として「将来予測」や「異常検知」に着眼し、より高度な機械学習モデルを取り入れつつ、実務への応用をサポートします。
 本セミナーでは図解による分かり易さを重視しますが、その解説のみに終始せず、フリーソフトPythonやRによる実践方法も多数紹介します。全てのプログラムを配布しますので、復習やお仕事にご活用いただけます。

セミナー講演内容

1.時系列データの特徴を調べる(統計的分析)
 (1) ランダムか?法則的か?
  a. 確率論的モデルと決定論的モデル
  b. その判別方法(法則性の可視化)
 (2) 過去は未来に影響するか?
  a. 相関性と非独立性(非線形相関)の違い
  b. 非独立性の確認(連検定,BDSテスト,相互情報量)
  c. 相関性の確認(相関係数,自己相関関数)
  d. 疑似相関に注意(偏相関係数)
  e. 偏自己相関関数
 (3) 他から影響を受けるか?
  a. 同時刻の関係(相関性と非独立性の違い)
  b. 時間遅れを伴う関係(相関性と因果性の違い)
  c. 相関性の確認(相互相関関数)
  d. 因果性の確認(移動エントロピー,グランジャー因果テスト)

2.時系列データの変動パターンを数式で表現する(時系列モデル)
 (1) ランダムウォーク
  a. 確率的トレンドと確定的トレンド
  b. 定常性と非定常性
  c. 定常化と単位根検定
  d.トレンド成分と季節成分の分解
 (2) 平均値(期待値)の推定
  a. AR(自己回帰)モデル
  b. 過学習を防ぐAIC(赤池情報量基準)
  c. ARMA(自己回帰移動平均)モデル
  d. ARIMA(自己回帰和分移動平均)モデル
  e. SARIMA(季節自己回帰和分移動平均)モデル
  f. 残差診断
 (3) 分散値(リスク)の推定
  a. ARCHモデル
  b. GARCHモデル
  c. ARIMA-GARCHモデル
 (4) 将来予測への応用
  a. モンテカルロシミュレーションによる長期予測
  b. 残差の時間構造も考慮する方法
 (5) 異常検知への応用
  a. 予測モデルを使う方法
  b. 予測モデルを使わない方法

3.機械学習で学習力を強化する(非線形モデル)
 (1) 線形モデルと非線形モデルの違い
  a. 重回帰分析から「非線形重回帰分析」へ
  b. 最も手軽なのに高性能な「k近傍法」
  c. 機械学習の失敗につながる「次元の呪い」
  d. 交差確認法(CV法)
  e.モデルパラメータとハイパーバラメータの違い
 (2) ニューラルネットワーク
  a. 単一ニューロンモデルの学習則(最急勾配法)
  b. ニューラルネットワークの学習則(逆誤差伝搬法)
  c. 多層ニューラルネットの問題点(勾配消失問題,過学習)
  d. 深層学習(ディープラーニング)を可能にしたオートエンコーダ
 (3) 決定木
  a. 因果関係が分かりやすいIf-Thenルール
  b. 情報エントロピーを低下させる
 (4) 集団学習
  a. 多数決で予測精度を向上させる(集合知)
  b. 予測精度が向上する理由(集合知定理)
  c. いろいろな集団学習(バギング, ランダムフォレスト, 勾配ブースティング)
 (5) 機械学習による異常検知
  a. k近傍法の場合
  b. 決定木の場合
  c. ニューラルネットワークの場合

 付録資料
  (1) フリーソフトPythonの基本操作ガイド
  (2) フリーソフトRの基本操作ガイド
  (3) PythonとRの連携方法

  □質疑応答□