セミナー 印刷

スモールデータ解析の方法と実問題解決への応用
【LIVE配信】

~スモールデータの解析の実態とその方法論、データ収集の考え方~

受講可能な形式:【Live配信】のみ
日時 2025年7月31日(木)  10:30~16:30
受講料(税込)
各種割引特典
55,000円 ( E-Mail案内登録価格 49,500円 ) S&T会員登録とE-Mail案内登録特典について
定価:本体50,000円+税5,000円
E-Mail案内登録価格:本体45,000円+税4,500円
※サイエンス&テクノロジーが設定しているアカデミー価格対象外のセミナーです。
※サイエンス&テクノロジーが設定しているキャンセル規定対象外のセミナーです。
※ E-mail案内登録価格申込者には主催者のR&D支援センターからも無料でセミナー等の案内をお送り致します。
E-Mail案内登録なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で55,000円 (2名ともE-Mail案内登録必須/1名あたり定価半額27,500円) 
主催(株)R&D支援センター
配布資料・セミナー資料(PDF)を開催前日までにお送りいたします。
 無断転載、二次利用や講義の録音、録画などの行為を固く禁じます。
オンライン配信・本セミナーは「Zoom」を使ったWEB配信セミナーとなります。

【Zoomを使ったWEB配信セミナー受講の手順】
1)Zoomを使用されたことがない方は、こちらからミーティング用Zoomクライアントをダウンロードして下さい。
  ダウンロードできない方はブラウザ版でも受講可能です。
2)セミナー前日までに必ず動作確認をお願いします。
  
Zoom WEBセミナーのはじめかたについてはこちらをご覧ください。
3)開催日直前にWEBセミナーへの招待メールをお送りいたします。
  当日のセミナー開始10分前までに招待メールに記載されている視聴用URLよりWEB配信セミナーにご参加下さい。
得られる知識・機械学習の基礎知識
・入力変数選択・異常検知手法などスモールデータに適したデータ解析手法
・スモールデータにおけるデータ収集の心構え
対象・現実のデータの解析に関心のある技術者・研究者
・少量のデータから統計モデルを構築したいと考えている方
・現場でのデータ解析に従事する方
・現場におけるデータ収集についてお困りの方

セミナー講師

北海道大学 電子科学研究所 教授 博士(工学)藤原 幸一 氏

【専門】
 機械学習・生体信号処理・医療AI
【略歴】
 2004年 3月 京都大学工学部工業化学科卒業
 2006年 3月 京都大学大学院工学研究科化学工学専攻修士課程修了
 2006年 4月 トヨタ自動車株式会社入社
 2007年 4月 京都大学大学院工学研究科化学工学専攻・博士後期課程進学
 2008年 4月 JSPS特別研究員・DC2
 2009年 3月 京都大学博士(工学)取得
 2009年 4月 JSPS特別研究員・PD
 2009年10月 豪州Curtin 大学・客員研究員
 2010年 4月 NTT持ち株会社コミュニケーション科学基礎研究所
 2012年 7月 京都大学大学院情報学研究科システム科学専攻・助教
 2018年10月 JSTさきがけ研究員(社会システム)
 2018年11月 名古屋大学大学院工学研究科物質プロセス工学専攻・准教授
         東京医科歯科大学・非常勤講師,滋賀医科大学・客員准教授,
         東京大学・客員准教授,京都大学・研究員
 2025年 4月 現職

セミナー趣旨

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

セミナー講演内容

1.スモールデータとは?
  1-1 スモールデータの特徴
  1-2 スモールデータ解析の現状
2.スモールデータ解析の方法論:次元削減と回帰分析
  2-1 主成分分析 (PCA)
   2-1-1 PCAとは
   2-1-2 直交展開
   2-1-3 PCAの導出
   2-1-4 PCAと特異値分解
  2-2 最小二乗法
   2-2-1 回帰分析とは
   2-2-2 相関係数の意味
   2-2-3 最小二乗法の導出
   2-2-4 最小二乗法の幾何学的意味
   2-2-5 多重共線性の問題
  2-3 部分的最小二乗法 (PLS)
   2-3-1 PLSとは
   2-3-2 潜在変数モデル
   2-3-3 PLSモデルの導出
   2-3-4 NIPALSアルゴリズム
   2-3-5 PLSから重回帰モデルへの変換
   2-3-6 クロスバリデーションによるパラメータチューニング
3.スモールデータ解析の方法論:入力変数選択
  3-1 入力変数選択とは
  3-2 スパースモデリング
   3-2-1 スパースとは
   3-2-2 リッジ回帰
   3-2-3 Lasso回帰
   3-2-4 エラスティックネットモデル
   3-2-5 Group Lasso
  3-3 変数クラスタリングによる入力変数選択
   3-3-1 スペクトラルクラスタリング
   3-3-2 NC法のコンセプト
   3-3-3 NCSCアルゴリズムの導出
   3-3-4 NCSCを用いた変数クラスタリングと入力変数選択
   3-3-5 製薬プロセスへの応用例
4.スモールデータ解析の方法論:不均衡データ解析
  4-1 サンプリング手法
   4-1-1 サンプリング手法とは
   4-1-2 アンダーサンプリングとオーバーサンプリング
  4-2 ブースティング
   4-2-1 ブースティングとは
   4-2-2 AdaBoost
   4-2-3 RandomForest
  4-3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
   4-3-1 何故,ブースティングとサンプリング手法を組み合わせるか
   4-3-2 RUSBoost
   4-3-3 HUSDOS – Boost
  4-4 不均衡データ解析の大規模検診データへの適用例
5.スモールデータ解析の方法論:異常検出
  5-1 異常検出とは
  5-2 多変量統計的プロセス管理 (MSPC)
   5-2-1 MPSCとは
   5-2-2 T2統計量とQ統計量の幾何学的意味
  5-3 自己符号化器 (オートエンコーダー)
  5-4 異常検出問題の医療データ解析への応用例
6.スモールデータの収集・解析の考え方
  6-1 必要となるデータの質の問題
  6-2 データ収集の際の留意点
  6-3 スモールデータ解析の手法選択