セミナー 印刷

スモールデータ解析の方法と実問題解決への応用

~スモールデータの解析の実態とその方法論、データ収集の考え方~

受講可能な形式:【ライブ配信】or【アーカイブ配信】のみ
スモールなデータからいかにして知識を抽出するのか
不特定多数の多量のデータでではなく、
 特定の専門データである「スモールデータ」の活用で生産現場などの実務・現実問題の解決を
少量のデータから統計モデルを構築したい方、現場でのデータ解析、データ収集についてお困りの方は是非
スモールデータの収集方法とその留意点、解析の実態とその手法選択、方法論
必要となるデータの質、データ収集の留意点、スモールデータ解析の手法選択
機械学習の基礎知識、入力変数選択・異常検知手法などスモールデータに適したデータ解析手法、、、
日時 【ライブ配信】 2025年11月18日(火)  10:30~16:30
【アーカイブ配信】 2025年12月5日(金)  まで受付(視聴期間:12/5~12/18)
受講料(税込)
各種割引特典
55,000円 ( E-Mail案内登録価格 52,250円 ) S&T会員登録とE-Mail案内登録特典について
定価:本体50,000円+税5,000円
E-Mail案内登録価格:本体47,500円+税4,750円
E-Mail案内登録なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で55,000円 (2名ともE-Mail案内登録必須​/1名あたり定価半額の27,500円)
3名で82,500円 (3名ともE-Mail案内登録必須​) 
※4名以上も1名追加ごとに27,500円を加算

1名でのお申込みには、お申込みタイミングによって以下の2つ割引価格がございます
 
早期申込割引価格対象セミナー【オンライン配信セミナー1名受講限定】

終了しました。9月30日までの1名申込み : 受講料 35,200円(E-mail案内登録価格 35,200円)
 定価/E-mail案内登録価格ともに:本体32,000円+税3,200円
  ※1名様で開催月の2ヵ月前の月末までにお申込みの場合、上記特別価格になります。
  ※本ページからのお申込みに限り適用いたします。※他の割引は併用できません。

 
テレワーク応援キャンペーン(1名受講)【オンライン配信セミナー受講限定】

10月1日からの1名申込み:  受講料 44,000円(E-Mail案内登録価格 42,020円 )
 定価:本体40,000円+税4,000円
 E-Mail案内登録価格:本体38,200円+税3,820円
  ※1名様でオンライン配信セミナーを受講する場合、上記特別価格になります。
  ※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
  ※他の割引は併用できません。
配布資料PDFデータ(印刷可・編集不可)
※ライブ配信受講は開催2日前を目安にS&T会員のマイページよりダウンロード可となります。
※アーカイブ配信受講は配信開始日からダウンロード可となります。

 
オンライン配信ライブ配信(Zoom) ►受講方法・接続確認申込み前に必ずご確認ください
アーカイブ配信 ►受講方法・視聴環境確認申込み前に必ずご確認ください
備考※講義中の録音・撮影はご遠慮ください。
※開催日の概ね1週間前を目安に、最少催行人数に達していない場合、セミナーを中止することがございます。
得られる知識・機械学習の基礎知識
・入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
・スモールデータにおけるデータ収集の心構えの習得
対象・現実のデータの解析に興味のある技術者・研究者(線形代数・微積.統計などの初歩の知識を前提とする)
・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方
キーワード:スモールデータ解析、機械学習、不均衡データ解析、異常検出

セミナー講師

北海道大学 電子科学研究所 教授 博士(工学) 藤原 幸一 氏
 兼務 奈良先端科学技術大学院大学 メディルクス研究センタ 教授
 兼務 名古屋大学大学院工学研究科 特任教授
【講師紹介】

セミナー趣旨

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

セミナー講演内容

1.スモールデータとは
 1.1 スモールデータの特徴
 1.2 スモールデータ解析の現状

2.スモールデータ解析の方法論:次元削減と回帰分析
 2,1 主成分分析(PCA)
  2.1.1 PCAとは
  2.1.2 直交展開
  2.1.3 PCAの導出
  2.1.4 PCAと特異値分解
 2,2 最小二乗法
  2.2.1 回帰分析とは
  2.2.2 相関係数の意味
  2.2.3 最小二乗法の導出
  2.2.4 最小二乗法の幾何学的意味
  2.2.5 多重共線性の問題
 2.3 部分的最小二乗法(PLS)
  2.3.1 PLSとは
  2.3.2 潜在変数モデル
  2.3.3 PLSモデルの導出
  2.3.4 NIPALSアルゴリズム
  2.3.5 PLSから重回帰モデルへの変換
  2.3.6 クロスバリデーションによるパラメータチューニング

3.スモールデータ解析の方法論:入力変数選択
 3.1 入力変数選択とは
 3.2 スパースモデリング
  3.2.1 スパースとは
  3.2.2 リッジ回帰
  3.2.3 Lasso回帰
  3.2.4 エラスティックネットモデル
  3.2.5 Group Lasso
 3.3 変数クラスタリングによる入力変数選択
  3.3.1 スペクトラルクラスタリング
  3.3.2 NC法のコンセプト
  3.3.3 NCSCアルゴリズムの導出
  3.3.4 NCSCを用いた変数クラスタリングと入力変数選択
  3.3.5 製薬プロセスへの応用例

4.スモールデータ解析の方法論:不均衡データ解析
 4.1 サンプリング手法
  4.1.1 サンプリング手法とは
  4.1.2 アンダーサンプリングとオーバーサンプリング
 4.2 ブースティング
  4.2.1 ブースティングとは
  4.2.2 AdaBoost
  4.2.3 RandomForest
 4.3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  4.3.1 何故,ブースティングとサンプリング手法を組み合わせるか
  4.3.2 RUSBoost
  4.3.3 HUSDOS-Boost
 4.4 不均衡データ解析の大規模検診データへの適用例

5.スモールデータ解析の方法論:異常検出
 5.1 異常検出とは
 5.2 多変量統計的プロセス管理(MSPC)
  5.2.1 MPSCとは
  5.2.2 T2統計量とQ統計量の幾何学的意味
 5.3 自己符号化器(オートエンコーダー)
 5.4 異常検出問題の医療データ解析への応用例

6.スモールデータの収集・解析の考え方
 6.1 必要となるデータの質の問題
 6.2 データ収集の際の留意点
 6.3 スモールデータ解析の手法選択

質疑応答