セミナー 印刷

機械学習の効果的活用に必要な
データ前処理の基礎と実践ノウハウ

~データ分析の進め方、構造化/非構造化データの前処理方法とそのポイント~

データの前処理が機械学習の成果を左右する!
成果を生み出すために必要なデータ前処理の基礎知識から、構造化/非構造化データ(画像・自然言語・時系列)それぞれの前処理の勘どころまで、デモを含めて分かりやすく解説します。
日時 2020年1月22日(水)  13:00~16:30
会場 東京・港区浜松町 ビジョンセンター浜松町  4F Iルーム
会場地図
受講料(税込)
各種割引特典
44,000円 ( S&T会員受講料 41,800円 ) S&T会員登録について
定価:本体40,000円+税4,000円
会員:本体38,000円+税3,800円
S&T会員なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で44,000円 (2名ともS&T会員登録必須​/1名あたり定価半額22,000円) 
備考※資料付
※講義中の録音・撮影はご遠慮ください。
※講義中のパソコン使用はキーボードの打音などでご遠慮いただく場合がございます。
得られる知識・実務でのデータ分析の進め方
・構造化/非構造化データの前処理方法
対象現場の生データに向き合い、どのように特徴量を作成すればよいかお悩みの方

セミナー講師

BULB株式会社 データサイエンティスト 足立 悠 氏​
 メーカーでSEやデータサイエンティスト、ITベンダーでデータアナリスト等を経て現職。また、雑誌記事や書籍の執筆、セミナー講師としても活動中。主な著書『初めてのTensorFlow』『ソニー開発のNeural Network Console入門』『機械学習のための「前処理」入門』。

セミナー趣旨

 データ活用を検討するとき、まずモデリングの技術(機械学習アルゴリズム)に目がいきがちです。モデル作成のためにアルゴリズムの知識は必要です。しかし、現場でデータに向き合い始めると、アルゴリズム以上にデータの前処理が重要であることを実感するでしょう。機械学習を効果的に活用できるかどうかは、データを前処理しどのように特徴量を作成するかにかかっています。
 本講演では、データを活用して解決したい問題、データの種類、利用するアルゴリズムなどによって、どのような点に気を付けて前処理をするとよいか、その勘所についてデモを含めて解説します。

セミナー講演内容

1.はじめに
 1.1 データ活用の現状
 1.2 データ分析に必要なスキル
 1.3 データ分析プロセス
 
2.構造化データの前処理
 2.1 統計量の確認
 2.2 可視化
 2.3 欠損値や外れ値の処理
 2.4 数値データの処理
 2.5 カテゴリデータの処理
 
3.非構造化データ(画像)の前処理
 3.1 カラーチャンネルの変更
 3.2 ヒストグラムによる特徴量作成
 3.3 画像の水増し

4.非構造化データ(時系列)の前処理
 4.1 時間軸の作成
 4.2 スライド窓による特徴量作成
 4.3 目的変数の作成
 
5.非構造化データ(自然言語)の前処理
 5.1 形態素解析・分かち書き処理
 5.2 単語文書行列による特徴量作成
 5.3 共起語リストによる特徴量作成

6.おわりに

 □質疑応答・名刺交換□