セミナー

【期間限定:講演収録でも講師とQ&Aもできる!】
【WEBセミナー:オンデマンド配信】

よくわかる!強化学習の基礎と
Pythonによるアルゴリズム実装

~例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ~

このセミナーは、講師と直接Q&Aもできる、セミナーの映像収録(2020年5月21日収録)です。​
※お申込み日から14日間ご視聴いただけます。テキストはマイページからダウンロードできます。
※このセミナーに関する質問に限り、講師と直接メールにてQ&Aをすることができます。
★ 人工知能が人間エキスパートを超える時代に! 強化学習を使えば何でもできるのか?苦手な応用分野はあるのか?
★ 強化学習の基本原理を理解する! そして、Pythonによる強化学習アルゴリズムの実装を学ぶ!
日時 2020年11月27日(金)  23:59まで申込み受付中/【収録日:2020年5月21日(木)10:30~16:30】※視聴時間:3時間59分
会場 Webセミナー ※会社・自宅にいながら学習可能です※  【視聴期間はお申込み日から14日間です。】
会場地図
講師 奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域 准教授 吉本 潤一郎 氏
【経歴・研究、活動】

2002年 奈良先端科学技術大学院大学 情報科学研究科 博士後期課程修了、博士(工学)
機械学習、ニューロコンピューティング、計算神経科学などの研究に従事。
電子情報通信学会和文論文誌D編集副委員長、情報処理学会バイオ情報学研究会幹事、IEEE Computational Intelligence Society JAPAN CHAPTER Secretaryなどを担当。
【WebSite】
https://researchmap.jp/jun-y/
受講料(税込)
各種割引特典
49,500円 ( S&T会員受講料 46,970円 ) S&T会員登録について
定価:本体45,000円+税4,500円
会員:本体42,700円+税4,270円
S&T会員なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で49,500円 (2名ともS&T会員登録必須​/1名あたり定価半額24,750円) 
テレワーク応援キャンペーン(1名受講)【Live配信/WEBセミナー受講限定】
1名申込みの場合:受講料( 定価:35,200円/S&T会員 33,440円 )

35,200円 ( S&T会員受講料 33,440円 ) 
 定価:本体32,000円+税3,200円
 会員:本体30,400円+税3,040円
1名様でLive配信/WEBセミナーを受講する場合、上記特別価格になります。
※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
※他の割引は併用できません。
配布資料PDFデータをマイページからダウンロードできます。(印刷可/編集は不可)
備考※Webセミナーの録音・撮影、複製は固くお断りいたします。
【期間限定:講師とQ&Aもできる、講演収録済みWEBセミナー(オンデマンド配信)とは?】
以下の流れ・受講内容となります。

 ・録画セミナーの動画をお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
 ・申込み後すぐに視聴可能です(事前に「会員ログイン」または「新規会員登録」し、申込みされた場合のみ)。
  S&T会員マイページ(無料)にログインいただき、ご視聴ください。
   ※会員ログインまたは新規会員登録せずに申込みされた場合は、
    営業日3日後までに弊社にてマイページに設定し、閲覧通知のE-Mailをお送りいたします。
 ・視聴期間は申込日より14日間です。
  ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
 ・セミナー資料はマイページからダウンロードできますので、視聴開始に合わせてお手元で学習できます。
 ・このセミナーに関する質問に限り、講師とメールにて個別Q&Aをすることができます。
  具体的には、セミナー資料に講師のメールアドレスを掲載していますので、セミナーに関する質問がございましたら
  直接メールでご質問ください。
  (ご質問の内容や時期によっては、ご回答できない場合がございますのでご了承下さい。)
下記受講条件をご確認ください。
(1)S&T会員登録が必須になります(マイページ機能を利用するため)
  映像視聴、各種データのダウンロードなどにS&T会員マイページ機能(無料)を利用します。
  会員情報のご登録は、セミナー申込み時、または >>こちら よりお手続きいただけます。
   ※弊社案内(E-Mail,DM)を希望されない方はS&T 会員登録の際、案内方法欄のチェックを外してください。
    なお、案内希望チェックがない場合、会員価格(5%OFF)は適用できません。
    【会員価格5%OFFは、受講者全員がE-MailまたはDM案内希望の場合のみ適用】
(2)動画視聴・インターネット環境をご確認ください
  セキュリティの設定や、動作環境によってはご視聴いただけない場合がございます。
  以下のサンプル動画が閲覧できるかを事前にご確認いただいたうえで、お申し込みください。 
■サンプル動画■

>> 視聴環境   >> テスト視聴サイト
(3)申込み後、すぐに視聴可能なため、Webセミナーのキャンセルはできません。予めご了承ください。

セミナー趣旨

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

セミナー講演内容

<得られる知識・技術>
・強化学習を用いた研究開発に必要な最低限の基礎知識
・Python(Jupyter Notebook)を用いて強化学習アルゴリズムの実装する方法
・強化学習モデルを利用したヒトや動物の行動解析法
などの習得が期待されます。

<プログラム>
1.はじめに

 1.1 例題から学ぶ機械学習と強化学習の位置づけ
 1.2 強化学習の歴史

2.強化学習の基礎理論
 2.1 マルコフ決定過程による問題の定式化とその解法

  2.1.1 マルコフ決定過程
  2.1.2 価値反復法
  2.1.3 方策反復法
 2.2 代表的な強化学習アルゴリズム
  2.2.1 モンテカルロ法
  2.2.2 TD学習法
  2.2.3 Q学習法
  2.2.4 SARSA法
  2.2.5 モデル同定型強化学習法
 2.3 アルゴリズム実装時に生じる諸問題とその解決法
  2.3.1 探索と知識利用のジレンマ
  2.3.2 メタ学習
  2.3.3 連続空間・高次元空間への対応とDQN

3.プログラミング演習:Pythonによる強化学習アルゴリズムの実装
  (※各項目の合間に演習も織り交ぜます)

4.強化学習の応用例

 4.1 ロボットの自動制御
 4.2 脳の意思決定モデルと行動解析

■Q&A■
 このセミナーに関する質問に限り、講師とメールにて個別Q&Aをすることができます。
 具体的には、セミナー資料に講師のメールアドレスを掲載していますので、セミナーに関する質問がございましたら
 直接メールでご質問ください。
 (ご質問の内容や時期によっては、ご回答できない場合がございますのでご了承下さい。)