セミナー 印刷

よくわかる!強化学習の基礎と
Pythonによるアルゴリズム実装

~例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ~

★ 人工知能が人間エキスパートを超える時代に! 強化学習を使えば何でもできるのか?苦手な応用分野はあるのか?
★ 強化学習の基本原理を理解する! そして、Pythonによる強化学習アルゴリズムの実装を学ぶ!
日時 2020年3月30日(月)  10:30~16:30
会場 東京・品川区大井町 きゅりあん  5F 第3講習室
会場地図
講師 奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域 准教授 吉本 潤一郎 氏
【経歴・研究、活動】
2002年 奈良先端科学技術大学院大学 情報科学研究科 博士後期課程修了、博士(工学)
機械学習、ニューロコンピューティング、計算神経科学などの研究に従事。
電子情報通信学会和文論文誌D編集副委員長、情報処理学会バイオ情報学研究会幹事、IEEE Computational Intelligence Society JAPAN CHAPTER Secretaryなどを担当。
【WebSite】
https://researchmap.jp/jun-y/
受講料(税込)
各種割引特典
49,500円 ( S&T会員受講料 47,020円 ) S&T会員登録について
定価:本体45,000円+税4,500円
会員:本体42,750円+税4,270円
S&T会員なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で49,500円 (2名ともS&T会員登録必須​/1名あたり定価半額24,750円)
備考※資料・昼食付
※講義中の録音・撮影はご遠慮ください。
※講義中のパソコン使用はキーボードの打音などでご遠慮いただく場合がございます。

セミナー趣旨

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

セミナー講演内容

<得られる知識・技術>
・強化学習を用いた研究開発に必要な最低限の基礎知識
・Python(Jupyter Notebook)を用いて強化学習アルゴリズムの実装する方法
・強化学習モデルを利用したヒトや動物の行動解析法
などの習得が期待されます。

<プログラム>
1.はじめに
 1.1 例題から学ぶ機械学習と強化学習の位置づけ
 1.2 強化学習の歴史

2.強化学習の基礎理論
 2.1 マルコフ決定過程による問題の定式化とその解法

  2.1.1 マルコフ決定過程
  2.1.2 価値反復法
  2.1.3 方策反復法
 2.2 代表的な強化学習アルゴリズム
  2.2.1 モンテカルロ法
  2.2.2 TD学習法
  2.2.3 Q学習法
  2.2.4 SARSA法
  2.2.5 モデル同定型強化学習法
 2.3 アルゴリズム実装時に生じる諸問題とその解決法
  2.3.1 探索と知識利用のジレンマ
  2.3.2 メタ学習
  2.3.3 連続空間・高次元空間への対応とDQN

3.プログラミング演習:Pythonによる強化学習アルゴリズムの実装
  (※各項目の合間に演習も織り交ぜます)

4.強化学習の応用例
 4.1 ロボットの自動制御
 4.2 脳の意思決定モデルと行動解析


  □質疑応答・名刺交換□