株式会社Wave Technology 【資料】しるとくレポNo.32#Q-Learning
- 最終更新日:2022-04-05 15:47:26.0
- 印刷用ページ
ルールをR-Tableで、状態とアクションの組の予測値をQ-Tableで作成!Q-Learningのアルゴリズムをご紹介
★★しるとくレポ 知って得するお役立ち情報★★
私がプログラム開発する中で一番難しいと感じたのはアルゴリズムの実装です。
アルゴリズムの中には面白いものがたくさんあり、最近機械学習に関連する
強化学習の一つであるQ-Learningに触れる機会があり、それを実証する
プログラム(Cheese Puzzle Simulator)を作成してみました。
Q-Learningは、強化学習のアルゴリズムの一つで、自動運転からフィンテックまで
様々な分野で活用されています。
当レポートでは、Q-Learningのアルゴリズムを簡単に紹介したいと思います。
詳細については、是非ご一読ください。
【掲載内容】
■課題
■解説
※詳しくはPDF資料をご覧いただくか、お気軽にお問い合わせ下さい。
基本情報【資料】しるとくレポNo.32#Q-Learning
※詳しくはPDF資料をご覧いただくか、お気軽にお問い合わせ下さい。
価格帯 | お問い合わせください |
---|---|
納期 | お問い合わせください |
用途/実績例 | ※詳しくはPDF資料をご覧いただくか、お気軽にお問い合わせ下さい。 |
カタログ【資料】しるとくレポNo.32#Q-Learning
取扱企業【資料】しるとくレポNo.32#Q-Learning
【資料】しるとくレポNo.32#Q-Learningへのお問い合わせ
お問い合わせ内容をご記入ください。