Ｑ学習

ホーム

Ｑ学習

by テラオカ電子

コミュニケーション・繋がりホビー・エンタメ教育・学習

作品概要

本電子ゲームは、「Q学習（Q?Leaning）」を電子工作にしたものです。
Q学習は、機械学習分野における強化学習（Reinforcement Learning）の一種です。1989年のクリス・ワトキンズ（Chris Watkins）の論文に端を発するとされています。現在はQ学習とディープラーニングを組みあわせたDQN（Deep Q-Network）に融合され、囲碁や将棋で有力な棋士を倒しています。

　本電子ゲームでは、迷路の最短コースを学習していくものです。初めに、割引率と学習率を設定します。
次にエピソードの最大数と1エピソードでのステップ数の最大値を設定します。学習による更新にはε?greedy法を使っています。εの値はエピソードが増えるにつれて単調減少し、エピソードが最大値になると0になります。最後に、即時報酬と最終報酬（reward）を入力します。

　動画から、エージェントが試行錯誤しながら最終的に最短コースを学習していることが分かります。

　なお、この課題は、涌井良幸、涌井貞美による『Excelでわかる機械学習超入門』（2019）を参考にPICマイコンに実装しました。

　いろいろ設定を変えて、エージェントの「無邪気」な動きを楽しむことができます。

　機械学習が気になる人が機械学習を繰り返し体験することで機械学習を学べます。

続きを読む→