本電子ゲームは、「Q学習(Q?Leaning)」を電子工作にしたものです。
Q学習は、機械学習分野における強化学習(Reinforcement Learning)の一種です。1989年のクリス・ワトキンズ(Chris Watkins)の論文に端を発するとされています。現在はQ学習とディープラーニングを組みあわせたDQN(Deep Q-Network)に融合され、囲碁や将棋で有力な棋士を倒しています。
本電子ゲームでは、迷路の最短コースを学習していくものです。初めに、割引率と学習率を設定します。
次にエピソードの最大数と1エピソードでのステップ数の最大値を設定します。学習による更新にはε?greedy法を使っています。εの値はエピソードが増えるにつれて単調減少し、エピソードが最大値になると0になります。最後に、即時報酬と最終報酬(reward)を入力します。
動画から、エージェントが試行錯誤しながら最終的に最短コースを学習していることが分かります。
なお、この課題は、涌井 良幸、涌井 貞美による『Excelでわかる機械学習 超入門 』(2019)を参考にPICマイコンに実装しました。
いろいろ設定を変えて、エージェントの「無邪気」な動きを楽しむことができます。
機械学習が気になる人が機械学習を繰り返し体験することで機械学習を学べます。
機械学習が気になる人
機械学習を繰り返し体験することで機械学習を学べます。
孫と祖父母が一緒に楽しめる電子ゲームを作っています。 高校生や高齢者介護サービスセンターの方のアイディアも取り入れています。
この作品を共有