Q学習

×

Q学習

by テラオカ電子
コミュニケーション・繋がり ホビー・エンタメ 教育・学習

作品概要

本電子ゲームは、「Q学習(Q?Leaning)」を電子工作にしたものです。
Q学習は、機械学習分野における強化学習(Reinforcement Learning)の一種です。1989年のクリス・ワトキンズ(Chris Watkins)の論文に端を発するとされています。現在はQ学習とディープラーニングを組みあわせたDQN(Deep Q-Network)に融合され、囲碁や将棋で有力な棋士を倒しています。

 本電子ゲームでは、迷路の最短コースを学習していくものです。初めに、割引率と学習率を設定します。
次にエピソードの最大数と1エピソードでのステップ数の最大値を設定します。学習による更新にはε?greedy法を使っています。εの値はエピソードが増えるにつれて単調減少し、エピソードが最大値になると0になります。最後に、即時報酬と最終報酬(reward)を入力します。

 動画から、エージェントが試行錯誤しながら最終的に最短コースを学習していることが分かります。

 なお、この課題は、涌井 良幸、涌井 貞美による『Excelでわかる機械学習 超入門 』(2019)を参考にPICマイコンに実装しました。

 いろいろ設定を変えて、エージェントの「無邪気」な動きを楽しむことができます。

 機械学習が気になる人が機械学習を繰り返し体験することで機械学習を学べます。

続きを読む→

ターゲットユーザー

機械学習が気になる人

ターゲットユーザーに与える価値

機械学習を繰り返し体験することで機械学習を学べます。

0
作品投稿者について

テラオカ電子

孫と祖父母が一緒に楽しめる電子ゲームを作っています。 高校生や高齢者介護サービスセンターの方のアイディアも取り入れています。

この作品を共有

コメントを残す*

コメントをキャンセル
※コメントに関する注意事項
次の作品タイトル
前の作品タイトル
新しい応募作品
No. GUGEN 2019 -159
Air Quality Tracker
by Air Tracker
7
0
No. GUGEN 2019 -158
Antimicrobial Detector
by Hasanuddin University
4
0
No. GUGEN 2019 -157
UNING Application As A Media
by senior high school number 1 kuta
3
0
No. GUGEN 2019 -156
Smart Portable Screening
by Universitas Gadjah Mada
15
0