凄い!1行でAI強化学習が作れたよ!プログラミングチャレンジ!ワンライナー!#python

0
93496-g_b5YJ3wT1I

ワンライナーでAIを作るシリーズ。今回は月面着陸のルナランダーを強化学習してみたよ。

■簡単なルール
操作
・何もしない
・右へ噴射
・左へ噴射
・下へ噴射

報酬とペナルティー
・着陸地点に近づくと報酬が増える。遠のくと減る
・スピードが遅いと報酬が増える。速いと減る
・機体の角度が並行でないと減る
・足が地面につくと報酬が増える
・左右エンジンを噴射すると報酬が減る
・下エンジンを噴射すると報酬がもっと減る
・安全に着陸すると報酬が加算。墜落すると減算

上記に基づいてPPOで強化学習が行われる。
今回の実験だと400000回の学習でかなりスムーズに着陸できるようになった。

ソースコードが欲しい人や質問したい方は、チャンネルの概要から
LINE公式アカウントまたはインスタグラムにメッセージください!

#プログラミング #プログラム #python #ai #強化学習

Loading

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です