凄い!1行でAI強化学習が作れたよ!プログラミングチャレンジ!ワンライナー!#python
ワンライナーでAIを作るシリーズ。今回は月面着陸のルナランダーを強化学習してみたよ。
■簡単なルール
操作
・何もしない
・右へ噴射
・左へ噴射
・下へ噴射
報酬とペナルティー
・着陸地点に近づくと報酬が増える。遠のくと減る
・スピードが遅いと報酬が増える。速いと減る
・機体の角度が並行でないと減る
・足が地面につくと報酬が増える
・左右エンジンを噴射すると報酬が減る
・下エンジンを噴射すると報酬がもっと減る
・安全に着陸すると報酬が加算。墜落すると減算
上記に基づいてPPOで強化学習が行われる。
今回の実験だと400000回の学習でかなりスムーズに着陸できるようになった。
ソースコードが欲しい人や質問したい方は、チャンネルの概要から
LINE公式アカウントまたはインスタグラムにメッセージください!
#プログラミング #プログラム #python #ai #強化学習
![]()
Contents