強化学習について

会員登録するとキャリア診断やサイトに参加することができます。

あなたにおすすめな技術情報、資格、仕事などをお知らせします。

無料会員登録

強化学習について

投稿者： adaさん

投稿日：2024/07/09 17:23

更新日：2024/07/09 17:23

分類

技術

テクノロジー

その他

キャリア

テクニカルサポート

投稿内容

今回は、強化学習について説明いたします。

皆さんは、強化学習というのをご存知でしょうか

強化学習というのは、システム自身が試行錯誤しながら、
最適なシステム制御を実現する、機械学習手法のひとつです。

強化学習の学習の流れは以下になります。

①学習主体が環境の中に置かれ、その環境に対して行動します。
②環境が学習主体に、行動により更新された「状態」と「報酬」を確認して結果を出します。
③環境からの結果を元に、「方策」を修正します。
④これまでの一連の行動の結果として変化した環境の中で、
再びエージェントが環境に対して行動を起こします。

強化学習の仕組みについては、犬のしつけや子供しつけに似ています。
例として以下に記載します。

犬におすわりをしつけることを考えます。
飼い主が「おすわり」と命令すると、
犬は飼い主の所作や声を知覚して座るか座らないかの判断をします。
ちゃんと座ることができたらおやつをあげることで、
犬は「おすわり」と言われた時に座るといいことがあると学習していきます。
その後、犬は飼い主を観察しその場にふさわしい行動がとれるようになります。

強化学習は、自動運転や自律制御ロボットのどの基盤技術として、近年注目されています。
皆さんも興味を持ちましら、調べてみてください。

■参考資料
強化学習とは
https://ledge.ai/articles/reinforcement-learning
強化学習の基本を図と数式で理解する
ｃloud-tst.com