MiracleJobLogo
エンジニアのエンジニアによるエンジニアのためのサイト
News 07/25 おすすめ情報に 『 【案件】Azure AD関連の認証設計/azureの基本設計 』 を追加しました。
会員登録するとキャリア診断やサイトに参加することができます。
あなたにおすすめな技術情報、資格、仕事などをお知らせします。

無料会員登録


パスワードを忘れた場合
LINEで送る
MiracleJobBanaLeft1
MiracleJobBanaLeft2


強化学習について
profile-img
投稿者: adaさん
投稿日:2024/07/09 17:23
更新日:2024/07/09 17:23
like-img
分類
技術
テクノロジー
その他
キャリア
テクニカルサポート
投稿内容
今回は、強化学習について説明いたします。

皆さんは、強化学習というのをご存知でしょうか

強化学習というのは、システム自身が試行錯誤しながら、
最適なシステム制御を実現する、機械学習手法のひとつです。

強化学習の学習の流れは以下になります。

①学習主体が環境の中に置かれ、その環境に対して行動します。
②環境が学習主体に、行動により更新された「状態」と「報酬」を確認して結果を出します。
③環境からの結果を元に、「方策」を修正します。
④これまでの一連の行動の結果として変化した環境の中で、
 再びエージェントが環境に対して行動を起こします。

強化学習の仕組みについては、犬のしつけや子供しつけに似ています。
例として以下に記載します。

犬におすわりをしつけることを考えます。
飼い主が「おすわり」と命令すると、
犬は飼い主の所作や声を知覚して座るか座らないかの判断をします。
ちゃんと座ることができたらおやつをあげることで、
犬は「おすわり」と言われた時に座るといいことがあると学習していきます。
その後、犬は飼い主を観察しその場にふさわしい行動がとれるようになります。

強化学習は、自動運転や自律制御ロボットのどの基盤技術として、近年注目されています。
皆さんも興味を持ちましら、調べてみてください。

■参考資料
強化学習とは 
https://ledge.ai/articles/reinforcement-learning
強化学習の基本を図と数式で理解する
cloud-tst.com
コメント


MiracleJobBanaRight1
MiracleJobBanaRight2
MiracleJobBanaRight3