.box_article .article_cont p code
작성 : 13기 최해윤
스터디 구성원 : 10기 조규선 / 13기 최해윤
강화학습(Reinforcement Learning) : 어떤 환경을 탐색하는 에이전트는 현재 상태를 인식하여 어떤 행동을 취하고, 환경으로부터 포상을 얻는다. 강화학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다.
강화학습에 대한 이론적인 이해와 더불어 라이브러리를 활용한 구현을 목표로 스터디를 진행한다.
[ 1주차 발표 ]
조규선 : The Reinforcement Learning Problem
최해윤 : Multi-arm Bandits
2. Multi-arm Bandits (0) | 2021.09.17 |
---|---|
1. 강화학습이란 ? (0) | 2021.09.16 |
강화학습 스터디 소개 (0) | 2021.08.27 |
댓글 영역