.box_article .article_cont p code

상세 컨텐츠

본문 제목

0. 강화학습 스터디 개요

심화 스터디/강화학습 스터디

by hae-koos 2021. 9. 9. 22:24

본문

작성 : 13기 최해윤

스터디 구성원 : 10기 조규선 / 13기 최해윤 

 

1. 진행 주제 선정

강화학습(Reinforcement Learning) : 어떤 환경을 탐색하는 에이전트는 현재 상태를 인식하여 어떤 행동을 취하고, 환경으로부터 포상을 얻는다. 강화학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다.

 

강화학습에 대한 이론적인 이해와 더불어 라이브러리를 활용한 구현을 목표로 스터디를 진행한다.

 

2. 진행 방법 선정 & 커리큘럼 논의

  • 강화학습 바이블이라고 할 수 있는 Sutton 교수의 < Reinforcement Learning : An Introduction > 의 목차를 따라 팀원들은 개별 학습을 진행하고, 맡은 단원에 대한 10분 내외의 발표를 준비한다. 
  • Python OpenAI Gym 라이브러리를 사용하는 법을 알아보고, 그 활용법에 대해 공부한다.

 

3. 주차별 발표자 선정

[ 1주차 발표 ] 

조규선 : The Reinforcement Learning Problem

최해윤 : Multi-arm Bandits

'심화 스터디 > 강화학습 스터디' 카테고리의 다른 글

2. Multi-arm Bandits  (0) 2021.09.17
1. 강화학습이란 ?  (0) 2021.09.16
강화학습 스터디 소개  (0) 2021.08.27

관련글 더보기

댓글 영역