0. 강화학습 스터디 개요

심화 스터디/강화학습 스터디

by hae-koos 2021. 9. 9. 22:24

작성 : 13기 최해윤

스터디 구성원 : 10기 조규선 / 13기 최해윤

1. 진행 주제 선정

강화학습(Reinforcement Learning) : 어떤 환경을 탐색하는 에이전트는 현재 상태를 인식하여 어떤 행동을 취하고, 환경으로부터 포상을 얻는다. 강화학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다.

강화학습에 대한 이론적인 이해와 더불어 라이브러리를 활용한 구현을 목표로 스터디를 진행한다.

2. 진행 방법 선정 & 커리큘럼 논의

강화학습 바이블이라고 할 수 있는 Sutton 교수의 < Reinforcement Learning : An Introduction > 의 목차를 따라 팀원들은 개별 학습을 진행하고, 맡은 단원에 대한 10분 내외의 발표를 준비한다.
Python OpenAI Gym 라이브러리를 사용하는 법을 알아보고, 그 활용법에 대해 공부한다.

3. 주차별 발표자 선정

[ 1주차 발표 ]

조규선 : The Reinforcement Learning Problem

최해윤 : Multi-arm Bandits

저작자표시 (새창열림)

'심화 스터디 > 강화학습 스터디' 카테고리의 다른 글

2. Multi-arm Bandits (0)	2021.09.17
1. 강화학습이란 ? (0)	2021.09.16
강화학습 스터디 소개 (0)	2021.08.27

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

1. 진행 주제 선정

2. 진행 방법 선정 & 커리큘럼 논의

3. 주차별 발표자 선정

'심화 스터디 > 강화학습 스터디' 카테고리의 다른 글

관련글 더보기

댓글 영역

추가 정보

인기글

최신글

티스토리툴바