0. 강화학습 스터디 개요
작성 : 13기 최해윤 스터디 구성원 : 10기 조규선 / 13기 최해윤 1. 진행 주제 선정 강화학습(Reinforcement Learning) : 어떤 환경을 탐색하는 에이전트는 현재 상태를 인식하여 어떤 행동을 취하고, 환경으로부터 포상을 얻는다. 강화학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다. 강화학습에 대한 이론적인 이해와 더불어 라이브러리를 활용한 구현을 목표로 스터디를 진행한다. 2. 진행 방법 선정 & 커리큘럼 논의 강화학습 바이블이라고 할 수 있는 Sutton 교수의 의 목차를 따라 팀원들은 개별 학습을 진행하고, 맡은 단원에 대한 10분 내..
심화 스터디/강화학습 스터디
2021. 9. 9. 22:24