'심화 스터디/강화학습 스터디' 카테고리의 글 목록

심화 스터디/강화학습 스터디

작성 : 13기 최해윤 Part Ⅰ. Tabular Solution Methods 강화학습의 simplest forms에 대하여 배우는 챕터다. action-value function이 array나 table 형태로 나타나기에 충분할 정도로 그 state와 action space가 작은 형태다. 이러한 경우, optimal value function과 optimal policy를 찾을 가능성이 높다. 이는 오직 approximate solutions만 찾아내는 much larger problems과 대비된다. 강화학습이 다른 학습들과 구분되는 가장 중요한 특징은 correct actions에 대한 정보를 제공하여 instruct 하는 것이 아니라 actions을 평가한다는 것이다. 이것이 곧 active..

심화 스터디/강화학습 스터디 2021. 9. 17. 00:57

1. 강화학습이란 ?

작성 : 13기 최해윤 주어진 어떤 상황(state)에서 보상(reward)을 최대화할 수 있는 행동(action)에 대해 학습 답이 존재하는 훈련데이터를 토대로 한 학습이 아닌 환경과의 상호작용을 통해 학습 현재 선택한 Action이 미래의 순차적 보상에 영향 (Delayed Reward) External Supervisor이 존재하지 않는다. [ Trade-off between Exploitation and Exploration ] Agent는 reward를 얻기 위한 action을 선택하기 위해 이미 경험한 것을 exploit하거나 미래에 더 나은 action selection을 위한 environment와의 상호작용을 위해 explore한다. 위 두 방법 중에 더 나은 결과를 만들 방법을 택하여야..

심화 스터디/강화학습 스터디 2021. 9. 16. 22:19

0. 강화학습 스터디 개요

작성 : 13기 최해윤 스터디 구성원 : 10기 조규선 / 13기 최해윤 1. 진행 주제 선정 강화학습(Reinforcement Learning) : 어떤 환경을 탐색하는 에이전트는 현재 상태를 인식하여 어떤 행동을 취하고, 환경으로부터 포상을 얻는다. 강화학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다. 강화학습에 대한 이론적인 이해와 더불어 라이브러리를 활용한 구현을 목표로 스터디를 진행한다. 2. 진행 방법 선정 & 커리큘럼 논의 강화학습 바이블이라고 할 수 있는 Sutton 교수의 의 목차를 따라 팀원들은 개별 학습을 진행하고, 맡은 단원에 대한 10분 내..

심화 스터디/강화학습 스터디 2021. 9. 9. 22:24

강화학습 스터디 소개

팀원 10기 조규선, 13기 최해윤

심화 스터디/강화학습 스터디 2021. 8. 27. 17:44

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

심화 스터디/강화학습 스터디

추가 정보

인기글

최신글

페이징

티스토리툴바