강화학습 기초공부 개요

 개요

해당 시리즈에서는 강화학습 기초에 대해 공부하며 중요한 내용들을 기록하고 여러 생각들과 함께 정리하려 합니다.

강화학습에 있어서 가장 유명한 책이 아닐까 싶은 Richard S. Sutton, Andrew G. Barto 교수님의 저서인 Reinforcement Learning: An Introduction, 2nd edition를 주로 참고할 예정이며 처음부터 끝까지 정리 및 요약 하기보다는 일부 부분은 간단하게 요약하고 일부 관심있는 부분 위주로 공부하여 작성하려 합니다. 주로 알파고나 뮤제로와 같이 최근에 나온 demo들의 내용과 연관되는 내용들이 주로 나올 것 같습니다.

해당 책은 구글 검색에서 complete draft버전의 pdf를 구할 수 있으니 관심이 있으시면 검색해 보시기를 바라며, 한글 번역판으로 김성우 님께서 번역해주신 '단단한 강화학습'이 있습니다.

해당 책은 RL에 대한 computational한 approach만을 담고 있는 것이 아니라 Psychology(심리학) 및 Neuroscience(신경과학)과의 연관성들을 소개하고 있으며 이는 꽤나 흥미로운 부분들이기도 합니다. RL은 단지 Computer Science의 한 연구분야인 것이 아니라 심리학 및 신경과학과 서로 상호적으로 아이디어와 결과물들을 주고받으며 성장해 온 것임을 알 수 있습니다. 이러한 내용들은 14, 15챕터에 서술되어 있습니다. 알고리즘 공부에는 큰 도움이 되지 않겠지만 RL이 단지 알고리즘의 영역만은 아니라는 것을 시사하는 점에서 책을 읽기에 추가적인 흥미가 생기지 않을까 싶기도 합니다.

글에 부족한 부분들이 있으면 지적해 주시면 큰 도움이 될 것이라고 생각합니다. 이만 개요를 마칩니다.

감사합니다.


댓글

가장 많이 본 글

구글 람다(LaMDA)란? - 구글의 언어 모델

알파고 강화학습 원리

버텍스 AI란? - 구글 인공지능 플랫폼

카타고와 바둑 두어보기

뉴럴 네트워크란?

블로그 글 목록

뉴럴 네트워크를 학습시키는 방법