개요
해당 시리즈에서는 강화학습 기초에 대해 공부하며 중요한 내용들을 기록하고 여러 생각들과 함께 정리하려 합니다.
강화학습에 있어서 가장 유명한 책이 아닐까 싶은 Richard S. Sutton, Andrew G. Barto 교수님의 저서인 Reinforcement Learning: An Introduction, 2nd edition를 주로 참고할 예정이며 처음부터 끝까지 정리 및 요약 하기보다는 일부 부분은 간단하게 요약하고 일부 관심있는 부분 위주로 공부하여 작성하려 합니다. 주로 알파고나 뮤제로와 같이 최근에 나온 demo들의 내용과 연관되는 내용들이 주로 나올 것 같습니다.
해당 책은 구글 검색에서 complete draft버전의 pdf를 구할 수 있으니 관심이 있으시면 검색해 보시기를 바라며, 한글 번역판으로 김성우 님께서 번역해주신 '단단한 강화학습'이 있습니다.
해당 책은 RL에 대한 computational한 approach만을 담고 있는 것이 아니라 Psychology(심리학) 및 Neuroscience(신경과학)과의 연관성들을 소개하고 있으며 이는 꽤나 흥미로운 부분들이기도 합니다. RL은 단지 Computer Science의 한 연구분야인 것이 아니라 심리학 및 신경과학과 서로 상호적으로 아이디어와 결과물들을 주고받으며 성장해 온 것임을 알 수 있습니다. 이러한 내용들은 14, 15챕터에 서술되어 있습니다. 알고리즘 공부에는 큰 도움이 되지 않겠지만 RL이 단지 알고리즘의 영역만은 아니라는 것을 시사하는 점에서 책을 읽기에 추가적인 흥미가 생기지 않을까 싶기도 합니다.
글에 부족한 부분들이 있으면 지적해 주시면 큰 도움이 될 것이라고 생각합니다. 이만 개요를 마칩니다.
감사합니다.
댓글
댓글 쓰기