Notice
Recent Posts
Recent Comments
목록RL (1)
NeuroWhAI의 잡블로그
PlaNet : 구글 딥마인드의 새로운 강화학습 모델
※ 저는 학생 수준도 아니라서 단순히 이런 것이 있더라 하는 글 정도로만 봐주시면 좋겠습니다 ㅎㅎ.. 먼저 Two Minute Papers 채널의 영상을 보시겠습니다. 약 한 달 전에 구글에서 PlaNet이라는 강화학습 모델을 공개하였습니다. 과거의 환경 정보만 가지고 미래의 행동과 환경을 예측 수행하여 최선의 행동을 결정한다고 합니다. 계획을 한다는 점에서 Plan이란 단어를 써 Net과 합친 이름인 것 같습니다. 기존 강화학습 알고리즘에 비해 점수가 크게 향상된 건 아닌 듯 하지만 미래를 예측하여 학습하므로 환경과의 상호작용이 50배 줄었다고 합니다. 또한 새로운 게임을 학습할 때 바닥부터 시작하는 것이 아니라 이전 게임에서 학습한 중력, 속도와 같은 공통의 개념을 가진 채로 학습을 이어 진행할 수도..
자료
2019. 3. 27. 20:34