'RL' 태그의 글 목록

Notice

[공지] 소개

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록RL (1)

NeuroWhAI의 잡블로그

PlaNet : 구글 딥마인드의 새로운 강화학습 모델

※ 저는 학생 수준도 아니라서 단순히 이런 것이 있더라 하는 글 정도로만 봐주시면 좋겠습니다 ㅎㅎ.. 먼저 Two Minute Papers 채널의 영상을 보시겠습니다. 약 한 달 전에 구글에서 PlaNet이라는 강화학습 모델을 공개하였습니다. 과거의 환경 정보만 가지고 미래의 행동과 환경을 예측 수행하여 최선의 행동을 결정한다고 합니다. 계획을 한다는 점에서 Plan이란 단어를 써 Net과 합친 이름인 것 같습니다. 기존 강화학습 알고리즘에 비해 점수가 크게 향상된 건 아닌 듯 하지만 미래를 예측하여 학습하므로 환경과의 상호작용이 50배 줄었다고 합니다. 또한 새로운 게임을 학습할 때 바닥부터 시작하는 것이 아니라 이전 게임에서 학습한 중력, 속도와 같은 공통의 개념을 가진 채로 학습을 이어 진행할 수도..

자료 2019. 3. 27. 20:34

Prev 1 Next

목록RL (1)

NeuroWhAI의 잡블로그

티스토리툴바