NeuroWhAI의 잡블로그

딥마인드의 인공지능 알파스타(AlphaStar)가 스타2 프로게이머에게 승리 본문

자료

딥마인드의 인공지능 알파스타(AlphaStar)가 스타2 프로게이머에게 승리

NeuroWhAI 2019. 1. 26. 14:26


https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/


알파스타의 동작 시각화를 포함한 한 경기 영상.


알파스타가 사람과 치른 모든 경기를 요약한 경기 영상.

(영상에서 빠진 경기도 있음)


인공지능 알파스타(AlphaStar)가 며칠 전 프로게이머 MaNa에게 5:0으로 승리하였다고 합니다.

리매치에서 MaNa가 약점을 파악하여 1번 승리하였다는 소식[각주:1]도 있네요.

알파스타는 이전에 TLO라는 저그 유저와도 경기하여 5:0으로 승리한 전적이 있기에 최종 전적은 10:1이라고 합니다.


당연하지만 알파스타는 전체 맵을 볼 수 없으며 APM을 포함하여 일반 고수 플레이어와 같은 제약을 가진 상태에서 플레이하였습니다.

자신의 종족은 학습 시간 단축을 위해 프로토스만 사용하였다고 하네요.


게임 인터페이스는 크게 두가지로 나눠 학습을 진행하였는데

하나는 일반 플레이어와 다르게 시야에 있는 모든 요소를 한번에 인식할 수 있는 버전이었고

다른 하나는 실제 플레이어처럼 카메라를 이리저리 움직여 그 부분만 인식할 수 있는 버전이었습니다.

전자가 더 높은 실력을 나타내었지만 최종적으론 후자도 전자의 실력만큼 잘하게 되었다고 합니다.


알파스타는 블리자드가 공개하였던 경기 데이터를 이용하여 기본적인 게임 조작(매크로)을 학습하였고

이어서 인공지능끼리의 경기를 통한 강화학습으로 학습을 이어갔다고 합니다.


이러한 인공지능이 이전의 하드코딩으로 전략과 조작을 수행하는 인공지능에 비해서는 실력이 떨어질 수 있습니다.

그러나 알파스타의 가치는 스타크래프트 2라는 게임처럼 불완전한 정보, 긴 시간과 단계 예측이 요구되는 날씨 예측 등의 문제에도 적용할 수 있다는 범용성에 있다고 하네요.


+ 국내 뉴스 기사들을 보면 죄다 APM이 높아서 인간이 불리했고 마지막 경기에서 APM에 제한을 거니 인공지능이 졌다는 내용이 있는데 사실이 아닙니다.

마지막 경기에서 인공지능이 패한 것은 맞지만 달랐던 요소는 APM이 아니라 게임 진행 상황을 입력받는 방법이었습니다.

APM은 진작에 제한되어 있었으며 오히려 프로게이머들 보다 낮았고요.

  1. https://www.techspot.com/news/78431-human-player-finally-beat-deepmind-alphastar-ai-starcraft.html [본문으로]


Comments