본문 바로가기
AI · 인공지능/AI 뉴스

최강의 바둑 AI에게 압승한 인물이 등장, AI의 약점을 공략하여 인류가 승리했다고 화제

by 두우우부 2023. 2. 27.
반응형

 

인공지능(AI)의 진화에 따라 체스나 장기와 같은 지능 게임에서 AI가 프로 플레이어에게 승리하는 경우가 늘어나고 있었지만, 2016년 1월에 구글의「AlphaGo」가 바둑의 프로 기사에게 승리한 것을 시작으로, 2개월 후에는 세계 최강의 기사에게도 승리하거나,「나라면 AlphaGo에게도 이길 것」이라고 선언했던 프로 기사에게도 접전 끝에 승리하거나, 2017년에는 자력으로 전술을 기억해 강해질 수 있는 신 버전의「AlphaGo Zero」가 발표된다거나, 바둑의 세계에서도 AI가 압도적인 승자로서 군림하고 있었습니다. 그런 가운데, 아마추어 바둑 플레이어가 컴퓨터의 직접적인 지원 없이 최강 레벨의 바둑 AI에게 15전 14승으로 대승하여,「AI에 대한 인류의 승리」라고 화제가 되고 있습니다.

Adversarial Policies in Go - Game Viewer

Adversarial Policies in Go - Game Viewer

Summary We attack KataGo, a state-of-the-art Go AI system, by training adversarial policies that play against frozen KataGo victims. Our attack achieves a 100% win rate over 1000 games when KataGo uses no tree-search, and a >97% win rate when KataGo uses e

goattack.far.ai


Subscribe to read | Financial Times

Man beats machine at Go in human victory over AI

Amateur Kellin Pelrine exploited weakness in systems that have otherwise dominated board game’s grandmasters

www.ft.com



구글이 인수한 DeepMind가 개발한 바둑 AI「AlphaGo」는, 세계 전에서 4관왕을 획득해 통산 1,000승이라는 압도적인 성적을 거둔 세계 최강의 바둑 기사인 이세돌 씨와의 5번 승부에서 4대 1로 승리한 것으로부터, 2016년에「바둑에서 처음으로 인공 지능이 인간을 웃돌았다」라고 평가되었습니다. 이세돌 기사는 4차전에서 승리를 올린 후 "AlphaGo의 버그에 승리했을 뿐"이라고 코멘트하고 있어, 2019년에 프로 기사를 은퇴했을 때에는, "비록 제가 넘버원이 된다고 해도, 이길 수 없는 존재가 있는 것입니다."라고 말하면서 AlphaGo의 압도적인 힘이 은퇴의 이유 중 하나임을 암시하였습니다.



바둑 기사에게 AI가 상당한 위협이 되고 있는 가운데, 아마추어 랭킹의 Top으로부터 한 단계 아래 레벨의 미국인 플레이어 켈린 펠린 씨는, 지금까지 알려지지 않았던 바둑 AI의 결함을 이용하여 AlphaGo에 필적하는 레벨의 바둑 AI에게 15경기 중 14번 승리하였습니다. AI의 결함 자체는 컴퓨터에 의한 분석으로 특정하였지만, 대국 시에는 컴퓨터의 직접적인 지원 없이 행해졌다고 합니다. AI의 결함을 연구하는 회사 FAR AI에서 최고 책임자를 맡고 있는 아담 그리브 씨는 "이 승리로 OpenAI의 ChatGPT 등 현재 널리 사용되고 있는 대부분의 AI 시스템에 공통적인 약점이 부각되고 있다."라고 코멘트하고 있습니다.

FAR AI가 설계한 프로그램은 바둑의 Top 시스템 중 하나인 KataGo와 100만 국 이상 대전해, 인간 플레이어가 이용할 수 있는「맹점」을 발견했습니다. 과거에는 미국 코넬대학에서 진행된 연구에서도 마찬가지로 "KataGo에게 99% 이길 수 있는" 방법을 찾아냈지만, 코넬대학의 전법은 KataGo의 강화 학습방법을 이용한 특수한 것이었지만, FAR AI에 의한 전법은 중급 레벨의 플레이어라도 AI를 이겨버리는 비교적 간단한 것으로, 실제로 같은 전법을 이용해 다른 Top 바둑 시스템인 Leela Zero에게도 승리하고 있습니다.


페린 씨가 실제로 사용한 전술은 "천천히 돌의 큰 고리를 만드는 것으로 상대의 집 중에 하나를 둘러싸고, 그 사이에 반면의 다른 구석에서 손을 써 AI의 주의를 돌린다"는 것. 둘러싸기가 거의 완성되어도, 바둑 AI는 현재의 불리를 눈치채지 못하였고, 그리브 씨는 "AlphaGo를 간단히 이기는 전법은, 바둑을 효과적으로 플레이하는 것이 아닙니다."라고 말하며, 사람과의 대국에서는 참패했다는 것을 알리며, 페린 씨는「인간이라면 주의를 돌리는 작전에 속지 않으며, 불리한 상황을 쉽게 간파했을 것입니다」라고 코멘트하고 있습니다.
 



그리브 씨에 따르면 바둑 AI가 참패한 정확한 원인은, "페린 씨가 이용한 전술은 실제로는 거의 사용되지 않기 때문에 AI 시스템이 충분히 훈련을 받지 못하였다"는 점에 있다는 것. 그리브 씨는 "이번에 사용된 것처럼 AI가 상대라는 것을 이용한 공격에 노출되었을 때, AI 시스템에 결함이 발견되는 것은 AI 연구에서는 자주 있는 것입니다. 그럼에도 불구하고 매우 큰 AI 시스템이 거의 검증되지 않은 채 대규모로 전개되고 있다는 것을, 우리는 실제로 목도하고 있습니다."라고 말합니다.

버클리 캘리포니아 대학의 컴퓨터 과학 교수인 스튜어트 러셀은 "최첨단 바둑 AI 중 하나에서 취약성이 발견된 것은 현재 최첨단에 있는 AI를 지원하는 심층 학습 시스템의 근본적인 결함을 시사한다. 시스템은 과거에 경험한 특정 상황만 이해할 수 있고, 인간이 쉽게 이해할 수 있는 방식으로 경험과 현재 상황을 일반화할 수 없다."라고 말했습니다. "우리는 기계에 초인적 수준의 지능을 갖게 하는 것을 너무 급하게 했을지도 모른다. 이번 바둑 AI에 대한 승리는 그것을 다시 보여준다"라고 덧붙였습니다.

FAR AI가 이번 연구에 대해 공개한 goattack.far.ai 에서는, 어떠한 트레이닝과 분석이 행해졌는지 외에도, 실제로 AI를 이기기 위한 전술에 대하여 한 수씩 볼 수 있습니다.
 

 

반응형