충격! 최신 인공지능 ChatGPT, 47년 전 아타리 체스에게 '쪽박'...한심한 실력에 전문가도 혀차

충격! 최신 인공지능 ChatGPT, 47년 전 아타리 체스에게 '쪽박'...한심한 실력에 전문가도 혀차

AI의 체면을 구긴 '아타리 2600'의 역습

인공지능(AI) 기술의 발전이 무서운 속도로 진행되고 있지만, 아직 기본기에서는 한계를 보이는 사례가 있어 눈길을 끌고 있다. 화제의 주인공은 다름 아닌 OpenAI의 최신 AI 모델 'ChatGPT 4o'와 47년 전 출시된 게임기 '아타리 2600'의 체스 프로그램이다.

지난 주말, 시트릭스의 아키텍처 및 딜리버리 스페셜리스트인 로버트 주니어 카루소가 이 놀라운 현상을 발견했다. 그는 1979년 출시된 아타리 체스를 에뮬레이터에서 구동해 ChatGPT와 대결시켰는데, 결과는 예상과 달리 구식 게임기의 압도적 승리였다.

카루소는 자신의 링크드인에 "ChatGPT가 초보자 수준에서도 아타리 체스에 완전히 무너졌다(got absolutely wrecked)"라며 이 황당한 결과를 공유했다. 더욱 놀라운 점은 아타리 2600이 단 1.19MHz의 처리 속도를 가진 MOS Technology 6507 프로세서로 구동되며, 이 체스 엔진은 고작 1~2수 앞만 내다보는 초보적인 알고리즘을 사용한다는 점이다.

장르가 다른 대결? AI의 한계 드러나

1997년 IBM의 슈퍼컴퓨터 딥블루가 당시 세계 체스 챔피언 게리 카스파로프를 이겼을 때만 해도, 컴퓨터의 체스 능력은 처리 속도와 비례한다고 여겨졌다. 당시 딥블루는 초당 2억 개의 체스 수를 분석했다.

2025년 현재 기준으로 딥블루의 11.4 GFLOPS 처리 능력은 현대의 엔트리급 프로세서보다도 못하다. 그렇다면 최신 AI 모델인 ChatGPT 4o가 47년 전 콘솔 게임의 체스 프로그램을 이기는 건 식은 죽 먹기처럼 쉬워야 하는데, 현실은 정반대였다.

카루소에 따르면, 처음에 ChatGPT는 패배의 원인을 아타리 체스 기물의 추상적인 디자인 때문이라고 변명했다. 카루소가 이를 수정해 최대한 명확하게 만들어줬음에도 ChatGPT는 "초등학교 3학년 체스 클럽에서도 비웃음을 살 정도의 어처구니없는 실수"를 계속했다고 한다.

레딧 반응을 보면 이에 대한 유저들의 의견은 갈렸다. 한 유저는 "정부 일자리를 AI가 대체한다는데 다행이네요🙄"라는 비꼬는 반응을 보였고, 다른 유저는 "ChatGPT는 체스 규칙을 제대로 이해하지 못해 잘못된 수를 두기 때문에 패배한다"고 분석했다.

"특화된 도구와 범용 AI의 차이일 뿐"

하지만 많은 사용자들은 이번 사례가 AI의 한계보다는 특수 목적 프로그램과 범용 AI의 성격 차이를 보여줄 뿐이라고 지적했다.

한 유저는 "언어 모델이 체스 전용 슈퍼컴퓨터인 딥블루나 2단계 탐색에 최적화된 아타리 2600 체스 프로그램과 같은 클래스가 아니라는 뉴스네요. 하지만 아타리 2600이나 딥블루에게 피자에 관한 하이쿠를 만들어보라고 하세요. 각기 다른 도구는 각기 다른 용도에 맞게 설계되었을 뿐입니다"라고 설명했다.

또 다른 유저는 "이건 마치 농부가 철학자를 농사에서 이겼다고 말하는 것과 같다. 오렌지와 수박을 비교하는 격"이라는 재미있는 비유로 반응했다.

또한 일부는 "옛날 프로그램들은 당대 최고 두뇌들의 계산에 기반해 코딩된 반면, AI는 그다지 교육받지 않은 현대 일반 대중의 다양한 바보짓을 학습했다"며 흥미로운 관점을 제시하기도 했다.

이번 사례는 최신 AI 기술이 특정 분야에서는 놀라운 능력을 보여주면서도, 단순하고 명확한 규칙이 있는 게임에서조차 예상 외로 취약점을 드러낼 수 있다는 점을 보여준다. 범용 AI와 특화된 프로그램의 차이, 그리고 AI가 실제로 '이해'하는 것과 '모방'하는 것의 차이에 대한 흥미로운 사례라 할 수 있겠다.

원문 보기