아마존, AI 사용량 순위판 만들었다가 직원들이 쓸데없는 작업으로 돈만 날리자 결국 폐쇄
'AI 많이 쓸수록 일 잘하는 직원'이라는 착각
아마존이 직원들의 AI 사용량을 순위로 매기는 내부 대시보드 '키로랭크(Kirorank)'를 도입했다가 불과 몇 주 만에 서둘러 폐쇄하는 해프닝이 벌어졌다. 6월 2일 공개된 소식에 따르면, 직원들이 순위를 올리기 위해 의미 없는 AI 작업을 남발하면서 회사 비용만 날리는 바람에 애초 취지와 정반대 결과를 낳았기 때문이다.
키로랭크는 직원들이 회사 AI 개발 도구를 얼마나 활용하는지 토큰 사용량으로 측정해 순위를 매기는 시스템이었다. 하지만 직원들은 곧 '토큰맥싱(tokenmaxxing)'이라는 편법을 개발했다. 실제 업무와는 상관없는 쓸데없는 작업을 AI에게 시켜서 토큰 사용량만 늘리는 것이다.
5월부터 경고했지만 소용없어
문제가 심각해지자 데이브 트레드웰 수석 부사장이 지난 5월 내부 메모를 통해 "AI를 위한 AI 사용을 중단하라"고 직원들에게 경고했다. 하지만 상황은 나아지지 않았고, 결국 베타 서비스로 운영되던 키로랭크는 완전히 폐쇄됐다.
아마존 대변인은 "이 대시보드는 AI가 생산성을 어떻게 향상시킬 수 있는지 인식을 높이기 위해 일부 직원들이 도입한 것"이라며 "단순히 AI 사용 자체를 장려하려는 의도는 아니었다"고 해명했다.
아마존만의 문제가 아니다
이런 현상은 아마존만의 문제가 아니다. 메타(Meta)도 지난 4월 비슷한 이유로 직원들이 운영하던 AI 리더보드를 폐쇄했다. 직원들이 '토큰 레전드(Token Legend)' 타이틀을 놓고 경쟁하면서 똑같은 토큰맥싱 행태를 보였기 때문이다.
우버도 AI 지출 증가를 정당화하는 데 어려움을 겪고 있다고 최근 인터뷰에서 밝혔다. 특히 우버 기술담당임원이 2026년 AI 예산 전체를 단 한 분기 만에 다 써버렸다고 폭로하면서 충격을 주기도 했다.
'사용량'과 '효과'는 별개
AI 리더보드 실패의 근본 원인은 명확하다. AI를 '얼마나' 사용했는지는 쉽게 측정할 수 있지만, '얼마나 잘' 사용했는지는 파악하기 어렵다는 점이다. 많은 기업들이 명확한 생산성 지표 없이 AI 도입을 밀어붙이다 보니, 측정하기 쉬운 사용량에만 의존하게 된 것이다.
아마존은 현재 전체 개발자의 80% 이상이 주간 단위로 AI를 사용하기를 원하고 있으며, 2026년에 AI 인프라에만 약 2,000억 달러를 투입할 계획이다. 이런 상황에서 효율적인 AI 활용은 더욱 중요해졌다.
새로운 지표 개발 중
아마존은 키로랭크를 대체할 새로운 지표를 개발 중이라고 밝혔다. 이번에는 AI가 실제 업무에 도움이 되는지 여부를 측정하는 데 초점을 맞춘다는 방침이다. 다만 구체적인 세부사항이나 도입 시기는 공개하지 않았다.
레딧 유저들의 반응도 냉소적이다. 한 유저는 "이 모든 테크 브로들에게 AI를 위한 AI 사용을 그만두라고 말해주고 싶다"고 댓글을 달았고, 다른 유저는 "바보 같은 게임을 시작하면 바보 같은 상만 받는다"며 비꼬았다.
이번 사건은 AI 도입이 단순히 기술 활용량의 문제가 아니라 '어떻게' 활용하느냐의 문제임을 여실히 보여주는 사례가 됐다.
Comments ()