AI한테 인간을 증명하는 시험, 리캡챠는 정말 인간을 증명할까?

인터넷을 쓰다 보면 누구나 신호등을 고르거나 버스를 찾느라 마우스를 멈춘다. 하지만 우리가 매일 마주하는 이 귀찮은 과정은 인간을 증명하는 시험이 아니라, 구글의 자율주행 AI를 공짜로 키워주던 거대한 훈련소였다.

리캡챠는 왜 신호등과 버스를 고르게 만들었을까

인터넷 서핑을 하다가 갑자기 화면이 멈춘다. “당신은 로봇입니까?”라는 질문과 함께 흐릿한 사진 9장이 뜬다. 신호등, 버스, 오토바이, 횡단보도를 찾아서 누르라고 한다. 어떤 날은 아무리 정확하게 골라도 계속 다른 사진이 나와서 짜증이 나기도 한다.

우리는 보통 이 과정을 인간인지를 확인하는 단순한 보안 검사라고 생각한다. 네이버나 카카오 같은 국내 포털에서도 회원가입을 하거나 표를 예매할 때 삐뚤빼뚤한 글자나 숫자를 입력하라는 창이 뜬다. 이 모든 시스템을 통틀어 캡챠(CAPTCHA)라고 부른다.

캡챠가 처음 세상에 나온 이유는 명확하다. 악성 매크로 프로그램이 웹사이트에 자동으로 접속해서 수만 개의 아이디를 만들거나 게시판을 도배하는 행위를 막기 위해서였다. 컴퓨터는 기계적인 규칙만 따르기 때문에, 조금만 변형된 데이터는 읽지 못한다는 약점을 이용한 방어벽이었다.

우리가 마우스를 누를 때 일어난 일

초기의 캡챠는 화면에 구부러지고 일그러진 문자나 숫자를 보여주는 방식이었다. 컴퓨터의 광학 문자 인식 기능이 떨어지던 시절이라, 인간의 눈으로만 이 글자를 알아볼 수 있었기 때문이다. 하지만 시간이 흐르면서 이 시스템은 전혀 다른 목적으로 진화하기 시작했다.

구글이 이 기술을 인수하면서 만든 리캡챠(reCAPTCHA)는 단순한 방어벽을 넘어섰다. 구글은 전 세계 사람들이 매일 입력하는 수억 개의 캡챠 데이터를 활용했다. 처음에는 오래된 고서적이나 뉴욕타임스의 빛바랜 아카이브 신문 중에서 컴퓨터가 읽지 못하는 단어를 인간에게 읽혔다. 두 단어 중 하나는 정답을 아는 단어, 다른 하나는 컴퓨터가 모르는 단어를 배치해 인간이 대신 디지털화하도록 만든 것이다.

그다음 단계가 바로 우리가 지금도 마주하는 신호등과 버스 이미지다. 구글은 스트리트 뷰 서비스를 만들면서 전 세계의 도로 사진을 수집했다. 그리고 자율주행 자동차를 개발하기 시작했다. 자율주행 AI가 길을 찾아가려면 표지판, 신호등, 횡단보도를 정확하게 구별해야 했다. 구글은 이 방대한 사진을 인공지능에게 가르치기 위해 전 세계 인터넷 사용자들의 노동력을 빌렸다. 우리가 신호등을 클릭할 때마다 구글의 자율주행 인공지능은 무엇이 신호등인지 학습하며 똑똑해졌다.

AI는 이제 리캡챠도 통과할 수 있을까

문제는 인공지능의 발전 속도가 인간의 상상을 초월했다는 점이다. 과거에는 기계가 흐릿한 사진 속에서 신호등과 오토바이를 구별하는 일이 불가능에 가까웠다. 하지만 지금의 컴퓨터 비전 기술과 딥러닝 알고리즘은 인간과 비슷하거나 오히려 더 정확하게 사물을 구별한다.

실제로 최신 인공지능 모델들에게 리캡챠의 이미지 맞추기 시험을 시키면 정답률이 99%를 넘는다. 인간은 피로감이나 시력 차이 때문에 실수를 하지만, 기계는 지치지 않고 완벽하게 사진을 골라낸다. 이제 “신호등을 잘 고르니까 인간이다”라는 과거의 공식은 완벽하게 무너졌다.

“2024년 스위스 취리히 연방 공과대학교(ETH Zurich) 연구팀이 사물 인식 AI인 ‘YOLO’ 모델을 활용해 실험한 결과, 구글의 이미지 리캡챠 시스템을 100%의 성공률로 무력화했다. AI는 인간처럼 위장한 마우스의 미세한 움직임과 브라우저의 쿠키 정보까지 흉내 내며 신호등과 버스 이미지를 완벽히 골라냈다. 이는 이미지를 고르는 방식의 인간 인증 시험이 더 이상 인간만의 영역이 아님을 보여준다. 인간을 구별하기 위해 만들어진 시험이, 오히려 인공지능도 통과할 수 있는 시험으로 바뀐 것이다.” — New Scientist 및 과학 기술 보안 매체 보도 종합

오히려 사진을 너무 빠르고 정확하게 골라내면 리캡챠 시스템은 해당 사용자를 로봇으로 의심하기 시작한다. 기계가 인간의 영역을 추월해 버리면서, 기존의 시각적 시험 방식은 인간과 로봇을 구별하는 도구로서의 수명을 다하게 되었다.

리캡챠 v3는 어떻게 인간을 판단할까

인공지능이 사진을 더 잘 보게 되자 구글은 리캡챠의 방식을 완전히 바꾸었다. 최근 웹사이트를 이용할 때 사진을 고르는 창이 예전보다 덜 나오는 이유가 바로 여기에 있다. 최신 버전의 리캡챠는 사용자에게 아무런 시험 문제도 내지 않는다. 화면 구석에 작은 로고만 띄워놓고 백그라운드에서 사용자를 관찰한다.

이제 시스템이 주목하는 것은 정답이 아니라 사용자의 행동 양식이다. 마우스를 움직일 때의 미세한 곡선 경로, 클릭하는 속도의 불규칙함, 페이지를 아래로 내리는 스크롤 패턴을 실시간으로 분석한다. 기계는 아주 직선적이고 일정한 속도로 움직이지만, 인간은 마우스를 움직일 때 미세하게 흔들리거나 멈칫하는 물리적인 한계를 보이기 때문이다.

여기에 브라우저의 정보, 현재 로그인된 구글 계정의 상태, 이전에 방문했던 사이트들의 쿠키 기록까지 종합적으로 검토한다. 시스템은 사용자가 사이트에 들어오는 순간부터 쌓인 장기간의 행동 기록을 바탕으로 점수를 매긴다. 인간임을 증명하기 위해 우리는 시험지를 푸는 것이 아니라, 평소의 행동 자체를 끊임없이 제출하고 있었던 셈이다.

정답을 맞히는 시험관이 아니라, 사용자의 평소 걸음걸이와 습관을 뒤에서 지켜보는 감시자로 변한 것이다.

리캡챠의 진화 과정은 인간과 기계의 경계가 어떻게 이동해 왔는지를 보여준다.

CAPTCHA(v1) : 일그러진 문자와 숫자를 입력하게 했다. 기계는 문자를 읽지 못했고, 인간만이 정답을 맞힐 수 있었다.
reCAPTCHA(v2) : 신호등, 버스, 횡단보도 이미지를 선택하게 했다. 인간의 시각 능력을 활용해 동시에 구글의 자율주행 AI를 학습시키는 역할도 수행했다.
reCAPTCHA(v3) : 더 이상 시험 문제를 내지 않는다. 사용자의 마우스 움직임, 스크롤 패턴, 클릭 간격, 브라우저 정보 등 행동의 맥락 전체를 분석해 인간일 가능성을 점수로 평가한다.

인간을 증명하는 기준은 문자에서 이미지로, 이미지에서 행동으로 이동해 왔다. 그리고 그 변화는 인간만이 할 수 있다고 믿었던 능력을 인공지능이 하나씩 추월해 온 역사이기도 하다.

인간의 행동 패턴까지 따라 하는 AI

리캡챠의 이러한 변화는 우리에게 한 가지 무거운 질문을 던진다. 현재 시스템은 마우스의 미세한 흔들림이나 불규칙한 스크롤 속도를 보고 인간이라고 판단한다. 하지만 인공지능이 인간의 마우스 움직임 궤적과 타이밍까지 그대로 모방하는 것은 그리 어려운 일이 아니다.

실제로 인간의 행동 데이터를 학습해 가장 인간다운 속도와 각도로 마우스를 움직이는 매크로 프로그램들이 이미 등장하고 있다. 브라우저 정보를 조작하고 가짜 쿠키 기록을 만들어내는 기술도 계속해서 정교해지는 추세다.

만약 인공지능이 사진도 인간보다 잘 보고, 마우스 움직임과 스크롤 패턴 같은 물리적 습관까지 완벽하게 흉내 내기 시작한다면 리캡챠는 더 이상 작동할 수 없다. 기계가 인간보다 더 인간처럼 행동할 수 있는 시대가 코앞으로 다가왔다.

인간을 증명하는 진짜 기준은 무엇일까

행동 패턴마저 복제되는 세상에서 인간과 기계를 나누는 기준은 더 이상 신호등을 얼마나 잘 찾는가가 아니다.
우리는 왜 그 행동을 선택했는가.
실수할 자유와 책임을 감수하면서도 스스로 목적을 정하는 존재인가.
인간을 증명하는 진짜 시험은 화면 속 격자 이미지가 아니라, 의도와 맥락을 가진 주체로 살아가는 방식 그 자체일지도 모른다.

글에서 사용한 머리 아픈 용어

캡챠 (CAPTCHA): 컴퓨터와 인간을 구별하기 위해 만들어진 자동 인증 시스템으로, 기계가 읽기 힘든 글자나 그림을 사람에게 맞추도록 하는 기술이다.
딥러닝 (Deep Learning): 인간의 뇌 신경망을 모방하여 컴퓨터가 스스로 방대한 데이터를 학습하고 패턴을 찾아내도록 만드는 인공지능 기술이다.
쿠키 (Cookie): 웹사이트를 방문했을 때 사용자의 브라우저에 저장되는 작은 데이터 파일로, 로그인 상태나 방문 기록 등의 정보를 담고 있다.

※ 특정 산업이나 자산에 대한 투자 판단은 본인의 책임 하에 신중히 결정하시기 바랍니다.