중국 지원을 받은 것으로 추정되는 해커들이 미국 앤스로픽의 인공지능(AI) 모델 ‘클로드’를 활용해 대규모 해킹을 벌인 것으로 드러났다. 최근 구글이 중국 기반 피싱(전자금융사기) 조직에 대한 소송을 제기한 가운데 AI를 비롯한 첨단 기술을 활용한 해킹이 전방위로 확산하고 있다.
앤스로픽은 해커들이 지난 9월 정부기관, 빅테크 기업, 금융기관 등 30곳에 클로드를 활용한 침투를 시도해 일부 성공한 사실을 확인했다고 13일(현지시간) 밝혔다.

무슨 의미야
앤스로픽은 지난 6월에도 ‘바이브 해킹’ 즉, AI를 활용한 해킹 시도를 확인했는데, 이번 공격에선 인간의 개입 빈도가 더 줄었다고 밝혔다. AI를 활용한 해킹 기술이 점점 고도화되고 있는 것이다. 최근 구글이 부패·조직범죄 처벌법, 연방상표법, 컴퓨터사기 남용법 위반으로 소송을 제기한 해킹 그룹도 마찬가지다. 이들은 ‘서비스형 피싱(PhaaS, Phishing-as-a-Service)’을 범죄에 활용했다. 복잡한 코딩 없이 클릭 몇 번으로 스미싱과 피싱을 쉽게 할 수 있게 자동화한 소프트웨어다. 보안 업계는 AI 기능이 발전할수록 해킹 공격 규모가 커지고 정교해질 수 있다고 우려하고 있다.
AI 해킹 뭐가 달라
앤스로픽이 이번에 공개한 해킹 공격은 AI가 스스로 침투와 데이터 추출, 보고를 직접 수행했다는 점에서 기존 수법과 달랐다. 인간 해커는 ‘계속해’, ‘그만해’ ‘이게 맞아?’ 등 최소한의 명령어만 언급했다. 앤스로픽에 따르면 해커들은 클로드에 내부 데이터베이스를 직접 조회하고 정보를 추출하라는 명령을 내렸다. 이들은 자신들이 보안 회사 직원이며, 침입과 방어 테스트를 수행 중이라고 클로드를 속여 앤스로픽이 만든 보호벽인 ‘가드레일’을 우회하는 ‘탈옥(jail breaking)’에도 성공했다. 다만 클로드는 ‘환각’(AI의 그럴싸한 거짓말) 증세를 보이며 허위 정보를 생성하거나 공개된 정보를 제시하며 비밀 정보를 추출했다고 주장하기도 했다. 앤스로픽은 이들의 일부 공격이 성공해 한정된 정보가 유출됐지만, 미국 정부 기관은 피해 대상에 포함되지 않았다고 밝혔다.

어떻게 대비해
앤스로픽은 이번 사건 이후 AI 오용에 대한 탐지 시스템을 강화했고, 해커 계정을 차단하고 관련 기관에 통보하는 등 당국과 협력했다고 밝혔다. 회사 측은 “AI 기술이 공격보다 방어에 큰 이익이 되도록 설계하는 것이 핵심”이라며 “알려진 취약점 조기 탐지 등 방어 기술 개발에 집중하고 있다”고 말했다.
AI 기술 발전으로 인해 사이버 보안의 중요성이 커지면서, 지난 6월 미국 정부는 사이버보안 강화를 위한 행정명령을 발표했다. 위협 인식 대상에 중국 외 러시아, 이란, 북한 등을 추가하고 차세대 보안 기술 도입하는 기반을 마련한다는 내용이다. 아울러 NIST(국가사이버보안센터)에 산업계와 컨소시엄을 설립하고, 연방조달규정(FAR)을 개정하는 등 민간 기업과의 협력을 통해 보안 강화를 위해 노력하고 있다.
국내 사이버 보안 회사들도 실시간으로 이상 징후를 감지하고, 즉각 대응이 가능한 MDR(Managed Detection and Response) 서비스 등을 활용해 대응 체계를 강화하는 추세다.







