"6주 만에 5~7년치 버그를 찾아냈다"
팔로알토는 Anthropic의 모델(내부 명칭 Mythos)을 자사 코드베이스에 6주간 적용했더니, 통상적인 방법으로는 5~7년이 걸렸을 취약점들을 모두 발견했다. 비용은 수백만 달러 수준. "울트라 모드(persistent thinking)"로 돌리면 취약점을 데이지체인 방식으로 연결해 새로운 공격 경로까지 도출한다. 팔로알토는 사이버보안 업계에서도 코드 테스트를 가장 철저하게 하는 회사 중 하나 — 그런 회사에서 이런 결과라면, 일반 기업에서는 충격이 훨씬 클 것.
무슨 얘기였나: 팔로알토는 Mythos를 자사 코드에 붙여 실전 레드팀 테스트를 진행했다. 6주 만에 나온 결과물은 내부 추산 기준 5~7년 분량의 취약점 목록이었다. 아로라는 "과대광고가 아니었다, 기능이 진짜(legit)"라고 단언했다.
울트라 모드의 의미: 일반 모드 외에 '울트라 모드(지속적 사고, persistent thinking)'로 실행하면 모델이 정답을 찾을 때까지 계속 시도한다. 이 때 단일 취약점이 아니라 여러 취약점을 연결한 새 공격 벡터를 도출할 수 있다 — 보안 관점에서 가장 위험한 시나리오.
확산 속도: 아로라는 "Claude 4.8, 5.5가 이미 유사 성능을 갖추고 있고 오픈소스 모델에도 3개월 안에 이런 기능이 등장할 것"이라고 전망했다. "가장 어려운 코드를 뚫을 필요도 없다 — 오래된 OT(산업용) 시스템 하나에서 취약점 몇 개만 찾으면 된다."
"AI가 나쁜 코드를 찾는 능력은 실재한다. 그것도 우리가 상상하는 것보다 훨씬 빠르게."
실질적 리스크: 아로라는 큰 기업(PG&E 발전소 같은 국가 인프라)보다 오히려 소규모 사업자 — 치과·의원·소규모 제조업체가 더 위험하다고 강조했다. Change Healthcare 랜섬웨어 사건처럼 의원 전체가 마비되는 사태가 더 현실적인 위협이라는 것.
쉽게 풀어보기 — 코드 취약점 vs. 오탐
- 코드 취약점(vulnerability)
- 소프트웨어에 존재하는 허점. 공격자가 이를 통해 시스템에 침투하거나 데이터를 훔칠 수 있는 '구멍'.
- 데이지체인(daisy-chain) 공격
- 작은 취약점 여러 개를 연결해서 큰 권한을 얻는 공격 방식. 각각은 별것 아닌 구멍이지만 연결하면 치명적.
- OT(Operational Technology)
- 공장·발전소 등 물리 설비를 제어하는 산업용 소프트웨어/하드웨어. 업데이트 주기가 길어 구형 취약점이 많이 남아있음.