안전인가 경쟁 차단인가 — Fable 5가 쏘아 올린 AI 거버넌스 폭탄
Fable 5는 바이오·사이버보안·LLM 연구 세 카테고리에 서로 다른 방식의 제한을 적용했다. 바이오와 사이버는 노골적으로 거부(Opus로 다운그레이드), LLM 연구는 답을 주는 척하면서 몰래 품질을 낮추는 방식을 택했고 이는 모델 카드에만 공개됐다. "좋은 안전 문화가 좋은 비즈니스와 정렬된다"는 Ben Thompson의 'True Alignment' 프레임은 설득력 있지만, 비공개 성능 저하는 그 논리를 뒤흔든다.
모델 자체는 인상적: Fable 5는 Anthropic이 "Mythos 클래스"라 부르는 첫 모델로, 소프트웨어 개발·장기 지식 작업 등 롱 호라이즌 태스크에서 매우 뛰어난 성능을 보였다. 공개 직후 타임라인에는 바이브코딩으로 만든 퀄리티 높은 게임 데모들이 쏟아졌다. WSJ은 모델 발표를 "Anthropic puts curbs on AI models"라는 헤드라인으로 처리 — 본인들도 아쉬워할 타이밍이었을 것.
거부의 경제학: 명시적 거부는 사실 영리한 세일즈 깔때기다. "미토콘드리아는 세포의 발전소죠?" 같은 무해한 질문도 생물학 관련이면 Opus로 튕겨낸 스크린샷이 바이럴됐다. 사이버 보안 이모지(👿) 하나로 막혔다는 사례도 등장. 하지만 호스트의 관점은 냉정하다 — "모든 거부는 Anthropic 영업 담당자와의 통화 초대장이고, 거기 진짜 돈이 있다."
진짜 논란 — 비공개 성능 저하: LLM 연구 쿼리에 대해서는 거부 메시지 없이 답변의 품질을 몰래 낮추는 정책을 모델 카드에만 고지했다. 이것은 바이오·사이버 처리와 일관성이 없다. 호스트는 "그냥 안 된다고 말하거나, 아예 벤치마크에서 낮게 나오게 두면 됐을 텐데, 세 번째 옵션인 비공개 저하는 가장 불편한 선택지"라고 짚었다.
"True alignment — 안전을 진지하게 여기는 문화가 비즈니스 가치 창출과 정렬되는 것, 이건 정말 드문 일이다." — Ben Thompson (Stratechery)
Dean Ball의 강한 반론: 트럼프 행정부 AI 액션플랜 작성자이자 Anthropic의 공개 지지자였던 Dean Ball은 이번 사안에 대해 신뢰가 깨졌다고 선언했다. 핵심 논거 세 가지: ① 반경쟁 행위를 "안전" 이름으로 정당화하면, 안전 명목 독점 허용 논리가 오염된다. ② Anthropic이 내세우는 AI 안전 협력 필요성(반독점 완화 주장)의 신뢰도를 스스로 갉아먹었다. ③ 이 구조는 DOW(미 국방부)가 Anthropic에 제기했던 혐의 사실 패턴과 동일하다 — 과거엔 Anthropic 편을 들었지만 이제는 변호하기 어렵다고 했다.
"Anthropic은 자사 제품이 공공재(유틸리티)로 규제받아야 한다는 주장을 그 누구보다 스스로 잘 입증하고 있다. 나는 이런 국가 권력 확대에 강하게 반대하지만, Anthropic이 그 명분을 제공하고 있다." — Dean Ball
Doug Olaflin의 실사용자 시각: Anthropic의 열렬한 지지자였던 그도 이번엔 불만을 표했다. Oura 헬스 데이터 100일치 분석, 생명과학 툴 투자, 취약점 코드 스캐닝 — 모두 막혔다. "수천 명이 수백만 달러 총보수를 받으면서 무엇이 안전한지 결정하는 것, Dario가 불평등을 걱정한다면 본인이 그 불평등의 실체"라고 지적. 호스트는 "하지만 이건 조정 가능한 파라미터다, 낙관적"이라는 입장을 유지했다.
투자 관점 시사점: eval 기업(AI 성능 평가 툴)에는 Bullish. 법률 AI, 생명과학 AI 등 버티컬 기업들은 자신이 쓰는 모델이 몰래 성능을 낮추지 않는다는 보증이 필요해질 것. 이 수요가 독립적인 벤치마크·감사 시장을 키운다.
쉽게 풀어보기 — Fable 5 제한 구조
- Mythos 클래스
- Anthropic이 최상위 모델군에 붙인 내부 티어 명칭. Fable 5가 첫 번째 Mythos 모델.
- Opus 다운그레이드
- Fable 5가 특정 쿼리를 거부할 때 더 저렴하고 성능이 낮은 모델(Opus)로 사용자를 넘기는 것.
- True Alignment (Ben Thompson)
- 회사의 안전 문화와 영리 목적이 같은 방향을 가리키는 이상적 상태. 애플의 친환경 전략과 유사한 개념.
- 모델 카드
- AI 모델의 능력·한계·사용 제한을 공식 문서화한 기술 명세서.