모델이 "미토콘드리아는 세포의 발전소"를 거절했다 — 그래서 진짜 문제가 뭐냐
Fable 5는 생물학·사이버·프론티어 LLM 연구 쿼리를 차단하거나 하위 모델(Opus)로 다운그레이드한다. 안전 철학과 비즈니스 이해관계가 정확히 일치하는 "true alignment"이지만, 그 경계선이 너무 넓게 그어져 있고, 특히 AI 연구 쿼리에 대해서는 차단 사실을 사용자에게 알리지 않고 조용히 품질을 저하시킨다는 점이 심각한 신뢰 문제를 낳는다.
무슨 일이 있었나: Fable 5 출시와 함께 타임라인이 폭발했다. 생물학자가 인사말만 했는데 Opus로 강등됐다는 스크린샷, 악마 뿔 이모지(🔱) + "cyber" 한 단어로 대화가 종료됐다는 스크린샷이 줄줄이 공유됐다. Doug Laufflin은 "Aura 헬스 데이터 100일치를 분석하려 했는데 안전하지 않다고 차단됐다"며 "수백만 달러 연봉 받는 수천 명이 뭐가 안전한지 독단적으로 결정하는 게 완전 황당하다"고 표현했다.
Ben Thompson의 해석 — "True Alignment": Thompson은 Anthropic의 이 결정을 긍정적으로 평가했다. 안전을 진지하게 여기는 문화가 비즈니스 가치 창출과 정확히 일치한다는 것 — 경쟁자가 자사 모델로 경쟁 제품을 만드는 걸 막고, 악의적 사용으로 인한 법적 책임과 부정적 헤드라인을 피하는 동시에, 진짜 믿음에서 나온 결정이라는 점에서 "놀라운 성취"라 표현했다. 그는 또 모든 차단 거절이 결국 "Anthropic 영업 담당자에게 전화해서 Mythos 엔터프라이즈 플랜 가입"으로 이어지는 암묵적 초대라는 점도 짚었다.
"Me, the rational business analyst, sees a hard-nosed but understandable decision to cut off would-be competitors. Anthropic employees and advocates, the true believers, see a regrettable but understandable safety decision. This is true alignment and it's an incredible accomplishment." — Ben Thompson
Dean Ball의 반론 — 반경쟁·규제 리스크: AI 액션 플랜을 쓰고 도전 당시 Anthropic을 공개 지지했던 Ball은 이번엔 강경하게 비판했다. 핵심 논지는 세 가지다. ① AI 안전 명목으로 반경쟁 행위를 정당화하면, 나중에 프론티어 랩들이 안전 협력을 위해 반독점 예외를 요구할 때 그 주장을 스스로 무너뜨린다. ② Anthropic의 공식 정책이 구조적으로 DoJ가 제기한 사실 패턴과 동일하다. ③ 이 사건이 "AI 모델을 공익사업(utility)처럼 규제해야 한다"는 주장에 힘을 실어줬다 — Anthropic이 누구보다 그 논거를 강화하고 있다.
가장 불편한 지점 — 공개하지 않은 품질 저하: 생물·사이버는 명시적으로 차단하거나 다운그레이드를 고지한다. 반면 AI 연구 쿼리는 모델카드에만 기재됐고, 사용자에게는 알리지 않은 채 조용히 저하된 답변을 준다. 호스트는 "이 방식은 다른 카테고리에서도 사용자 몰래 성능이 저하되고 있을 가능성을 열어두는 것"이라며, 법적 AI 서비스처럼 모델 의존도가 높은 기업들에게 eval 업체들의 가치를 높이는 계기가 될 수 있다고 봤다.
쉽게 풀어보기 — Fable 5 가드레일
- Mythos 클래스 모델
- Anthropic이 명명한 최상위 모델 티어. Fable 5가 첫 번째.
- Opus로 강등(downgrade)
- 특정 쿼리를 받으면 고성능 Fable 5 대신 하위 모델 Opus로 자동 전환하는 것. 사용자가 비용을 내고 Fable 5를 쓰는데 Opus가 답하는 상황.
- True Alignment
- 회사의 안전 철학과 비즈니스 이해관계가 정확히 일치하는 상태. Ben Thompson의 표현.