"지능 한 단위"의 가격, 2.5년 만에 100분의 1이 됐다
단순 질의든 복잡한 추론이든 "지능의 단위 비용"은 계속 내려가고 있다. 1년 만에 약 90%, 2~2.5년 누적으로는 약 99% 하락. 이 추세를 만드는 세 가지 레버는 ① 공급망(주로 TSMC), ② 엔지니어링 혁신, ③ 전력/전기 효율이다.
무슨 얘기였나: 인터뷰어가 "같은 수준의 질문(like-for-like 인텔리전스 단위)을 처리하는 비용이 계속 내려갈 것이냐"고 묻자, 발언자는 세 가지 핵심 투입 요소를 들어 "그렇다"고 답했다.
세 가지 레버: ① 반도체 공급망(TSMC 중심의 리소그래피·패키징 기술), ② 엔지니어링 혁신(회로 설계·양자화 등), ③ 가용 전력량. 이 세 요소가 함께 움직여야 단가가 내려간다.
"단순한 질문이든 조금 더 복잡한 질문이든, 그 지능의 단위 비용이 계속 내려갈 것인지 — 그리고 그 이유가 무엇인지 얘기해달라."
쉽게 풀어보기 — 인퍼런스 비용이란
- 인퍼런스(Inference)
- AI 모델이 학습을 마친 뒤, 실제 사용자 질문에 답을 생성하는 과정. 학습(Training)과 구분되며, 서비스 운영 비용의 핵심이다.
- 토큰(Token)
- AI가 텍스트를 처리하는 기본 단위. 대략 단어 하나~단어 몇 개 수준. 인퍼런스 비용은 보통 "토큰 1,000개당 얼마"로 측정한다.