"검색 후보군이 너무 많아졌다" — GPU 커스텀 SKU로 해결
광고 서빙 첫 단계인 검색(Retrieval)은 "Matt에게 보여줄 수 있는 모든 광고" 목록을 추려내는 작업이다. 이 목록이 폭발적으로 길어지면서, 과거 CPU로는 불가능해졌고 Meta는 Nvidia와 공동으로 메모리 대역폭 최적화 GPU SKU를 설계했다. 이 하드웨어 위에서 돌아가는 ML 모델이 Andromeda.
무슨 얘기였나: 광고 시스템의 첫 번째 관문은 Retrieval. 광고주가 등록한 광고 중 특정 유저에게 의미 있을 후보군만 걸러내는 작업이다. 유저의 과거 관심사·인터랙션이 임베딩된 ML 모델이 초대형 광고 인덱스에서 후보를 뽑아내고, 이를 다음 단계 Ranking 시스템에 넘긴다.
왜 GPU가 필요해졌나: 후보군 크기가 계속 커지면서 CPU 기반으로는 레이턴시 제약을 맞출 수 없었다. Steiner는 "검색 문제는 컴퓨트 바운드보다는 메모리 바운드"라고 표현했다. 즉, GPU가 연산을 쉬지 않도록 충분한 메모리 채널(고대역폭 메모리)을 갖춘 SKU가 필요했다. Nvidia와 협업해 검색 워크로드에 최적화된 커스텀 SKU를 설계했고, 여기에 공동으로 ML 모델을 맞췄다.
"We co-designed a machine learning model that runs specifically on that hardware skew for the purposes of best assessing which ads are the top end ads to rank."