데일리 데이터허브

앤트로픽이 말하는 AI 바이오 에이전트의 핵심: 생물학 데이터 인프라 & 하네스 엔지니어링

2026-06-09

핵심 요약

  • 앤트로픽은 AI 바이오 에이전트의 성공이 모델 지능보다 생물학 데이터 인프라하네스 엔지니어링에 달려있다고 강조했습니다.
  • 자체 평가 환경 VirBench에서 Claude, GPT 등 최신 AI 에이전트들은 NCBI Virus 데이터베이스 검색에서 16.9% ~ 91.3%의 낮은 정확도를 보였으며, 사소한 데이터 처리 오류가 빈번했습니다.
  • AI가 직접 데이터베이스를 검색하는 대신 gget virus와 같은 검증된 전용 도구를 사용하자 정확도가 거의 100% 수준까지 향상되었습니다.
  • 이는 신뢰할 수 있는 데이터베이스, 표준화된 데이터 형식, 검증된 분석 도구 등을 AI와 자연스럽게 연결하는 '에이전트 친화적 인프라' 구축이 시급함을 시사합니다.
  • 앤트로픽의 코딩 에이전트 성공 경험을 바탕으로, 대규모 생물학 데이터실험 인프라를 보유한 기업들과의 협력이 AI 바이오 분야 성장의 핵심 동력이 될 것으로 전망됩니다.

AI 바이오 에이전트 개발 경쟁과 앤트로픽의 관점

최근 AI 바이오 분야에서는 OpenAIGPT-Rosalind, 구글 아이소모픽 랩스, Xaira, Generate Biomedicines, Absci, 프로티나와 같은 기업들이 강력한 생물학 특화 AI 모델 개발에 막대한 투자를 진행하며 치열한 경쟁을 펼치고 있습니다. 그러나 앤트로픽은 최근 공개한 블로그 글 “Paving the way for agents in biology”를 통해 모델 자체의 성능을 넘어, 데이터 수집, 도구 활용, 검증, 피드백 루프를 포함하는 전체 시스템의 중요성을 강조했습니다. 특히 안드레 카파시의 공동 저자 참여는 이러한 시스템적 접근 방식에 대한 앤트로픽의 깊은 관심을 보여줍니다.

생물학 데이터 인프라의 현재 문제점

오늘날 소프트웨어 개발 환경은 GitHub, API, 데이터베이스, 버전 관리 시스템, 자동 테스트 도구 등이 잘 구축되어 있어 AI가 실제 업무를 수행하기 용이합니다. 반면, 생물학 분야는 연구 데이터가 여러 기관과 데이터베이스에 흩어져 있고, 저장 형식도 제각각이며, 같은 정보를 찾는 방법조차 복잡한 경우가 많습니다. 이러한 분산적이고 비표준화된 환경은 아무리 뛰어난 AI가 등장하더라도 실제 연구 과정에서 예상보다 많은 실수를 유발할 수 있습니다.

앤트로픽의 VirBench 평가 실험 결과

앤트로픽은 이러한 문제점을 확인하기 위해 VirBench라는 평가 환경을 구축하고 Claude, GPT, Biomni, Edison Analysis와 같은 최신 AI 에이전트들에게 NCBI Virus 데이터베이스에서 특정 조건에 맞는 바이러스 유전체 서열을 수집하는 작업을 수행하도록 했습니다. 이는 바이러스 감시, 진단 키트 개발, 백신 연구 등 실제 연구자들이 자주 수행하는 핵심 업무입니다.

하지만 실험 결과는 예상보다 좋지 않았습니다. 모델 성능은 약 16.9%에서 91.3%까지 큰 편차를 보였으며, 가장 높은 점수를 받은 모델조차 연구에 바로 사용할 수 있을 정도의 신뢰성을 보여주지 못했습니다. 발생한 오류들은 대부분 거창한 추론 실패가 아닌 '매우 사소해 보이는 데이터 처리 오류'였습니다.

  • 서로 다른 유전체 기준 버전을 혼동하는 문제
  • NCBIRefSeqGenBank 데이터를 구분하지 못하는 문제
  • 부분 유전체를 전체 유전체로 착각하는 문제
  • 분절형 바이러스의 경우 서로 다른 세그먼트 이름을 잘못 매칭하는 실수

이러한 작은 오류들은 일반 검색에서는 큰 문제가 되지 않을 수 있지만, 실제 생물학 연구에서는 결과값을 완전히 뒤바꿀 수 있는 치명적인 실수로 이어질 수 있습니다.

앤트로픽의 해결책: 전문 도구 활용 및 에이전트 친화적 인프라

앤트로픽 연구진은 AI의 추론 능력을 높이는 것보다 'AI가 사용할 수 있는 생물학 도구와 데이터 인프라를 잘 만드는 것이 훨씬 큰 효과를 낼 수 있다'는 중요한 사실을 발견했습니다. 처음에는 AI 에이전트가 직접 NCBI Virus 데이터베이스를 검색하도록 했으나 다양한 실수가 발생했습니다. 그러나 AI가 직접 데이터베이스를 다루지 않고, gget virus라는 전용 검색 도구를 사용하도록 역할을 분리하자 상황은 크게 달라졌습니다.

AI는 어떤 바이러스를 찾고 어떤 조건의 데이터를 수집해야 하는지만 판단하고, 실제 데이터 조회 및 추출은 검증된 프로그램이 수행하도록 한 결과, 정확도가 거의 100% 수준까지 향상되었습니다. 앤트로픽은 이를 통해 AI가 신뢰할 수 있는 데이터베이스, 표준화된 데이터 형식, 검증된 분석 도구와 자연스럽게 연결될 수 있는 에이전트 친화적 인프라를 우선적으로 구축해야 한다고 강조합니다. 이는 뛰어난 연구원 자체보다, 그 연구원이 정확한 데이터와 실험 장비를 실수 없이 사용할 수 있는 연구 환경을 먼저 만드는 것이 중요하다는 의미와 같습니다.

하네스(Harness) 엔지니어링의 중요성 및 미래 전망

현재 생물학 AI는 데이터베이스 검색, 실험 설계, 로봇 실험실 제어를 넘어 가설 생성 → 실험 → 결과 분석 → 다음 실험 설계까지 스스로 반복하는 완전한 루프를 구축하는 방향으로 발전하고 있습니다. 하지만 앤트로픽의 지적처럼 아직 기본적인 데이터 검색 과정조차 완전히 해결되지 않은 초기 단계에 머물러 있습니다. 이는 최근 AI 업계에서 중요성이 부각되는 '하네스(Harness)' 개념과 밀접하게 연결됩니다. 궁극적으로 중요한 것은 모델 성능뿐만 아니라, 데이터, API, 분석 도구, 검증 시스템, 실험 장비 등을 하나의 작업 흐름으로 자연스럽게 연결하는 운영 환경입니다.

코딩 산업과 달리 생물학은 데이터베이스 형식이 다양하고, 실험 결과 자체가 노이즈가 많으며, 무엇보다 최종 검증이 실제 세포, 동물, 인간을 대상으로 한 물리적 실험을 필요로 합니다. 따라서 생물학 AI 에이전트는 단순히 소프트웨어 도구를 연결하는 것을 넘어 데이터 생성, 실험 자동화, 측정 장비, 시뮬레이션, 그리고 전체 연구 워크플로우를 유기적으로 연결해야 합니다. 이러한 환경에서는 단순히 모델을 잘 만드는 회사보다 실제 생물학 데이터와 실험 인프라를 자체적으로 보유한 기업들이 유리할 가능성이 높습니다.

앤트로픽은 이러한 병목 지점에서 새로운 기회를 보고 있는 것으로 해석됩니다. 앤트로픽Claude Code를 통해 복잡한 소프트웨어 작업을 수행하는 코딩 에이전트 분야에서 가장 강력한 기업 중 하나입니다. 이번 안드레 카파시가 참여한 블로그 글은 앤트로픽코딩 에이전트의 성공 경험을 생물학 AI 분야로 확장하려는 초기 신호로 볼 수 있습니다.

결론적으로, 앤트로픽의 AI 바이오 진출로 가장 큰 수혜를 받을 수 있는 곳은 앤트로픽이 직접 보유하지 못한 자산을 가진 기업들입니다. 앤트로픽은 뛰어난 모델과 하네스, 에이전트 기술을 갖고 있지만, 대규모 생물학 데이터, 자동화 실험실, 환자 데이터 등은 가지고 있지 않습니다. 따라서 앤트로픽이 가진 AI 에이전트 역량과 실제 생물학 데이터 및 실험 인프라 보유 기업 간의 협력이 중요해질 가능성이 높으며, 이 두 축이 합쳐질 때 진정으로 실험 → 데이터 → 모델 피드백 → 재실험과 같은 AI 자기개선 루프가 작동하며 기하급수적인 생물학 분야의 성장이 이루어질 것으로 전망됩니다.

시사점

AI 바이오 분야의 투자는 단순히 AI 모델 개발 기업을 넘어, 대규모 생물학 데이터자동화된 실험 인프라를 선제적으로 구축하고 있는 기업들에 주목해야 합니다. 이들이 AI 에이전트 개발사와의 협력을 통해 AI 바이오 혁신의 핵심 동력이 될 것입니다.

원문 전문 보기
앤트로픽이 말하는 AI 바이오 에이전트의 핵심:  생물학 데이터 인프라 & 하네스 엔지니어링

2026.06.10. 오전 10:53
 2 
댓글
 
SNS 보내기
 
글씨 크기 조정

최근 AI 바이오 분야에서는 더 강력한 생물학 특화 모델을 만드는 경쟁이 치열하게 진행되고 있습니다. OpenAI는 GPT-Rosalind를 통해 생물학 연구 업무를 수행하는 AI를 개발하고 있고, 구글의 아이소모픽 랩스는 신약 개발 전 과정을 AI로 재구성하려 하고 있으며, Xaira와 Generate Biomedicines, Absci, 프로티나 같은 기업들도 세포와 단백질을 이해하는 대규모 AI 모델 구축에 막대한 투자를 진행하고 있습니다.

 

그런데 최근 앤트로픽이 공개한 “Paving the way for agents in biology”라는 블로그 글은 조금 다른 관점을 제시합니다. 특히 이번 글에는 최근 앤트로픽에 합류한 안드레 카파시도 공동 저자로 이름을 올렸는데요. 카파시는 오랫동안 AI의 경쟁력이 단순히 모델 하나가 아니라 데이터 수집, 도구 활용, 검증, 피드백 루프를 포함한 전체 시스템에서 나온다고 강조해 온 인물입니다. 그런 점에서 이번 글은 생물학 분야를 하나의 거대한 에이전트 문제로 바라보는 시각이 반영된 것으로도 읽힙니다.

 

쉽게 말하면 오늘날 소프트웨어 개발 분야는 GitHub, API, 데이터베이스, 버전 관리 시스템, 자동 테스트 도구 등이 잘 구축되어 있어 AI가 실제 업무를 수행하기 쉬운 환경이 갖춰져 있는 반면, 생물학 분야는 연구 데이터가 여러 기관과 데이터베이스에 흩어져 있고, 저장 형식도 제각각이며, 같은 정보를 찾는 방법도 복잡한 경우가 많습니다. 따라서 아무리 뛰어난 AI가 등장하더라도 실제 연구 업무를 수행하는 과정에서는 예상보다 많은 실수가 발생할 수 있습니다.

 

실제로 앤트로픽은 최신 AI 에이전트들에게 바이러스 유전체 데이터를 수집하는 작업을 수행하게 했는데, 모델들은 생각보다 많은 오류를 보였습니다. 그런데 AI가 직접 데이터베이스를 검색하는 대신, 검증된 전용 도구를 연결하자 정확도가 크게 향상됐습니다. 이는 생물학 AI의 발전이 신뢰할 수 있는 데이터와 전문 도구를 AI가 얼마나 안정적으로 활용할 수 있는지가 매우 중요하다는 점을 보여줍니다.

 

이러한 관점은 최근 AI 업계에서 자주 언급되는 ‘하네스(Harness)’ 엔지니어링 개념과도 크게 연결됩니다. 결국 중요한 것은 모델 성능뿐만 아니라, 생물학 데이터, API, 분석 도구, 검증 시스템, 실험 장비 등을 하나의 작업 흐름으로 자연스럽게 연결하는 운영 환경이라는 것인데요. 이번 포스팅에서는 앤트로픽이 생각하는 생물학 AI의 병목과, 앞으로 AI 시대의 생물학 연구를 위해 어떤 인프라가 필요하다고 보는지에 대해 자세히 알아보겠습니다.  (앤트로픽 블로그 원문은 아래 링크)

​

Paving the way for agents in biology

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

www.anthropic.com

 

 

​

​

Paving the way for agents in biology

​

앤트로픽은 현재 생물학 AI의 가장 큰 문제는 모델의 지능 자체가 아니라 ‘생물학 데이터 인프라’라고 설명합니다. 실제 연구 현장에서는 단순히 논문을 읽는 것보다 정확한 데이터를 찾아오는 일이 매우 중요한데, 지금의 생물학 데이터는 여러 데이터베이스에 흩어져 있고 형식도 복잡해 AI가 생각보다 자주 실수를 저지른다는 것입니다.

 

이를 확인하기 위해 앤트로픽은 VirBench라는 평가 환경을 만들고 Claude, GPT, Biomni, Edison Analysis 같은 최신 AI 에이전트들에게 NCBI Virus 데이터베이스에서 특정 조건에 맞는 바이러스 유전체 서열을 수집하는 작업을 수행하도록 했습니다. 이러한 작업은 실제로 바이러스 감시, 진단 키트 개발, 백신 연구 과정에서 연구자들이 자주 수행하는 업무입니다.

 

하지만 결과는 예상보다 좋지 않았습니다. 모델 성능은 약 16.9%에서 91.3%까지 매우 큰 차이를 보였으며, 가장 높은 점수를 받은 모델조차 항상 연구에 바로 사용할 수 있을 정도의 신뢰성을 보여주지는 못했습니다. 문제는 대부분 거창한 추론 실패가 아니라 ‘매우 사소해 보이는 데이터 처리 오류’였습니다.

 

예를 들어 서로 다른 유전체 기준 버전을 혼동하거나, NCBI의 RefSeq와 GenBank 데이터를 구분하지 못하거나, 부분 유전체를 전체 유전체로 착각하는 경우가 있었습니다. 또 분절형 바이러스의 경우 서로 다른 세그먼트 이름을 잘못 매칭하는 실수도 발생했습니다. 이런 오류는 일반 검색에서는 크게 문제가 되지 않을 수 있지만, 실제 생물학 연구에서는 작은 오류 하나로 결과값이 완전히 뒤집어질 수가 있습니다.

 

 

​

​

앤트로픽의 해결책

​

앤트로픽이 이번 연구에서 발견한 가장 중요한 점은 AI의 추론 능력을 더 높이는 것보다 ‘AI가 사용할 수 있는 생물학 도구와 데이터 인프라를 잘 만드는 것이 훨씬 큰 효과를 낼 수 있다’는 사실입니다.

 

연구진은 처음에는 AI 에이전트가 직접 NCBI Virus 데이터베이스를 검색해 필요한 바이러스 유전체 정보를 찾도록 했는데, 이 과정에서 다양한 실수가 발생했습니다. 따라서 AI가 직접 데이터베이스를 다루지 않고, 대신 gget virus라는 전용 검색 도구를 사용하도록 하자 상황이 크게 달라졌습니다. AI는 어떤 바이러스를 찾고 어떤 조건의 데이터를 수집해야 하는지만 판단하고, ‘실제 데이터 조회와 추출은 검증된 프로그램이 수행’하도록 역할을 분리한 것입니다. 그러자 정확도가 거의 100% 수준까지 향상됐습니다.

 

이를 통해 앤트로픽은 무엇보다 먼저 AI가 신뢰할 수 있는 데이터베이스, 표준화된 데이터 형식, 검증된 분석 도구와 자연스럽게 연결될 수 있는 에이전트 친화적 인프라를 구축해야 한다고 설명합니다. 쉽게 말해 더 뛰어난 연구원을 만드는 것도 중요하지만, 그 연구원이 정확한 데이터와 실험 장비를 실수 없이 사용할 수 있는 연구 환경을 먼저 만드는 것이 더 중요하다는 의미에 가깝습니다.

​

출처: Anthropic

​

 

 

​

생물학 AI 데이터 인프라 & 하네스(Harness)

​

현재 생물학 AI는 데이터베이스를 검색하고, 실험을 설계하고, 앞으로는 로봇 실험실 또한 제어하며, 궁극적으로는 가설 생성 → 실험 → 결과 분석 → 다음 실험 설계까지 스스로 반복하는 완전한 루프를 구축하는 방향으로 발전하고 있습니다.

 

다만 이번에 앤트로픽이 지적한 바를 보면 생물학 AI는 아직 우리가 생각하는 것보다 더 초기 단계에 머물러 있으며, 가장 기본적인 데이터 검색 과정조차 완전히 해결되지 않은 상황으로 보입니다. 그리고 이는 최근 AI 업계에서 자주 언급되는 하네스(Harness) 개념과 크게 이어지는데요. 결국 중요한 것은 모델 하나가 아니라 데이터, API, 분석 도구, 검증 시스템, 실험 장비를 하나의 작업 흐름으로 연결하는 운영 환경이라는 것입니다.

 

앞서 앤트로픽도 설명했지만 코딩 산업과 비교해 생물학은 데이터베이스마다 형식이 다르고, 실험 결과 자체가 노이즈가 많으며, 무엇보다 최종 검증이 실제 세포·동물·인간을 대상으로 한 물리적 실험을 필요로 합니다. 따라서 생물학 AI 에이전트는 단순히 소프트웨어 도구를 연결하는 수준이 아니라 데이터 생성, 실험 자동화, 측정 장비, 시뮬레이션, 연구 워크플로우 전체를 연결해야 합니다. 그래서 이런 환경에서는 단순히 모델을 잘 만드는 회사보다 실제 생물학 데이터와 실험 인프라를 자체적으로 가진 기업들이 유리할 가능성이 높습니다. 이와 관련해서는 제가 몇몇 기업들을 꾸준히 설명드리고 있죠.

 

또한 이러한 병목 지점에서 앤트로픽은 새로운 기회를 보고 있는 것으로 보입니다. 앤트로픽은 현재 코딩 에이전트 분야에서 가장 강력한 기업이며, 실제로 Claude Code를 통해 AI가 복잡한 소프트웨어 작업을 수행하는 방법을 연구해왔습니다. 따라서 이번 안드레 카파시를 포함한 앤트로픽의 블로그 글은 코딩 에이전트의 성공 경험을 생물학 AI 분야로 확장하려는 초기 신호로도 해석할 수 있습니다.

 

그리고 앤트로픽의 AI 바이오 진출로 인해 가장 큰 수혜를 받을 수 있는 곳은 앤트로픽이 직접 보유하지 못한 자산을 가진 기업들일 수 있습니다. 앤트로픽은 뛰어난 모델과 하네스, 에이전트 기술을 갖고 있지만, 대규모 생물학 데이터와 자동화 실험실, 환자 데이터 등은 가지고 있지 않습니다. 따라서 앞으로는 앤트로픽이 가진 AI 에이전트 역량과 실제 생물학 데이터 및 실험 인프라 보유 기업 간의 협력이 중요해질 가능성이 높습니다. 이 두 축이 합쳐질 때 진정으로 실험 → 데이터 → 모델 피드백 → 재실험과 같은 AI 자기개선 루프가 제대로 돌아가며 기하급수적인 생물학 분야의 성장이 이루어질 것으로 보입니다.

​

​

해당 콘텐츠는 프리미엄 구독자 공개(유료) 콘텐츠로 무단 캡쳐 및 불법 공유시 법적 제재를 받을 수 있습니다.

#앤트로픽
 
#AI에이전트
 
#하네스엔지니어링
 
#인공지능
 
#AI
 
#AI바이오
 
#AI생물학
 
#AI신약개발
 
#바이오
 
#생물학
 
#AI데이터
 
#생물학데이터
 
#안드레카파시
 
#미국주식
 
#한국주식
 
like
2 
댓글
공유하기

원문 보기 ↗