딥시크 R2 토큰당 단가, GPT-4 대비 2.7% 수준...'두번째 쇼크' 예고

화웨이 어센드910B로 작동

 

[더구루=홍성일 기자] 중국 인공지능(AI) 스타트업 딥시크(DeepSeek)의 차세대 추론모델 'R2'의 일부 정보가 공개됐다. 업계는 공개된 정보가 사실일 경우 글로벌 AI 시장에 '두번째 쇼크'를 줄 것이라는 전망을 내놓고 있다.

 

28일 중국 온라인 커뮤니티 지우얀공서(韭研公社)에 공개된 보고서에 따르면 딥시크 R2의 토큰당 단가는 오픈AI GPT-4 터보에 비해 2.7% 수준인 것으로 확인됐다. GPT-4 터보의 입력 토큰 100만 개당 비용은 10달러, 출력 토큰 100만 개당 비용은 30달러다.

 

지우얀공서에 공개된 자료에 따르면 R2는 딥시크가 독자 개발한 하이브리드 MoE(Mixture of Experts) 3.0 아키텍처를 기반으로 하며, 매개변수(파라미터)는 1조2000억개다. 이전 모델인 R1의 2배에 달하는 수치다. 파라미터가 많아지면 AI가 명령에 대해 더 정확한 반응을 내놓다. MoE의 경우 AI모델이 가지고 있는 매개변수 중 필요한 부분만 활성화해 연산 성능을 높일 수 있는 기능이다.

 

또한 딥시크 R2는 화웨이의 자체 AI칩인 어센드(Ascend) 910B로 구성된 AI클러스터에서 82%의 활성도를 달성했다. 82% 활성도 달성 당시 측정된 컴퓨팅 파워는 FP16 정밀도 기준 512페타플롭스(petaflops, 1초당 1000조번 연산)였다. 보고서는 동일규모 엔비디아 A100 클러스터의 91% 수준이라고 설명했다.

 

업계는 딥시크가 R2에 대한 정보를 공개한 바가 없기 때문에 이번 보고서에 대해 신중하게 받아드릴 필요가 있다는 입장이다. 그러면서도 공개된 수치가 사실일 경우 다시 한 번 '딥시크 쇼크'가 발생할 수 있다는 분석도 내놓고 있다. 

 

업계 관계자는 "딥시크 R2의 토큰당 비용이 GPT-4터보의 2.7% 수준이라면 AI를 도입하려는 기업에게 매력적인 선택지가 될 것"이라며 "R2의 출시가 기업용 AI 시장에 전환점이 될 수 있다"고 말했다.

 

한편 딥시크는 최고 재무책임자(CFO)와 최고 운영책임자(COO) 선임에 나서는 등 본격적인 사업화에 속도를 내고 있다. 딥시크는 5월 초 출시될 것으로 알려진 R2와 V4를 기반으로 본격적인 사업 확장에 나설 것으로 전망되고 있다.










K방산

더보기




더구루인사이트

더보기

반론 및 정정보도요청