바스트데이터-래블업 맞손… SKT '소버린 AI 클러스터'에 차세대 데이터·컴퓨팅 환경 구축

바스트 AI OS와 백엔드.AI 통합
GPU·스토리지 독립 확장으로 국내 최대 규모 AI 모델 학습 지원

 

[더구루=김예지 기자] 미국의 글로벌 인공지능(AI) 인프라 기업 바스트데이터가 국내 AI 플랫폼 개발사 래블업과 손잡고 SK텔레콤(SKT)의 국내 최대 규모 '주권형 AI(Sovereign AI) 클러스터'에 차세대 데이터·컴퓨팅 환경을 구축한다. 양사는 대규모 AI 모델 학습을 위한 고성능 데이터 처리 기반을 통합 제공하며, 한국 AI 생태계의 기술 자립과 대규모 언어모델(LLM) 경쟁력 강화에 힘을 보탠다.

 

20일 바스트데이터에 따르면 래블업의 오픈형 AI 컴퓨팅 플랫폼 ‘백엔드.AI(Backend.AI)’와 바스트데이터의 ‘VAST AI 오퍼레이팅 시스템’을 통합한 고성능 데이터 인프라를 구축해 한국형 주권 AI 프로젝트 지원에 나섰다. 이번 협력은 SKT가 엔비디아 B200 GPU 1000장 이상으로 구성한 국내 최대 GPUaaS '해인 클러스터' 를 통해 운영 중인 자체 가상화 솔루션 '페타서스(Petasus) AI 클라우드'에 적용된다.

 

래블업은 그래픽처리장치(GPU)·중앙처리장치(CPU) 기반 AI 작업을 통합 관리하는 백엔드.AI에 바스트데이터의 초고속 스토리지 기술을 접목, 모델 학습 데이터·체크포인트·아티팩트를 안정적으로 처리할 수 있는 환경을 확보했다. 기존 스토리지 인프라가 처리량과 동시성에서 한계를 보이자, 래블업은 바스트데이터의 '분리형 공유 아키텍처(DASE)'를 도입해 성능 병목을 해소하고 확장성을 강화했다.

 

특히, 이번 통합으로 기존 베어메탈(Bare Metal) 기반에서 며칠 또는 몇 주가 걸리던 GPU 워크로드 구성을 10분 내로 단축할 수 있게 됐다. 또한 가상화 환경에서도 베어메탈 수준의 성능을 유지하며 AI 학습과 추론을 모두 지원하는 통합 파이프라인이 구축됐다. 이를 통해 GPU 같은 연산 장비와 저장공간을 필요한 만큼 각각 따로 늘릴 수 있으면서도, 여러 서버에 흩어진 데이터가 하나의 큰 폴더처럼 보이는 ‘단일 글로벌 네임스페이스(VAST DataSpace)’ 환경을 구현했다. 이에 따라 연구자들은 데이터가 어디에 저장돼 있든 동일한 방식으로 접근해 체크포인트·데이터셋·모델 출력물 등을 즉시 공유할 수 있는 협업 구조를 갖추게 됐다.

 

주권형 AI 핵심 요구사항인 '데이터 주권' 확보를 위해 바스트데이터의 제로트러스트 기반 데이터 거버넌스 구조가 적용돼 데이터 보관 위치, 접근 제어, 규제 준수, 감사관리 등을 체계적으로 지원한다.

 

SKT의 해인 클러스터는 GPU 직접 경로와 원격 직접 메모리 접근(RDMA) 기반 초저지연 데이터 처리 기술이 적용돼 대규모 사전학습 및 파인튜닝 성능이 크게 향상됐다. 바스트데이터의 '분리형 공유 아키텍처(DASE, Disaggregated and Shared-Everything)는 데이터 이동 및 저장 제약을 제거하고, 데이터 공급 속도를 GPU 연산 속도와 일치시켜 성능 손실을 방지한다. 멀티테넌트 환경에서도 양사의 통합 접근제어 및 쿼터 관리 체계를 통해 정부·학계·기업 연구자 모두가 안정적이고 예측 가능한 성능을 제공받는다.

 

양사는 향후 해당 플랫폼을 기반으로 추론·에이전틱 AI 등 차세대 AI 서비스로 확장할 계획이다. 한국형 기초모델 컨소시엄에서도 해당 통합 인프라를 활용해 초대규모 말뭉치 처리, 프리트레이닝·파인튜닝 등 주권 AI 역량 구축이 진행 중이다.









배너

K방산

더보기




더구루인사이트

더보기