엔비디아 ‘DGX B200’, LLM 실시간 추론 '세계 신기록'...초당 1000 토큰 돌파

메타 '라마 4 매버릭' 모델로 초당 1000토큰 처리 속도 달성
단일 노드에서 대형 언어모델 실시간 구동 가능성 입증
AI 지연 시간 획기적 단축…사용자경험 대폭 개선 '기대'

2025.05.26 09:50:33
스팸방지
0 / 300