[더구루=홍성일 기자] 애플 혼합현실(MR) 디바이스 비전프로(Vision Pro)의 애플리케이션(앱) 생태계 구축이 속도가 나질 않고 있다. 애플은 보급형 버전 개발을 연기하는 등 반전을 꾀하고 있지만 좀체 성장할 기미가 보이지 않는다. [유료기사코드] 22일 소프트웨어 구독 플랫폼 셋앱(Setapp)에 따르면 개발자 중 3%만이 비전프로용으로 새로운 앱을 개발하고 있다. 50%의 개발자는 비전프로 애플리케이션 지원 여부 자체가 불확실하다고 답변했다. 셋앱 설문조사에 따르면 35%의 개발자는 비전프로용 앱 개발 계획 자체가 없다고 밝혔다. 대신 60%의 개발자들은 인공지능(AI) 기능 개발에 적극적으로 참여하고 있다고 전했다. 올해 1월 출시된 애플 비전프로는 높은 관심도와는 다르게 다소 비싼 가격, 미성숙한 생태계 등으로 판매가 미비한 상황이다. 블룸버그 IT전문 기자 마크 거먼에 따르며 비전프로는 출시된 이후 50만대도 판매하지 못했다. 심지어 구매자들조차 애플 비전프로에 대한 흥미를 잃은 것으로 확인되고 있다. 애플은 상황을 반전시키기 위해 초광각을 지원하는 비전OS 2.2를 출시하기도 했지만 상황을 역전시키지는 못했다. 최근에는 올해 말 비전프로의
[더구루=홍성일 기자] 애플이 엔비디아와 거대언어모델(LLM) 추론 성능 향상을 위해 협력한다. 과거 좋은 파트너 관계였던 애플과 엔비디아가 인공지능(AI) 시대에서 예전처럼 좋은 시절을 함께 보낼 수 있을지 관심이 집중되고 있다. [유료기사코드] 20일 업계에 따르면 애플은 엔비디아와 협력해 그래픽처리장치(GPU)에서 리커런트 드래프터(Recurrent Drafter, 이하 리드래프터)를 텐서RT-LLM(TensorRT-LLM) 추론 가속 프레임워크에 통합했다. 텐서RT-LLM은 엔비디아 GPU에서 LLM의 추론 성능을 최적화하는데 사용되는 오픈 소스 라이브러리다. 이번 협력은 애플의 LLM 추론 성능 강화 연구 과정에서 진행됐다. 애플이 엔비디아 GPU에 통합한 리드래프터는 올해 초 공개됐으며 현재는 오픈소스로 제공되고 있다. 애플에 따르면 리드래프터는 새로운 추측 디코딩 접근 방식이다. 추측 디코딩은 프로세서가 명령어를 실행하기 전 미리 다음 명령어를 예측해 디코딩하는 것이라고 정의된다. AI모델에서도 LLM의 추론 속도를 높이기 위해 초안모델(draft model)을 만들고 다음에 올 가능성이 높은 토큰을 예측하고 이를 밑그림 삼아 빠르게 텍스트를 생
[더구루=홍성일 기자] 일본 인터넷서비스 기업 라쿠텐(Rakuten)이 일본어 최적화 인공지능(AI) 모델을 선보였다. 라쿠텐은 새로운 AI모델을 기반으로 일본 내 AI 서비스 확대에 속도를 낸다. [유료기사코드] 라쿠텐은 18일 일본어에 최적화된 새로운 거대언어모델(LLM) '라쿠텐 AI 2.0'과 소형언어모델(SLM) '라쿠텐 AI 2.0 미니'를 공개했다. 라쿠텐은 두 모델을 내년 봄까지 오픈 소스 커뮤니티에 공개, AI 애플리케이션 개발을 지원할 것이라고 설명했다. 라쿠텐 AI 2.0은 지난 3월 출시된 라쿠텐 AI 7B 모델을 기반으로 8x7B MoE(Mixture of Experts) 기반 모델이다. 8x7B MoE는 70억개 매개변수를 가진 8개의 전문화 카테고리로 구성된 모델이라는 뜻으로, 추론 및 학습 중에는 8개 카테고리 중 특정한 카테고리만 활성화 돼 프롬프트를 처리한다. 라쿠텐은 입력된 토큰을 가장 관련성이 높은 두 카테고리에 전달돼 처리되는 방식으로 작동한다고 설명했다. 라쿠텐 AI 2.0 미니는 15억 개 매개변수를 기반 라쿠텐 최초의 SLM이다. 라쿠텐은 라쿠텐 AI 2.0 미니가 일본어 생성 부문에서 높은 성능과 정확성을 보여줬다
[더구루=홍성일 기자] 일론 머스크 테슬라 최고경영자(CEO)가 2030년까지 뉴럴링크(Neuralink)를 통해 100만명 이상의 사람들에게 뇌-컴퓨터 인터페이스(BCI) 칩을 이식하겠다는 계획을 밝혔다. 일론 머스크는 BCI 칩의 성능도 기하급수적으로 향상될 것이라고 주장해 눈길을 끌고 있다. [유료기사코드] 19일 업계에 따르면 머스크는 엑스(X, 옛 트위터)를 통해 "입출력 비트 전송 속도와 이식 환자 수가 5년 이상에 걸쳐 기하급수적으로 증가할 것"이라며 "추측으로는 2030년까지 입출력 비트 전송 속도(I/O Bit rate) 1Mbs, 이식 환자는 100만 명 이상이 될 것"이라고 말했다. 머스크의 발언은 미국 밴처캐피탈(VC) 알티미터(Altimeter)의 투자자인 아푸르브 아그라왈(Apoorv Agrawal)의 뉴럴링크 분석에 대한 답변이었다. 아푸르브 아그라왈은 "뉴럴링크는 2020년대 가장 중요한 회사"라며 "뉴럴링크의 기술이 수백만명의 독립성을 회복시키는 혁명을 일으킬 것"이라고 극찬했다. 그러면서 뉴럴링크의 BCI 임플란트 장치인 'N1'의 전송속도에 대한 분석을 게재했다. 아푸르브 아그라왈이 공개한 자료에 따르면 현재 N1 임플란트가
[더구루=홍성일 기자] 구글 양자컴퓨팅 칩 '윌로우(Willow)'가 공개되며 양자컴퓨터에 대한 관심이 커지고 있다. 관련 업계에서는 윌로우가 양자컴퓨터가 실용적인 계산 도구로 발전하는데 중요한 이정표가 될 것이라는 기대감을 표하고 있다. [유료기사코드] 18일 업계에 따르면 구글이 지난 10일 공개한 윌로우는 최강의 슈퍼컴퓨터인 프런티어로 10자년(10의 24제곱)이 걸리는 계산을 5분 이내에 수행하는 등 양자컴퓨터 기술 개발의 신기원을 열었다는 평가를 받았다. 윌로우가 높은 평가를 받는 것은 물리적 큐비트의 오류를 획기적으로 줄이는데 성공했기 때문이다. 양자컴퓨터는 0과1이 중첩된 큐비트를 기반으로 작동한다. 중첩을 기반으로 하다보니 전통적인 컴퓨터보다 특정분야에서 최대 30조배까지 빠른 연산이 가능하다. 문제는 중첩상태로 인해 작은 잡음에도 오류를 발생시킨다는 것. 오류는 큐비트가 늘어날 수록 오류도 늘어난다. 잡음에는 소리, 중력파 등 각종 파장 등이 포함된다. 잡음으로 인해 큐비트가 불안정해지면 양자컴퓨터도 제대로 사용할 수 없게 된다. 이에 양자컴퓨터 개발에 필수 기술로 뽑히는 것이 '양자 오류 정정(Quantum error correction,
[더구루=홍성일 기자] 사티아 나델라(Satya Nadella) 마이크로소프트(MS) 최고경영자(CEO)가 엑스박스(Xbox)에 대한 기대감을 전했다. 콘텐츠와 운영 방식을 두고 다양한 목소리가 나오는 상황에서 MS의 향후 엑스박스 전략에 대한 궁금증이 더욱 커지게 하고 있다. [유료기사코드] 18일 업계에 따르면 사티아 나델라 CEO는 연례 주주총회에 참석해 "장기적으로 인공지능(AI) 혁신, 클라우드 혁신, 콘솔 혁신, PC 혁신을 통해 모든 게이머가 즐길 수 있는 최고의 게임을 만들 수 있다고 생각한다"고 밝혔다. 이어 그는 "우리는 게임의 즐거움을 모든 곳에 가져가자고 생각했다"며 "'This is an Xbox' 광고 등을 통해 모든 디바이스에서 엑스박스를 즐길 수 있다는 점을 강조하고 있다"고 덧붙였다. 사티아 나델라 CEO의 발언을 두고 업계에서는 다양한 분석이 나오고 있다. 일부에서는 이번 발언을 두고 독점 콘텐츠를 중심으로 하는 '퍼스트파티 전략'을 포기하고 엑스박스 게임패스, 엑스박스 클라우드 게이밍 등 구독 서비스 확대에 집중, 플랫폼을 뛰어넘는 생태계를 확장하겠다는 뜻을 밝힌 것이라고 전망하기도 했다. 엑스박스 게임패스는 월 구독료를 내
[더구루=홍성일 기자] 일론 머스크의 xAI에 이어 미국 반도체기업 브로드컴도 100만장 인공지능(AI) 가속기가 탑재된 하이퍼스케일 데이터센터 건설을 발표하고 나섰다. AI기술 발전 속도에 따라 컴퓨팅 인프라 발전 속도도 빨라지고 있는 모양새다. [유료기사코드] 17일 업계에 따르면 브로드컴은 지난 12일(현지시간) 4분기 실적을 발표하며 "대형 클라우드 기업 3곳과 AI반도체를 개발 중"이라며 "2027년까지 구글, 메타, 바이트댄스 등이 100만 확장형 처리 장치(Extensible Processing Unit, XPU)를 탑재한 AI 슈퍼컴퓨터를 구축할 것"이라고 밝혔다. XPU는 다양한 종류의 프로세서들을 포함하는 개념으로 AI프로세서가 대표적이다. 브로드컴은 3개 회사와 협업으로 2027년까지 최대 900억 달러(약 130조원) 매출을 올릴 것으로 전망했다. 이에 브로드컴의 주가가 급등, 시가총액 1조달러 클럽에 가입했다. 브로드컴 외에도 100만장 규모 데이터센터를 구축하려는 곳은 일론 머스크의 xAI다. xAI는 현재 미국 테네시주 멤피스에 '콜로서스'라는 현존 최강 AI슈퍼컴퓨터를 가동하고 있다. 콜로서스는 그래픽처리장치(GPU) 성능면에서
[더구루=홍성일 기자] 구글이 튀르키예서 또 다시 경쟁법 위반으로 벌금을 부과받았다. 구글의 시장 지배력에 대한 전세계 경쟁당국들의 규제가 이어지고 있는 모양새다. [유료기사코드] 16일 업계에 따르면 튀르키예 경쟁위원회(Turkish Competition Authority, TCA)가 구글에 26억1000만리라(약 1070억원) 벌금을 부과했다. TCA는 구글이 광고 서버 시장에서 지위를 남용, 경쟁법 제6조를 위반했다고 판단했다. TCA에 따르면 구글은 유튜브의 광고 인벤토리 구매에 자체 수요 측 플랫폼(Demand Side Platforms, DSP)만을 사용하게 하기 위해서 독립서비스 제공업체를 통해 유튜브 광고 검증, 측정을 막았다는 의혹에 대해서 조사를 받았다. 즉 유튜브 광고 정보를 독점해 다른 플랫폼이 시장에 접근할 수 없도록 막은 것이다. 구글은 이런 우려를 없애기 위해 TCA에 타사 DSP가 유튜브 광고 인벤토리에 접근하는 것을 보장하는 확약서를 제출했다. TCA는 구글의 확약서를 받고 관련 혐의 조사 절차를 마무리했다. 문제는 공급자 광고 매체 플랫폼(Supply-Side Platform, SSP)에서 확인됐다. SSP는 광고 퍼블리셔가
[더구루=홍성일 기자] 마이크로소프트(MS)가 구글 인공지능(AI) 조직 '딥마인드(Deepmind)' 인재들을 모아 AI헬스케어 조직을 만들었다. [유료기사코드] 13일 경제전문매체 파이낸셜 타임즈에 따르면 MS는 무스타파 슐레이만(Mustafa Suleyman) 마이크로소프트 AI 최고경영자(CEO) 산하에 새로운 헬스케어 조직을 구성했다. 해당 조직의 사무실은 런던에 위치하며 소비자 건강 AI 분야 기술 개발을 주도할 계획이다. 새로운 AI 헬스 조직을 이끄는 무스타파 슐레이만은 구글 AI 부문을 이끌고 있는 딥마인드의 공동창업자다. 무스타파 슐레이만은 딥마인드 설립 이후 최고 제품 책임자(CPO), AI 응용 부문 총괄 등을 맡았다. 2020년에는 구글 부사장으로 자리를 옮겨 2022년까지 AI 개발과 정책 수립 등을 이끌었다. MS는 올해 3월 무스타파 슐레이만은 AI 총과로 영입했다. 또한 무스타파 슐레이만이 경영하던 AI 스타트업 인플렉션AI 직원들도 대거 고용했다. 딥마인드 공동창업자인 무스타파 슐레이만이 조직을 이끌게 되면서 딥마인드 출신 인재들이 새로운 조직으로 몰려드록 있다. 알려진 바에 따르며 딥마인드 헬스케어 부문 총괄이었던 도미닉 킹
[더구루=홍성일 기자] 마이크로소프트(MS)가 인공지능(AI) 데이터센터 확장으로 발생하는 기후 발자국을 완화하기 위한 방안을 찾고 있다. MS는 기후 발자국 완화에 열쇠는 '재활용수'라고 보고있다. [유료기사코드] 13일 업계에 따르면 MS는 오는 2026년 애리조나주 피닉스, 위스콘신주 마운트 플레전트에 완공되는 데이터센터에 새로운 냉각시스템을 적용한다. MS에 따르면 새로운 냉각시스템이 적용된 데이터센터는 건설 이후 외부에서 추가로 물을 공급받을 필요가 없다. 새로운 냉각 시스템은 폐쇄 루프 방식을 활용, 서버 냉각수를 재활용한다. AI 연산 등에 사용되는 가속기들은 엄청난 열을 발생시킨다. 이를 효과적으로 냉각시켜주지 못하면 성능 저하는 물론 내구성 문제가 발생한다. 데이터센터에서 가장 많이 효율적으로 사용되는 냉각 방식은 물로 식혀주는 '수랭 방식'이다. 수랭식은 물을 순환시켜 가속기 등에서 발생하는 열을 흡수하고 증발시켜 냉각하는 방식이다. 이에 24시간 365일 가동되는 데이터센터를 유지하기 위해서는 많은 물이 필요했다. 그동안 데이터센터들은 냉각에 이용된 물을 그대로 증발시켰으며 연간 수십억 리터의 물을 사용했다. MS의 새로운 냉각 방식은 증
[더구루=홍성일 기자] 중국에서 504큐비트 초전도 양자칩과 양자컴퓨터를 결합한 새로운 양자 시스템이 공개됐다. 새로운 양자 시스템은 중국의 국가 통신 보안 강화에 투입될 것으로 전해졌다. [유료기사코드] 12일 업계에 따르면 중국통신양자그룹(CTQG)은 504큐비트 초전도 양자 칩 '샤오홍-504(Xiaohong-504)'와 '티엔옌-504(Tianyan-504)'를 결합한 최신 양자 시스템으로 개발했다. CTOQ는 샤오홍-504 양자칩이 큐비트 수명, 게이트 충실도, 회로 깊이 등 중요 영역에서 미국 IBM과 같은 기존 양자 플랫폼과 유사한 성능을 보여준다고 주장했다. 처음으로 제작된 샤오홍-504는 양자 기술 기업 퀀텀CT텍에 납품, 광범위한 테스트를 진행할 예정이다. 샤오홍-504와 함께 공개된 티엔옌-504는 총 1180 큐비트로 구성된 양자컴퓨터다. 시제품은 지난해 말 공개됐다. 티엔옌-504 개발에는 CTQG를 비롯해 중국과학원, 퀀텀CT텍 등이 참여했으며, 향후 티엔옌 양자 클라우드 플랫폼에 통합된다. CTOQ 등은 티엔옌-504를 앞세워 양자 우위를 달성 뿐 아니라 대규모 양자 시스템 구축을 위한 인프라 개발에도 속도를 낸다는 계획이다. 업계
[더구루=홍성환 기자] 미국 실리콘밸리 실리콘 포토닉스(광반도체) 스타트업 아야랩스(Ayar Labs)가 엔비디아·인텔·AMD 등 글로벌 반도체 기업으로부터 투자를 유치했다. [유료기사코드] 아야랩스는 1억5500만 달러(약 2200억원) 규모 신규 자금조달 라운드를 완료했다고 12일 밝혔다. 이번 라운드에서 기업가치는 10억 달러(약 1조4300억원)로 평가받았다. 엔비디아·인텔캐피탈·AMD 등이 투자했다. 이외에 3M벤처스, 오토파일럿 등이 신규 투자자로 참여했다. 미국 캘리포니아주(州) 새너제이에 본사를 둔 아야랩스는 실리콘 포토닉스 솔루션 기업이다. 실리콘 포토닉스는 광학 소자 기술이라고도 불린다. 전기 신호를 구리 선을 통해 전달하는 일반적인 반도체와 달리 빛을 통해 데이터를 전송하는 기술이다. 더 빠르고, 에너지 효율적이며, 저렴하게 데이터 전송이 가능하게 한다. 실리콘 포토닉스는 웨이퍼를 기반으로 광학 소자를 제작해 만든다. 실리콘 기판 위에 도파로, 광결합기, 광원, 광검출기와 같은 다양한 광학 소자를 미세하게 집적해 광신호를 생성, 전송, 변환, 검출하는 기능을 구현한다. 이에 최근 삼성전자, 엔비디아, TSMC, 인텔 등 세계적인 반도체 기
[더구루=정예린 기자] 엔비디아가 오는 2027년부터 고대역폭메모리(HBM) 핵심 부품인 ‘베이스 다이’의 자체 생산을 추진한다. 기존 공급망 의존도가 줄어들면서 HBM 시장과 글로벌 메모리 반도체 기업들에 상당한 파장이 예상된다. [유료기사코드] 19일 대만 공상시보(CTEE)에 따르면 엔비디아는 7세대 HBM인 HBM4E부터 자체 설계한 베이스 다이를 탑재할 계획이다. 초기에는 TSMC 3나노미터(nm) 공정을 적용해 소량 시험 생산을 진행하고, 점차 생산 규모를 확대할 예정이다. 현재 엔비디아와 SK하이닉스는 HBM 개발 과정에서 설계부터 생산까지 공동으로 진행하고 있다. 하지만 2027년 하반기부터는 엔비디아가 자체 맞춤형 HBM4E 설계를 주도하고, SK하이닉스는 이러한 설계 기반의 생산만 지원하는 형태로 역할이 조정될 전망이다. 구체적으로, 2027년 상반기에는 SK하이닉스가 TSMC 12nm 공정에서 표준 HBM4E를 공급하며 초기 생산을 담당하고, 이후 엔비디아가 설계한 HBM4E가 3nm 공정에서 생산될 경우 SK하이닉스는 생산 지원에 집중하게 된다. 계획대로 진행되면 SK하이닉스는 기존 설계 협업 중심 역할에서 벗어나 생산 전문 지원으로 일
[더구루=홍성일 기자] 캐나다 인공지능(AI) 스타트업 코히어(Cohere)가 메타 출신 AI 책임자를 영입했다. 코히어는 대규모 신규 투자 유치와 최고재무책임자(CFO)도 영입하며, 사업확장을 가속화하고 있다. [유료기사코드] 19일 업계에 따르면 코히어는 조엘 피노(Joelle Pineau) 전 메타 AI연구 부문 부사장을 최고 AI 책임자(CAIO)로 영입했다. 피노 CAIO는 향후 코히어의 연구와 제품, 정책 등 AI 전략 전반을 주도한다. 피노는 머신러닝 부문의 세계적 석학으로 지난 2004년부터 캐나다 몬트리올에 위치한 맥길대학교 컴퓨터 과학과 교수로 활동했다. 피노는 지난 2017년 메타 AI에 리서치 부문 총괄로 합류했으며, 2023년부터 올해 5월까지는 기반 AI 연구팀(Fundamental AI Research, FAIR)팀의 총괄로 활동하며 메타 AI 개발을 주도했었다. 피노는 메타의 거대언어모델(LLM) 라마(Llama)의 오픈소스 전략을 대표해온 인물이었다. 이에 피노의 퇴사는 메타 AI 전략 전환이 본격화 되는 시점으로 평가받고 있다. 실제로 피노가 5월 말로 퇴사한 이후 메타는 알렉산더 왕을 영입하기 위해 스케일AI에 148억 달러