찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • GB300
    2026-07-05
    검색기록 지우기
  • ICE
    2026-07-05
    검색기록 지우기
  • LEE
    2026-07-05
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
11
  • 중국 엔비디아칩 수입 안한 이유가…대만, 칩 밀수 첫구속

    중국 엔비디아칩 수입 안한 이유가…대만, 칩 밀수 첫구속

    대만이 사상 처음으로 중국에 최신 인공지능(AI) 칩을 빼돌린 기술업체 임원 3명을 구속했다. 대만 언론 타이베이 타임스는 1일 검찰이 엔비디아의 첨단 칩 2199만 달러(약 340억원)어치를 중국, 홍콩, 마카오로 밀반출한 기술업체 임원 3명을 체포했다고 전했다. 대만 지룽 지방법원은 전날 알바트론 테크놀로지의 부사장과 슈퍼마이크로컴퓨터 대만 지사 임원 두 명을 구속 결정했다. 알바트론 테크놀로지는 그래픽카드 등을 제조하던 대만 정보통신(IT) 기술기업이며 슈퍼마이크로컴퓨터는 대만계 미국인이 미국에서 창업한 서버 제조업체다. 대만 검찰은 그동안 엔비디아 첨단 칩 밀수 수사를 위해 기술기업 임직원 6명의 자택과 사무실 등 12곳을 압수 수색했다고 밝혔다. 검찰은 지난 5월 이들 IT 업계 종사자 3명의 자택, 창고, 작업장을 압수수색한 결과, 엔비디아의 고급 GB300 칩이 탑재된 인공지능(AI) 서버 50대와 현금 900만 대만달러(약 4억 3800만원)를 발견했다. 체포된 이들은 위조 서류를 꾸며 엔비디아 최신 칩이 탑재된 서버를 일본으로 반출한 뒤 홍콩으로 옮겼다가 다시 중국으로 보낸 것으로 파악된다. 그동안 대만 법률은 첨단 AI 칩을 중국으로 재수출하는 것을 범죄로 명시하지 않아 이번처럼 칩 밀반출을 ‘밀수’로 규정해 대대적으로 압수수색을 하거나 체포한 사례는 처음이다. 미국 법무부는 이미 지난 3월 슈퍼 마이크로 공동 창업자를 포함한 이 회사 직원 3명을 25억 달러가 넘는 엔비디아의 최첨단 AI 기술을 중국으로 빼돌리려 한 혐의로 기소했다. 미국은 최첨단 인공지능 칩을 군사적으로 이용할 수 있다는 우려 때문에 중국으로의 수출을 제한하고 있다. 미국 외교협회의 중국 전문가인 크리스 맥과이어는 “칩 밀수가 대만과 동남아시아에서 정말 심각한 문제”라며 “동맹국들이 미국과 보조를 맞추는 것이 정말 중요하다”고 지적했다. 이번 수사는 미국의 강력한 압박과 국제적 공급망 감시 강화에 따라 대만 당국이 기존의 ‘수출 통제 준수 권고’ 수준에서 벗어나 칩 밀반출에 대한 형사 처벌 의지를 보인 첫 사례다. 대만 정부는 이번 사건을 계기로 향후 대중국 반도체 수출을 범죄로 규정하는 법안 개정을 검토하고 있다. 중국 정부는 반도체 자립을 지상 목표로 삼고 지난 5월 도널드 트럼프 미국 대통령의 중국 방문 당시 엔비디아 H200 칩의 수출 규제 해제에도 자국산 칩 사용을 권장했다. 밀수 대상이었던 엔비디아의 GB300은 최신 ‘블랙웰 울트라’ 아키텍처를 탑재한 차세대 AI 학습용으로 초대형 언어모델 훈련에 최적화된 최고 성능 제품이다. 반면 중국이 사실상 수입을 거부한 엔비디아의 H200은 중국 전용으로 성능을 낮춘 칩은 아니지만, GB300과 비교하면 연산 성능과 메모리 대역폭에서 크게 뒤처진다.
  • 스페이스X, ‘AI 인프라 임대업’으로 돌파구?…그록 AI에 커지는 의문 [고든 정의 TECH+]

    스페이스X, ‘AI 인프라 임대업’으로 돌파구?…그록 AI에 커지는 의문 [고든 정의 TECH+]

    최근 상장한 스페이스X가 합병한 xAI가 수백억 달러를 들여 구축한 막대한 컴퓨팅 자원을 외부에 대규모로 임대하며 수익성 확보에 나섰습니다. 최근 스페이스X는 펜타곤과 연계된 AI 기업 ‘리플렉션’(Reflection)과 63억 달러 규모의 컴퓨팅 계약을 체결했다고 밝혔습니다. 계약 내용은 다음 달부터 2029년까지 리플렉션에 엔비디아 GB300 GPU 접근권을 제공하며, 매달 1억 5000만 달러, 약 3년 반 동안 총 63억 달러의 사용료를 받는 것입니다. 이번 계약은 스페이스X의 재정 구조 측면에서는 호재이지만, 반대로 그록 AI의 미래에 대한 의구심은 커지고 있습니다. 이미 스페이스X는 콜로서스 1 데이터 센터를 앤스로픽에 월 12억 5000만 달러 규모로 대여하고 있으며, 콜로서스 2 데이터 센터 역시 구글과 월 9억 2000만 달러 규모의 클라우드 서비스 계약을 체결한 상태입니다. 앞서 언급한 리플렉션 계약까지 이들 세 곳의 임대 수익을 모두 합산하면 매달 약 23억 2000만 달러에 달합니다. 천문학적인 전력 유지비를 고려하더라도, 데이터 센터 구축에 투입된 막대한 비용을 몇 년 이내로 회수할 수 있는 괜찮은 계약입니다. 그럼에도 시장의 의구심이 커진 데는 그럴만한 이유가 있습니다. 이러한 ‘인프라 임대업’이 가능하다는 이야기는 자사 인공지능(AI) 모델인 ‘그록’이 본래 예상했던 만큼 수요가 없다는 반증이기 때문입니다. 상식적으로 자체 AI 모델의 수요가 폭발적이라면 데이터 센터의 연산 자원은 내부 학습과 서비스를 위해 완전히 가동되어야 합니다. 반면 자체 데이터 센터만으로는 부족해서 xAI의 콜로서스 데이터 센터를 임대한 구글은 상황이 반대라는 것을 알 수 있습니다. 제미나이 같은 AI 서비스가 당장 수익으로 연결되느냐는 차지하고서라도 이런 막대한 비용을 감당해서라도 데이터 센터를 추가 임대할 정도로 AI 수요는 넘치고 있다는 증거이기 때문입니다. 따라서 사실 AI 자체의 성장성은 구글이 훨씬 높다고 평가할 수 있습니다. 실제로 스페이스X가 상장 과정에서 밝힌 지표를 보면 현시점에서 그록의 상태는 그렇게 좋지만은 않아 보입니다. 그록의 월간 활성 사용자(MAU)는 약 1억 1700만 명에 달한다고 했지만, 실제 유료 사용자는 190만 명에 불과합니다. 소셜미디어(SNS)인 X의 프리미엄 구독자를 모두 포함해도 유료 고객 수는 630만 명 수준에 그치는데, 이는 두 콜로서스 데이터 센터 구축에 투입된 수백억 달러의 천문학적인 비용을 회수하기엔 턱없이 부족한 수준입니다. 따라서 비싼 돈 들여 건설한 데이터 센터를 놀리느니 경쟁사인 앤스로픽이나 구글에 대여하기로 결정한 것으로 보입니다. 다만 여기서 궁금해지는 대목은 구글이나 앤스로픽과 같은 경쟁 기업들이 막대한 비용을 내고 xAI의 데이터 센터를 임대하는 이유입니다. 여기에는 몇 가지 이유가 있습니다. 현재 GPU, 메모리, CPU, SSD는 물론 모든 인프라 관련 비용이 폭발적으로 늘어난 상태에서 자체 데이터 센터를 확장할 경우 비용이 크게 치솟을 수밖에 없습니다. 따라서 이미 있는 데이터 센터를 임대하는 것이 비용 면에서 오히려 저렴할 수 있습니다. 물론 데이터 센터를 추가로 새로 짓는 데 걸리는 긴 시간 역시 이유입니다. 그리고 그록 AI처럼 막대한 투자를 했는데, 막상 새로 데이터 센터를 짓고 난 뒤에는 실제 수요가 그에 미치지 못하는 경우도 생각하지 않을 수 없습니다. 직접 인프라를 구축했다가 기대한 만큼 수요가 없어 xAI처럼 데이터 센터를 놀리는 리스크를 감수하기보다, 계약 취소 옵션이 포함된 임대 방식을 통해 유연하게 대응하는 것이 더 안전한 대안일 수 있습니다. 현재 스페이스X는 xAI의 부채를 갚기 위해 200억 이상 달러 규모의 회사채를 발행하고 있습니다. 대규모 AI 데이터 센터 임대 계약 덕분에 그록 AI의 수익화와는 관련 없이 이 부채를 감당할 순 있을 것으로 보이지만, 그록의 성장성을 증명하지 못한다면 스페이스X의 엄청난 시가총액을 정당화하긴 쉽지 않습니다. 스페이스X가 자회사로 편입한 xAI의 가치가 매출보다 훨씬 높게 매겨진 것은 임대 사업이 아니라 앞으로 AI의 성장 가능성을 내다본 것이기 때문입니다. 일론 머스크의 xAI가 데이터 센터 임대업이 아니라 본업인 AI로 성장할 수 있을지는 올해 공개할 그록 5에 달려 있습니다. 본래 올해 1분기 공개를 목표로 했던 그록 5는 현시점까지 공개가 밀린 상태로 아마도 공개가 임박한 상황으로 보입니다. 경쟁자들이 이미 성능을 대폭 업그레이드한 상황에서 그록 5의 모습이 어떨지 궁금합니다.
  • 최태원 “2030년까지 칩 부족… 국내 생산 시설로 신속 대응”

    최태원 “2030년까지 칩 부족… 국내 생산 시설로 신속 대응”

    최 회장 “가격 안정화 계획 곧 발표”SK하이닉스, 미국 ADR 상장 검토젠슨 황 “여러분들 완벽하다” 극찬 최태원 SK그룹 회장이 인공지능(AI) 혁명에 따른 메모리 반도체 공급 부족 현상이 2030년까지 이어질 것이라는 분석을 내놨다. 최 회장은 시장의 수급 불균형에 대응하기 위해 국내 생산 기지를 활용한 신속 대응 체제를 강조하는 한편, 기업 가치 재평가를 위한 미국 주식예탁증서(ADR) 상장 검토 사실을 공식화했다. 최 회장은 16일(현지시간) 미국 새너제이에서 열린 엔비디아의 연례 개발자 콘퍼런스(GTC 2026)에 곽노정 SK하이닉스 사장 등 핵심 경영진과 함께 참석했다. 최 회장이 GTC를 직접 찾은 것은 이번이 처음이다. 젠슨 황 엔비디아 최고경영자(CEO)의 기조연설 직후 취재진과 만난 최 회장은 “웨이퍼 확보에만 최소 4, 5년이 걸리는 만큼 2030년까지 업계 전반의 (메모리) 공급 부족이 20% 이상 지속될 가능성이 높다”고 진단했다. 특히 특정 제품군에만 수요가 쏠리는 현상을 경계하며 “HBM에 너무 집중하면 일반 D램 부족으로 스마트폰 등 기존 산업이 타격을 입는다”며 균형 있는 생태계 조성을 위한 가격 안정화 계획을 조만간 발표할 것이라고 덧붙였다. 최 회장은 해외 공장 설립에 대해 “전력·용수·건설 여건·엔지니어링 인력이 갖춰져야 한다”며 한국 생산 시설에 집중하겠다는 뜻을 밝혔다. SK하이닉스의 미국 ADR 상장 가능성에 대해선 “글로벌 주주들에게 노출을 확대해 더 글로벌한 회사가 되기 위한 검토를 진행 중”이라고 밝혔다. 최 회장은 이날 오후 SK하이닉스 부스를 직접 찾은 황 CEO와 재회했다. 지난달 비공식 ‘치맥 회동’ 이후 한 달여 만에 다시 마주한 두 사람은 부스 내 전시된 차세대 메모리 솔루션들을 차례로 살폈다. 황 CEO는 차세대 HBM4와 서버용 D램 모듈인 SOCAMM2가 실제 GPU 모듈에 장착된 전시용 모형을 유심히 살폈으며, 최신 ‘그레이스 블랙웰(GB300)’ 기반 시스템 실물을 통해 양사의 기술 결합력을 확인했다. 현장에서 황 CEO는 “여러분들은 완벽하다(You guys are perfect)”는 극찬을 건네기도 했다. 그러면서 양사의 핵심 협력 제품인 ‘베라 루빈 200’ 패키지 위에 “JENSEN♡SK HYNIX”라는 친필 사인을 남기며 파트너십을 재확인했다. 최 회장 역시 전시장 이동 중 황 CEO의 딸인 매디슨 황 엔비디아 총괄과 인사를 나누며 각별한 유대를 보여줬다. 다만 시장의 경쟁 구도는 한층 치열해지는 양상이다. 황 CEO가 SK하이닉스뿐만 아니라 삼성전자와 마이크론 부스를 잇달아 방문한 것은 엔비디아가 특정 업체에 대한 의존도를 낮추는 ‘공급망 다변화’ 전략을 본격화했음을 시사한다. 실제로 마이크론은 이날 베라 루빈용 HBM4 12단 제품의 양산 출하를 공식화했고, 삼성전자는 차세대 ‘HBM4E’ 실물 칩을 전격 공개하며 추격에 박차를 가했다.
  • 美, 중동에 반도체 수출 승인…GPU 26만 장 한국 공급, 불확실성도 해소

    美, 중동에 반도체 수출 승인…GPU 26만 장 한국 공급, 불확실성도 해소

    엔비디아가 한국 기업에 공급하기로 한 그래픽처리장치(GPU) 26만 장에 대한 불확실성이 높아지던 상황에서, 미국이 엔비디아 최신 AI 반도체의 대중동 수출을 허가했다. 이로써 한국 공급도 무난히 이뤄질 것으로 보인다. 19일(현지시간) 미국 상무부는 아랍에미리트에 있는 G42와 사우디아라비아에 있는 휴메인(Humain)에 미국산 첨단 반도체 수출을 인가했다. 두 AI 기업은 엔비디아의 GB300 칩 최대 3만 5000개 또는 동등한 연산력의 반도체를 구매하는 것을 허가받았다. GB300은 엔비디아 블랙웰 시리즈에 속하는 B300 칩을 사용한다. 현재 시장에서 가장 강력한 AI 프로세서 중 하나로 평가된다. 앞서 전임 바이든 미 행정부는 미국산 AI 반도체가 제3국을 통해 중국 등 우려 국가로 유출될 가능성을 줄이기 위해 UAE를 비롯한 대다수 국가가 구매할 수 있는 미국산 AI 반도체에 상한을 설정했다. 그러나 도널드 트럼프 미국 대통령은 지난 5월 전임 행정부의 규제를 뒤집고 UAE에 첨단 AI 반도체를 수출하겠다고 약속했다. UAE로부터 AI 관련 대규모 투자를 받는 대가였다. 이후 관련 논의가 다소 지연됐으나 최근 트럼프 대통령이 워싱턴DC에서 무함마드 빈 살만 사우디아라비아 왕세자와 만나면서, 미국 정부가 최종적으로 AI 반도체 수출을 허가했다. 미국이 사우디 등 중동에 수출 승인한 배경미 백악관은 전날 팩트시트에서 “외국의 영향력으로부터 미국 기술을 보호하면서 세계 최고 수준의 미국 시스템에 대한 접근을 사우디에 제공한다”고 명시했다. 미국은 AI 칩이 중국과 중국 기술 기업 화웨이에 이익이 되지 않도록 보장하기 위한 안전장치 및 사이버 보안 조건이 이번 합의에 포함된 것으로 전해졌다. 수출 통제를 감독하는 미 상무부는 이번 허가의 조건으로 두 기업이 엄격한 보안 및 보고 요건을 준수하기로 했으며 상무부 산하 산업안보국(BIS)이 준수 여부를 감시할 것이라고 밝혔다. 전문가들은 미국의 이번 승인이 국가 안보 측면에서 매우 중대한 의미를 지닌다고 입을 모은다. 사우디와 UAE 모두 중국과 긴밀한 협력관계를 유지하고 있는 상황에서, 미국의 이번 수출 이후 중국 기업 등이 보안 프로토콜을 우회해 컴퓨팅 파워에 접근할 방법을 찾을 수 있다는 일각의 우려가 역력하기 때문이다. 실제로 지난달 마코 루비오 국무장관, 제이미슨 그리어 미국 무역대표부(USTR) 대표를 포함한 행정부 고위 관계자들은 트럼프 대통령에게 중국 수출용인 저사양 블랙웰 칩 판매 승인조차 위험하다고 설득한 것으로 전해진다. 그런데도 이번 수출 승인이 떨어진 것은 젠슨 황 엔비디아 최고경영자(CEO)의 승리라는 평가가 나온다. 월스트리트저널에 따르면 황 CEO는 수개월간 칩 수출을 통해 미국이 AI 분야에서 선두를 유지할 수 있다고 주장해 왔고, 이는 중동 수출을 고민하던 트럼프 대통령의 마음을 움직였다. 한국에 대한 AI 반도체 수출, 불확실성 거의 해소미국 정부가 엔비디아 최신 AI 반도체의 대중동 수출을 허가함에 따라 황 CEO가 최근 방한 때 최신 AI반도체를 한국에 판매하겠다고 한 약속의 불확실성이 줄어들 것으로 기대된다. 황 CEO는 지난달 말 방한을 계기로 한국 정부와 삼성전자, SK그룹, 현대차그룹, 네이버 클라우드 등 한국 기업에 총 26만 장의 그래픽처리장치(GPU)를 공급하기로 했다. 그러나 트럼프 대통령이 지난 2일 방영된 CBS 시사 프로그램 인터뷰에서 엔비디아의 첨단 AI 반도체 블랙웰을 중국 등 다른 나라에 공급할지를 묻는 질문에 “막 나온 새 블랙웰은 다른 모든 반도체보다 10년 앞서 있다”며 “다른 사람들(국가)에게 그것을 주지 않을 것”이라고 말해 한국의 블랙웰 구매에 변수가 생기는 것 아니냐는 우려를 낳았다. 미국 정부가 중동 수출을 허가한 상황 등을 미루어 보면, 트럼프 대통령의 당시 발언은 한국이 아닌 중국을 주로 염두에 둔 발언으로 해석된다. 한편 엔비디아는 한국에 공급하는 GPU 26만 장이 고성능 AI 프로세서로 평가되는 최신 버전인 GB200 그레이스 블랙웰이 다수가 될 것이라고 밝혔다.
  • GPU 26만 장 한국 공급, 이래도 불확실해?…美, 중동에 반도체 수출 승인한 배경 [핫이슈]

    GPU 26만 장 한국 공급, 이래도 불확실해?…美, 중동에 반도체 수출 승인한 배경 [핫이슈]

    엔비디아가 한국 기업에 공급하기로 한 그래픽처리장치(GPU) 26만 장에 대한 불확실성이 높아지던 상황에서, 미국이 엔비디아 최신 AI 반도체의 대중동 수출을 허가했다. 이로써 한국 공급도 무난히 이뤄질 것으로 보인다. 19일(현지시간) 미국 상무부는 아랍에미리트에 있는 G42와 사우디아라비아에 있는 휴메인(Humain)에 미국산 첨단 반도체 수출을 인가했다. 두 AI 기업은 엔비디아의 GB300 칩 최대 3만 5000개 또는 동등한 연산력의 반도체를 구매하는 것을 허가받았다. GB300은 엔비디아 블랙웰 시리즈에 속하는 B300 칩을 사용한다. 현재 시장에서 가장 강력한 AI 프로세서 중 하나로 평가된다. 앞서 전임 바이든 미 행정부는 미국산 AI 반도체가 제3국을 통해 중국 등 우려 국가로 유출될 가능성을 줄이기 위해 UAE를 비롯한 대다수 국가가 구매할 수 있는 미국산 AI 반도체에 상한을 설정했다. 그러나 도널드 트럼프 미국 대통령은 지난 5월 전임 행정부의 규제를 뒤집고 UAE에 첨단 AI 반도체를 수출하겠다고 약속했다. UAE로부터 AI 관련 대규모 투자를 받는 대가였다. 이후 관련 논의가 다소 지연됐으나 최근 트럼프 대통령이 워싱턴DC에서 무함마드 빈 살만 사우디아라비아 왕세자와 만나면서, 미국 정부가 최종적으로 AI 반도체 수출을 허가했다. 미국이 사우디 등 중동에 수출 승인한 배경미 백악관은 전날 팩트시트에서 “외국의 영향력으로부터 미국 기술을 보호하면서 세계 최고 수준의 미국 시스템에 대한 접근을 사우디에 제공한다”고 명시했다. 미국은 AI 칩이 중국과 중국 기술 기업 화웨이에 이익이 되지 않도록 보장하기 위한 안전장치 및 사이버 보안 조건이 이번 합의에 포함된 것으로 전해졌다. 수출 통제를 감독하는 미 상무부는 이번 허가의 조건으로 두 기업이 엄격한 보안 및 보고 요건을 준수하기로 했으며 상무부 산하 산업안보국(BIS)이 준수 여부를 감시할 것이라고 밝혔다. 전문가들은 미국의 이번 승인이 국가 안보 측면에서 매우 중대한 의미를 지닌다고 입을 모은다. 사우디와 UAE 모두 중국과 긴밀한 협력관계를 유지하고 있는 상황에서, 미국의 이번 수출 이후 중국 기업 등이 보안 프로토콜을 우회해 컴퓨팅 파워에 접근할 방법을 찾을 수 있다는 일각의 우려가 역력하기 때문이다. 실제로 지난달 마코 루비오 국무장관, 제이미슨 그리어 미국 무역대표부(USTR) 대표를 포함한 행정부 고위 관계자들은 트럼프 대통령에게 중국 수출용인 저사양 블랙웰 칩 판매 승인조차 위험하다고 설득한 것으로 전해진다. 그런데도 이번 수출 승인이 떨어진 것은 젠슨 황 엔비디아 최고경영자(CEO)의 승리라는 평가가 나온다. 월스트리트저널에 따르면 황 CEO는 수개월간 칩 수출을 통해 미국이 AI 분야에서 선두를 유지할 수 있다고 주장해 왔고, 이는 중동 수출을 고민하던 트럼프 대통령의 마음을 움직였다. 한국에 대한 AI 반도체 수출, 불확실성 거의 해소미국 정부가 엔비디아 최신 AI 반도체의 대중동 수출을 허가함에 따라 황 CEO가 최근 방한 때 최신 AI반도체를 한국에 판매하겠다고 한 약속의 불확실성이 줄어들 것으로 기대된다. 황 CEO는 지난달 말 방한을 계기로 한국 정부와 삼성전자, SK그룹, 현대차그룹, 네이버 클라우드 등 한국 기업에 총 26만 장의 그래픽처리장치(GPU)를 공급하기로 했다. 그러나 트럼프 대통령이 지난 2일 방영된 CBS 시사 프로그램 인터뷰에서 엔비디아의 첨단 AI 반도체 블랙웰을 중국 등 다른 나라에 공급할지를 묻는 질문에 “막 나온 새 블랙웰은 다른 모든 반도체보다 10년 앞서 있다”며 “다른 사람들(국가)에게 그것을 주지 않을 것”이라고 말해 한국의 블랙웰 구매에 변수가 생기는 것 아니냐는 우려를 낳았다. 미국 정부가 중동 수출을 허가한 상황 등을 미루어 보면, 트럼프 대통령의 당시 발언은 한국이 아닌 중국을 주로 염두에 둔 발언으로 해석된다. 한편 엔비디아는 한국에 공급하는 GPU 26만 장이 고성능 AI 프로세서로 평가되는 최신 버전인 GB200 그레이스 블랙웰이 다수가 될 것이라고 밝혔다.
  • HBM 아니어도 괜찮다? LPDDR 메모리 채택 늘리는 AI 칩 제조사들

    HBM 아니어도 괜찮다? LPDDR 메모리 채택 늘리는 AI 칩 제조사들

    현재 인공지능(AI) 투자 붐으로 인해 그래픽처리장치(GPU)뿐만 아니라 여러 관련 제품의 수요가 폭발적으로 증가하고 있습니다. 그 대표적인 제품이 바로 메모리입니다. 특히 차세대 고대역폭 메모리인 HBM(High Bandwidth Memory)의 수요 급증은 국내 메모리 제조사의 실적은 물론 국내 주식시장 전체를 견인하고 있습니다. HBM의 가장 큰 장점은 메모리 대역폭이 매우 넓어 GPU의 AI 연산에 필요한 방대한 데이터를 빠르게 처리할 수 있다는 것입니다. 다만, 가격이 매우 비싸 고성능 데이터센터 GPU에만 주로 사용되고 있습니다. 구체적인 가격은 제조사 간의 계약으로 공개되지 않으나, 12단 HBM4 메모리 같은 차세대 제품은 개당 500~600달러 선이라는 루머가 있을 정도입니다. 이러한 가격적 이유로 게임용 그래픽 카드는 여전히 GDDR7 메모리를 사용하고 있습니다. GDDR7은 HBM보다 대역폭은 낮지만 가격이 상대적으로 저렴하여 일반 소비자에게 적합합니다. 다만 서버 GPU 대비 대역폭뿐만 아니라 메모리 용량도 부족하여 거대한 AI 모델을 구동하기 어렵다는 제한점이 있습니다. 엔비디아가 올해 초 깜짝 공개했던 ‘프로젝트 디짓’은 이러한 약점을 극복하기 위해 등장했습니다. 이 개인용 AI 미니 PC는 연산 능력은 크게 늘리지 않으면서도 메모리 용량을 128GB로 대폭 확장했습니다. 가격을 3000달러 선으로 유지하면서 고용량 메모리를 구현할 수 있었던 비결은 HBM은 물론 GDDR7보다 저렴하고 저전력인 LPDDR5x 메모리를 탑재했기 때문입니다. GB10 칩을 사용한 프로젝트 디짓은 정식 명칭을 DGX 스파크(Spark)로 정하고 공식 출시되었습니다. AI 연산 능력은 FP4 기준 1 PFLOPS로, 블랙웰 B200 GPU의 20 PFLOPS보다 훨씬 느립니다. 그러나 메모리가 넉넉하여 2000억 파라미터를 가진 거대 모델도 구동할 수 있습니다. 반면 게임용 GPU인 RTX 5090은 3.35 PFLOPS로 연산 능력은 더 빠르지만, 메모리가 32GB에 불과하여 큰 모델을 사용하기 어렵습니다. 엔비디아가 LPDDR5x 메모리를 사용한 AI 칩을 선보인 뒤, 최근에는 인텔과 퀄컴도 이 대열에 합류할 것임을 발표했습니다. 다만 엔비디아와는 달리 이들은 서버 AI 제품군에 LPDDR5x 메모리를 적용할 계획입니다. 내년 하반기 출시를 목표로 하는 인텔의 AI 추론 칩인 크레센트 아일랜드(Crescent Island)는 정확한 속도와 대역폭은 밝히지 않았으나, 160GB의 LPDDR5x 메모리를 사용합니다. Xe3P 아키텍처를 적용한 AI 프로세서로, 정확한 연산 능력 역시 아직 베일에 가려 있습니다. HBM이나 GDDR7이 아닌 스마트폰에 주로 사용되는 LPDDR5x를 채택한 만큼, 가격은 저렴할 것으로 보이며, 인텔은 아마도 보급형 틈새시장을 노릴 가능성이 높습니다. 퀄컴은 이보다 더 본격적으로 엔비디아의 아성에 도전하려는 모습입니다. 최근 공개한 퀄컴 AI200 및 AI250은 엔비디아의 GB300 NVL72처럼 수냉식 서버 랙 시스템을 전제로 하고 있기 때문입니다. 퀄컴 AI200/AI250은 구체적인 대역폭은 미공개 상태이지만, 최대 768GB의 LPDDR5x 메모리를 사용한다고 밝혔습니다. AI 가속기는 퀄컴의 헥사곤 NPU 기반입니다. AI200/AI250 제품군의 메모리 대역폭이나 연산 능력 모두 미공개 상태이지만, 퀄컴은 LPDDR5x 메모리 기술에 상당한 노하우를 보유하고 있습니다. 예를 들어, 최근 공개한 윈도우 노트북용 프로세서인 스냅드래곤 엘리트 X2 익스트림 프로세서에서 LPDDR5x-9523 16GB 메모리 모듈 3개를 활용하여 192비트 인터페이스로 228GB/s라는 상당한 대역폭을 확보하는 데 성공했습니다. 다만, 아무리 여러 개의 LPDDR5x 메모리를 병렬로 연결해도 HBM 계열처럼 광대한 대역폭을 확보하기는 어렵습니다. 따라서 엔비디아의 GB300 블랙웰 같은 초고성능 AI GPU보다는, 성능은 낮지만 훨씬 저렴하고 전력 소모가 적은 AI 가속기를 여러 개 병렬로 연결하는 전략을 사용할 것으로 보입니다. 참고로 퀄컴 AI200/AI250 랙 시스템 한 개의 전력 소모량은 160kW로 결코 적지 않은 수준입니다. LPDDR5x 메모리는 저렴하고 전력 소모가 적어 개인용 AI PC 같은 틈새시장을 노리는 엔비디아 DGX 스파크에는 최적의 선택입니다. 하지만 이 분야의 후발 주자인 인텔이나 퀄컴이 데이터센터 시장을 노리고 LPDDR5x 메모리를 채택한 배경에는 다른 이유가 있어 보입니다. 가장 큰 이유는 가격과 수급 문제일 가능성이 높습니다. 인텔과 퀄컴은 업계를 주도하는 대기업이지만, AI 가속기 부문에서는 후발주자인 만큼 현시점에서 시장을 주도하는 엔비디아의 AI GPU와 정면 대결하기는 어렵습니다. 따라서 저전력 또는 저렴한 가격으로 승부수를 던지는 것이 가장 합리적인 접근법이 될 수 있습니다. 여기에 HBM 메모리의 경우 수요 폭발로 인해 가격이 비싸고 수급도 쉽지 않은 상황이므로, 무리하게 HBM을 고집할 필요가 없다는 계산이 깔린 것으로 보입니다. 이러한 접근법이 내년에 가시적인 성과를 거둘 수 있을지 그 결과가 주목됩니다.
  • HBM 아니어도 괜찮다? LPDDR 메모리 채택 늘리는 AI 칩 제조사들 [고든 정의 TECH+]

    HBM 아니어도 괜찮다? LPDDR 메모리 채택 늘리는 AI 칩 제조사들 [고든 정의 TECH+]

    현재 인공지능(AI) 투자 붐으로 인해 그래픽처리장치(GPU)뿐만 아니라 여러 관련 제품의 수요가 폭발적으로 증가하고 있습니다. 그 대표적인 제품이 바로 메모리입니다. 특히 차세대 고대역폭 메모리인 HBM(High Bandwidth Memory)의 수요 급증은 국내 메모리 제조사의 실적은 물론 국내 주식시장 전체를 견인하고 있습니다. HBM의 가장 큰 장점은 메모리 대역폭이 매우 넓어 GPU의 AI 연산에 필요한 방대한 데이터를 빠르게 처리할 수 있다는 것입니다. 다만, 가격이 매우 비싸 고성능 데이터센터 GPU에만 주로 사용되고 있습니다. 구체적인 가격은 제조사 간의 계약으로 공개되지 않으나, 12단 HBM4 메모리 같은 차세대 제품은 개당 500~600달러 선이라는 루머가 있을 정도입니다. 이러한 가격적 이유로 게임용 그래픽 카드는 여전히 GDDR7 메모리를 사용하고 있습니다. GDDR7은 HBM보다 대역폭은 낮지만 가격이 상대적으로 저렴하여 일반 소비자에게 적합합니다. 다만 서버 GPU 대비 대역폭뿐만 아니라 메모리 용량도 부족하여 거대한 AI 모델을 구동하기 어렵다는 제한점이 있습니다. 엔비디아가 올해 초 깜짝 공개했던 ‘프로젝트 디짓’은 이러한 약점을 극복하기 위해 등장했습니다. 이 개인용 AI 미니 PC는 연산 능력은 크게 늘리지 않으면서도 메모리 용량을 128GB로 대폭 확장했습니다. 가격을 3000달러 선으로 유지하면서 고용량 메모리를 구현할 수 있었던 비결은 HBM은 물론 GDDR7보다 저렴하고 저전력인 LPDDR5x 메모리를 탑재했기 때문입니다. GB10 칩을 사용한 프로젝트 디짓은 정식 명칭을 DGX 스파크(Spark)로 정하고 공식 출시되었습니다. AI 연산 능력은 FP4 기준 1 PFLOPS로, 블랙웰 B200 GPU의 20 PFLOPS보다 훨씬 느립니다. 그러나 메모리가 넉넉하여 2000억 파라미터를 가진 거대 모델도 구동할 수 있습니다. 반면 게임용 GPU인 RTX 5090은 3.35 PFLOPS로 연산 능력은 더 빠르지만, 메모리가 32GB에 불과하여 큰 모델을 사용하기 어렵습니다. 엔비디아가 LPDDR5x 메모리를 사용한 AI 칩을 선보인 뒤, 최근에는 인텔과 퀄컴도 이 대열에 합류할 것임을 발표했습니다. 다만 엔비디아와는 달리 이들은 서버 AI 제품군에 LPDDR5x 메모리를 적용할 계획입니다. 내년 하반기 출시를 목표로 하는 인텔의 AI 추론 칩인 크레센트 아일랜드(Crescent Island)는 정확한 속도와 대역폭은 밝히지 않았으나, 160GB의 LPDDR5x 메모리를 사용합니다. Xe3P 아키텍처를 적용한 AI 프로세서로, 정확한 연산 능력 역시 아직 베일에 가려 있습니다. HBM이나 GDDR7이 아닌 스마트폰에 주로 사용되는 LPDDR5x를 채택한 만큼, 가격은 저렴할 것으로 보이며, 인텔은 아마도 보급형 틈새시장을 노릴 가능성이 높습니다. 퀄컴은 이보다 더 본격적으로 엔비디아의 아성에 도전하려는 모습입니다. 최근 공개한 퀄컴 AI200 및 AI250은 엔비디아의 GB300 NVL72처럼 수냉식 서버 랙 시스템을 전제로 하고 있기 때문입니다. 퀄컴 AI200/AI250은 구체적인 대역폭은 미공개 상태이지만, 최대 768GB의 LPDDR5x 메모리를 사용한다고 밝혔습니다. AI 가속기는 퀄컴의 헥사곤 NPU 기반입니다. AI200/AI250 제품군의 메모리 대역폭이나 연산 능력 모두 미공개 상태이지만, 퀄컴은 LPDDR5x 메모리 기술에 상당한 노하우를 보유하고 있습니다. 예를 들어, 최근 공개한 윈도우 노트북용 프로세서인 스냅드래곤 엘리트 X2 익스트림 프로세서에서 LPDDR5x-9523 16GB 메모리 모듈 3개를 활용하여 192비트 인터페이스로 228GB/s라는 상당한 대역폭을 확보하는 데 성공했습니다. 다만, 아무리 여러 개의 LPDDR5x 메모리를 병렬로 연결해도 HBM 계열처럼 광대한 대역폭을 확보하기는 어렵습니다. 따라서 엔비디아의 GB300 블랙웰 같은 초고성능 AI GPU보다는, 성능은 낮지만 훨씬 저렴하고 전력 소모가 적은 AI 가속기를 여러 개 병렬로 연결하는 전략을 사용할 것으로 보입니다. 참고로 퀄컴 AI200/AI250 랙 시스템 한 개의 전력 소모량은 160kW로 결코 적지 않은 수준입니다. LPDDR5x 메모리는 저렴하고 전력 소모가 적어 개인용 AI PC 같은 틈새시장을 노리는 엔비디아 DGX 스파크에는 최적의 선택입니다. 하지만 이 분야의 후발 주자인 인텔이나 퀄컴이 데이터센터 시장을 노리고 LPDDR5x 메모리를 채택한 배경에는 다른 이유가 있어 보입니다. 가장 큰 이유는 가격과 수급 문제일 가능성이 높습니다. 인텔과 퀄컴은 업계를 주도하는 대기업이지만, AI 가속기 부문에서는 후발주자인 만큼 현시점에서 시장을 주도하는 엔비디아의 AI GPU와 정면 대결하기는 어렵습니다. 따라서 저전력 또는 저렴한 가격으로 승부수를 던지는 것이 가장 합리적인 접근법이 될 수 있습니다. 여기에 HBM 메모리의 경우 수요 폭발로 인해 가격이 비싸고 수급도 쉽지 않은 상황이므로, 무리하게 HBM을 고집할 필요가 없다는 계산이 깔린 것으로 보입니다. 이러한 접근법이 내년에 가시적인 성과를 거둘 수 있을지 그 결과가 주목됩니다.
  • 엔비디아에 도전장 내민 AMD, MI 350 시리즈 공개

    엔비디아에 도전장 내민 AMD, MI 350 시리즈 공개

    AMD는 10년 전만 해도 회사가 위태로운 상황이었지만, 2017년 출시한 PC용 중앙처리장치(CPU) 라이젠을 통해 기사회생했습니다. 서버용 CPU 에픽을 출시해 시장 점유율을 늘리면서 이제 이 회사는 서버와 소비자 시장 모두에서 큰 성과를 내고 있습니다. 영원히 이길 수 없을 것 같던 ‘골리앗’ 경쟁자 인텔과 상황이 역전된 셈입니다. 하지만 아직도 그래픽처리장치(GPU) 부분에서는 엔비디아의 아성을 넘기 힘든 게 사실입니다. AMD는 라데온 RX 9070 시리즈와 RX 9060 시리즈를 경쟁력 있는 가격에 출시해 좋은 반응을 얻고 있지만, 아직 엔비디아의 GPU보다 절대적인 성능이 낮은 것이 사실입니다. 특히 인공지능(AI) 서버 시장은 엔비디아가 오래전부터 집중해온 탓에 생태계 자체가 엔비디아 위주로 꾸려진 터라 시장에 끼어들기가 만만치 않은 게 현실이기도 합니다. 이런 AMD가 최근 열린 AI 이벤트에서 엔비디아의 독주에 제동을 걸 수 있는 신제품과 플랫폼을 함께 공개했습니다. 우선 AI GPU인 인스팅트 MI350X/IM355X는 2년 전 등장한 MI 300 시리즈 대비 4배의 성능을 지니고 있습니다. 스펙상으로는 엔비디아 블랙웰 B200 GPU와 경쟁할 수 있는 수준입니다. MI350X 시리즈는 TSMC N6 공정으로 만든 I/O 다이 위에 N3P 공정으로 만든 GPU 칩렛 Accelerator Complex Die (XCD)을 올리고 다시 8개의 HBM3E 메모리를 연결하는 3차원 패키징 기술을 사용했습니다. 덕분에 1850억개 트랜지스터를 하나의 GPU에 집적했습니다. MI350X와 MI355X의 차이점은 공랭식이나 수랭식이냐는 것인데, 수랭식인 MI355X가 성능이 좀 더 우수합니다. AMD는 MI350X 시리즈가 일부 AI 작업에서 엔비디아의 B200, GB200 GPU보다 우수하다고 주장합니다. 다만 엔비디아는 자사 B200보다 1.5배 성능을 지닌 B300을 올해 하반기에 출시할 계획입니다. B300/GB300은 MI350X 시리즈보다 기본 성능이 우수합니다. 하지만 더 중요한 차이점은 AI 생태계에서 엔비디아가 중심이 되고 있어 여러 개의 GPU를 묶어 하나의 거대한 AI 클러스터를 구축하는 기술에서도 엔비디아가 크게 앞서 있다는 것입니다. 이를 의식하듯 AMD도 이번 이벤트에서 인스팅트 MI350X/MI355X 및 에픽 CPU와 함께 사용할 수 있는 NIC (network interface card) 시스템인 펜산도 폴라라 (Pensando Pollara) 400GbE NIC를 공개했습니다. 오라클 클라우드는 앞으로 AMD MI355X GPU 131,072개를 사용한 제타 스케일 AI 데이터 센터를 구축할 예정입니다. MI355X의 TDP는 1400W에 달해 처음 하이퍼 스케일 AI 데이터 센터에 도전하는 AMD가 과연 발열을 효과적으로 해소할 수 있을지 궁금해지는 대목이기도 합니다. AMD는 내년에는 Zen 6 아키텍처 기반인 256코어 베니스 (Venice) 에픽 CPU를 출시하고 인스팅트 MI 400 시리즈 GPU도 선보일 계획입니다. 2세대 NIC인 불카노 (Vulcano, 이탈리아 도시 이름)를 같이 출시합니다. MI 400시리즈는 MI 300 시리즈 대비 10배의 성능을 목표로 하고 있습니다. 현재 AI 하드웨어 시장은 엔비디아 천하라고 해도 과언이 아닌 상태입니다. AMD가 CPU 시장에서 그랬듯 AI 하드웨어에서도 누구도 예상하지 못했던 기적 같은 성과를 거둘 수 있을지 주목됩니다.
  • 엔비디아에 도전장 내민 AMD, MI 350 시리즈 공개 [고든 정의 TECH+]

    엔비디아에 도전장 내민 AMD, MI 350 시리즈 공개 [고든 정의 TECH+]

    AMD는 10년 전만 해도 회사가 위태로운 상황이었지만, 2017년 출시한 PC용 중앙처리장치(CPU) 라이젠을 통해 기사회생했습니다. 서버용 CPU 에픽을 출시해 시장 점유율을 늘리면서 이제 이 회사는 서버와 소비자 시장 모두에서 큰 성과를 내고 있습니다. 영원히 이길 수 없을 것 같던 ‘골리앗’ 경쟁자 인텔과 상황이 역전된 셈입니다. 하지만 아직도 그래픽처리장치(GPU) 부분에서는 엔비디아의 아성을 넘기 힘든 게 사실입니다. AMD는 라데온 RX 9070 시리즈와 RX 9060 시리즈를 경쟁력 있는 가격에 출시해 좋은 반응을 얻고 있지만, 아직 엔비디아의 GPU보다 절대적인 성능이 낮은 것이 사실입니다. 특히 인공지능(AI) 서버 시장은 엔비디아가 오래전부터 집중해온 탓에 생태계 자체가 엔비디아 위주로 꾸려진 터라 시장에 끼어들기가 만만치 않은 게 현실이기도 합니다. 이런 AMD가 최근 열린 AI 이벤트에서 엔비디아의 독주에 제동을 걸 수 있는 신제품과 플랫폼을 함께 공개했습니다. 우선 AI GPU인 인스팅트 MI350X/IM355X는 2년 전 등장한 MI 300 시리즈 대비 4배의 성능을 지니고 있습니다. 스펙상으로는 엔비디아 블랙웰 B200 GPU와 경쟁할 수 있는 수준입니다. MI350X 시리즈는 TSMC N6 공정으로 만든 I/O 다이 위에 N3P 공정으로 만든 GPU 칩렛 Accelerator Complex Die (XCD)을 올리고 다시 8개의 HBM3E 메모리를 연결하는 3차원 패키징 기술을 사용했습니다. 덕분에 1850억개 트랜지스터를 하나의 GPU에 집적했습니다. MI350X와 MI355X의 차이점은 공랭식이나 수랭식이냐는 것인데, 수랭식인 MI355X가 성능이 좀 더 우수합니다. AMD는 MI350X 시리즈가 일부 AI 작업에서 엔비디아의 B200, GB200 GPU보다 우수하다고 주장합니다. 다만 엔비디아는 자사 B200보다 1.5배 성능을 지닌 B300을 올해 하반기에 출시할 계획입니다. B300/GB300은 MI350X 시리즈보다 기본 성능이 우수합니다. 하지만 더 중요한 차이점은 AI 생태계에서 엔비디아가 중심이 되고 있어 여러 개의 GPU를 묶어 하나의 거대한 AI 클러스터를 구축하는 기술에서도 엔비디아가 크게 앞서 있다는 것입니다. 이를 의식하듯 AMD도 이번 이벤트에서 인스팅트 MI350X/MI355X 및 에픽 CPU와 함께 사용할 수 있는 NIC (network interface card) 시스템인 펜산도 폴라라 (Pensando Pollara) 400GbE NIC를 공개했습니다. 오라클 클라우드는 앞으로 AMD MI355X GPU 131,072개를 사용한 제타 스케일 AI 데이터 센터를 구축할 예정입니다. MI355X의 TDP는 1400W에 달해 처음 하이퍼 스케일 AI 데이터 센터에 도전하는 AMD가 과연 발열을 효과적으로 해소할 수 있을지 궁금해지는 대목이기도 합니다. AMD는 내년에는 Zen 6 아키텍처 기반인 256코어 베니스 (Venice) 에픽 CPU를 출시하고 인스팅트 MI 400 시리즈 GPU도 선보일 계획입니다. 2세대 NIC인 불카노 (Vulcano, 이탈리아 도시 이름)를 같이 출시합니다. MI 400시리즈는 MI 300 시리즈 대비 10배의 성능을 목표로 하고 있습니다. 현재 AI 하드웨어 시장은 엔비디아 천하라고 해도 과언이 아닌 상태입니다. AMD가 CPU 시장에서 그랬듯 AI 하드웨어에서도 누구도 예상하지 못했던 기적 같은 성과를 거둘 수 있을지 주목됩니다.
  • AI GPU 시장에서 엔비디아에 도전장 내민 AMD…MI 350 시리즈 공개 [고든 정의 TECH+]

    AI GPU 시장에서 엔비디아에 도전장 내민 AMD…MI 350 시리즈 공개 [고든 정의 TECH+]

    AMD는 10년 전만 해도 회사가 위태로운 상황이었지만, 2017년 출시한 라이젠 CPU를 통해 기사회생했습니다. 그리고 서버 부분에도 에픽 CPU를 출시해 점점 시장 점유율을 늘려 이제는 서버와 소비자 CPU 시장 모두에서 큰 성과를 거두고 있습니다. 과거 절대 이길 수 없을 것 같았던 경쟁자 인텔과 상황이 역전된 셈입니다. 하지만 아직 GPU 부분에서는 엔비디아의 아성을 넘기 힘든 게 사실입니다. 최근 엔비디아가 고성능 AI 서버 GPU에 집중하는 사이 AMD는 라데온 RX 9070 시리즈와 RX 9060 시리즈를 경쟁력 있는 가격에 출시해 시장에서 좋은 반응을 얻고 있지만, 아직 절대 성능에서 엔비디아 GPU보다 낮은 게 사실입니다. 특히 AI 서버 시장은 엔비디아가 오래전부터 AI와 서버 시장에 집중한 탓에 생태계 자체가 엔비디아 위주로 구성되어 있어 끼어들기가 만만치 않은 게 현실이기도 합니다. 그러나 AMD는 최근 열린 어드밴싱 AI 이벤트에서 엔비디아의 독주에 제동을 걸 수 있는 신제품과 플랫폼들을 함께 공개했습니다. 우선 가장 중요한 AI GPU인 인스팅트 MI350X/IM355X는 2년 전 등장한 MI 300 시리즈와 비교해서 4배의 성능을 지니고 있어 스펙상으로 보면 엔비디아 블랙웰 B200 GPU와 경쟁할 수 있는 수준입니다. 새로운 MI350X 시리즈는 TSMC의 N6 공정으로 만든 I/O 다이 위에 N3P 공정으로 만든 GPU 칩렛인 Accelerator Complex Die (XCD)을 올리고 다시 8개의 HBM3E 메모리를 연결한 복잡한 3차원 패키징 기술을 사용했습니다. 덕분에 1850억 개의 트랜지스터를 하나의 GPU에 집적했습니다. 8개의 HBM3E 메모리는 총 288GB의 용량과 8TB/s의 대역폭을 제공합니다. MI350X와 MI355X의 차이점은 공랭식이나 수랭식이냐는 것인데, 수랭식인 MI355X가 성능이 좀 더 우수합니다. 기본 연산 능력은 FP 64기준 MI350X와 MI355X가 72TFLOPS와 78.6TFLOPS입니다. AI 연산에 중요한 FP8/FP4 기준으로는 각각 9.2PFLOPS/10.1PFLOPS, 18.45PFLOPS/20.1PFLOPS의 연산 능력을 지니고 있습니다. AMD는 MI350X 시리즈가 일부 AI 작업에서 엔비디아의 B200, GB200 GPU보다 우수하다고 주장하고 있습니다. 다만 엔비디아는 B200보다 1.5배 성능을 지닌 B300을 올해 하반기에 출시할 계획입니다. B300/GB300은 288GB HBM3E 메모리와 FP4 Tensor Dense/Sparse 기준으로 15/30TFLOPS의 성능을 지니고 있어 MI350X 시리즈보다 기본 성능이 우수합니다. 하지만 더 중요한 차이점은 AI 생태계가 엔비디아 위주일 뿐 아니라 여러 개의 GPU를 묶어 하나의 거대한 AI 클러스터를 구축하는 기술에서 엔비디아가 크게 앞서 있다는 것입니다. AMD는 이점을 의식하듯 이번 이벤트에서 인스팅트 MI350X/MI355X 및 에픽 CPU와 함께 사용할 수 있는 NIC (network interface card) 시스템인 펜산도 폴라라 (Pensando Pollara) 400GbE NIC를 공개했습니다. 각각의 인스팅트 MI350X/MI355X GPU는 8개씩 묶어 하나의 플랫폼을 구성한 후 서버 랙에 들어가는데, 이때 수많은 GPU를 연결해 효율적으로 작동하게 만드는 일이 중요합니다. 펜산도 폴라라 AI NIC는 10만 개 이상의 GPU 하이퍼스케일 시스템에도 대응할 수 있습니다. 오라클 클라우드는 앞으로 AMD MI355X GPU 131,072개를 사용한 제타 스케일 AI 데이터 센터를 구축할 예정입니다. MI355X의 TDP는 1400W에 달해 처음 하이퍼 스케일 AI 데이터 센터에 도전하는 AMD가 과연 발열을 효과적으로 해소할 수 있을지 궁금해지는 대목이기도 합니다. AMD는 내년에는 Zen 6 아키텍처 기반인 256코어 베니스 (Venice) 에픽 CPU를 출시하고 인스팅트 MI 400 시리즈 GPU도 선보일 계획입니다. 그리고 2세대 NIC인 불카노 (Vulcano, 이탈리아 도시 이름)를 같이 출시합니다. MI 400시리즈는 MI 300 시리즈 대비 10배의 성능을 목표로 하고 있습니다. 현재 AI 하드웨어 시장은 엔비디아 천하라고 해도 과언이 아닌 상태입니다. AMD가 CPU 시장에서 그랬던 것처럼 AI 하드웨어에서도 누구도 예상하지 못했던 기적 같은 성과를 거둘 수 있을지 주목됩니다.
  • 화웨이 AI칩 수출 막고, 엔비디아 물량 공세… 中 다시 옥죄는 美

    화웨이 AI칩 수출 막고, 엔비디아 물량 공세… 中 다시 옥죄는 美

    미국 도널드 트럼프 행정부가 지난 12일 중국과 관세율 인하를 깜짝 선언해 ‘해빙 분위기’를 연출한 지 하루 만에 인공지능(AI) 반도체에 대한 규제를 강화하며 ‘중국 옥죄기’를 재개했다. 중동 국가들에 엔비디아의 최신 칩을 대거 공급해 중국의 AI 접근도 원천 차단한다. 미 상무부 산업안보국(BIS)은 13일(현지시간) 보도자료를 내 “조 바이든 행정부의 AI 확산 규칙을 철회하고 전 세계 반도체 수출 통제를 강화하기 위한 새 조치를 발표한다”고 밝혔다. BIS는 “앞으로 전 세계 어디서든 화웨이 어센드 AI 칩을 사용하면 미 수출 통제에 위배된다”고 지침을 내렸다. 제프리 케슬러 BIS 국장도 “우리의 첨단 기술이 적성국의 손에 들어가지 않도록 할 것”이라고 강조했다. 화웨이는 미국의 대중국 반도체 수출 통제 이후 자체 칩 생산에 나서 성과를 내고 있다. 올해 하반기부터 AI 칩 ‘어센드 910C’를 대량 생산한다. 어센드 910C는 엔비디아가 2022년 출시한 고성능 AI 칩 ‘H100’과 맞먹는 성능을 가진 것으로 평가받는다. 기존 규제로는 중국의 반도체 기술 발전을 막을 수 없다고 판단한 미국이 다른 나라들에 ‘우리 칩을 쓰지 않으면 제재를 할 수 있다’고 압박 수위를 높이는 모양새다. 대신 미국은 중국에 우호적인 사우디아라비아에 AI 칩 대표주자인 엔비디아의 첨단 칩을 대거 제공하기로 했다. 젠슨 황 엔비디아 최고경영자(CEO)는 이날 사우디아라비아 리야드에서 열린 ‘사우디·미국 투자 포럼’에서 현지 기업 휴메인에 GB300 블랙웰 1만 8000개 이상을 공급한다고 발표했다. 사우디 국부펀드가 운영하는 휴메인은 앞으로 수십만개의 그래픽처리장치(GPU)를 설치할 예정이어서 엔비디아가 추후 공급하는 AI 칩은 더 늘어날 전망이다. 트럼프 행정부는 아랍에미리트(UAE)에도 엔비디아 반도체 칩 판매 제한을 폐지하는 방안을 검토 중이다. 이들 국가에 엔비디아 칩을 충분히 공급해 대체재인 화웨이 칩에 대한 갈증을 느끼지 못하게 하겠다는 의도다.
위로