찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • GPU 메모리
    2026-06-19
    검색기록 지우기
  • 원생
    2026-06-19
    검색기록 지우기
  • K팝
    2026-06-19
    검색기록 지우기
  • 2026-06-19
    검색기록 지우기
  • VI
    2026-06-19
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
299
  • 오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    - 112.5억 원 규모 연구개발 착수… 국산 AI 반도체 생태계 확산 주도- 국산 NPU·PIM 기반 클라우드 SW 스택 개발… GPU 중심 인프라 한계 극복- AI 모델 허브 구축… 최적화 모델 1,000개 이상 확보 목표 AI·클라우드 소프트웨어 전문 기업 오케스트로(대표 김범재, 김영광)는 과학기술정보통신부와 정보통신기획평가원(IITP)이 주관하는 ‘AI 반도체 특화 클라우드 네이티브 SW 스택 및 모델 허브 기술 개발’ 과제의 주관기관으로 선정됐다고 8일 밝혔다. 이번 연구개발 사업의 총규모는 112억 5000만원으로, 2026년부터 2029년까지 4년간 수행될 예정이다. 본 과제는 국산 NPU(신경망처리장치)와 PIM(지능형 메모리) 등 차세대 AI 가속기가 범용 클라우드 환경에서 기능할 수 있도록 클라우드 기반 운영 체계를 구축하는 것이 목적이다. 이를 통해 국산 AI 반도체의 생태계를 확장하고 활용도를 높이는 체계를 마련할 방침이다. 오케스트로는 이번 과제를 수행하며 AI 반도체 전용 클라우드 네이티브 SW 스택의 기술 수준을 높인다. 세부 개발 항목에는 ▲컨테이너 런타임 인터페이스(CRI) 호환 기술 ▲가속기 자원의 직접 접근을 지원하는 패스스루(Pass-through) 기술 ▲마이크로서비스 아키텍처(MSA) 프레임워크 등이 포함된다. 이는 기존 GPU 중심 인프라의 구조적 특성을 보완하고, 국산 NPU 자원을 유연하게 할당·운영할 수 있는 표준 체계를 수립하기 위함이다. 이와 함께 국산 AI 반도체 기반 서비스 확산을 위해 학습·추론 모델을 손쉽게 등록·배포할 수 있는 ‘AI 모델 허브’ 플랫폼도 구축한다. 모델 컨테이너화 자동화 기술과 메타데이터 관리 체계를 기반으로 운영될 예정이며, 과제 종료 시점까지 1000개 이상의 최적화 모델 확보를 목표로 한다. 특히 최근 수요가 빠르게 증가하고 있는 초거대 언어 모델(LLM) 실증 사례를 확보해 상용화 가능성을 검증한다. 국내 중소·벤처기업이 고가의 외산 GPU 의존도를 낮추고, 국산 AI 반도체 기반의 고성능 서비스를 보다 신속하게 개발·출시할 수 있도록 지원할 방침이다. 이번 연구 성과는 정부가 추진 중인 ‘K-클라우드 프로젝트’와 2026년부터 본격화되는 ‘국가 AI 컴퓨팅 인프라’ 구축 사업과 연계돼 실제 데이터센터 운영 환경에 적용될 예정이다. 오케스트로는 커널 레벨의 정밀 모니터링과 분산 추적 기술을 통합해 AI 워크로드 예측 정확도를 글로벌 최고 수준인 99%까지 끌어올리고, 대규모 AI 서비스 운영에 필요한 안정성과 신뢰성을 입증할 계획이다. 김범재 오케스트로 대표는 “이번 과제는 국산 AI 반도체가 글로벌 시장에서 경쟁력을 확보하는 데 필요한 핵심 소프트웨어 기반을 마련한다는 점에서 의미가 크다”며 “하드웨어와 소프트웨어가 유기적으로 결합되는 AI 컴퓨팅 환경을 구현해 국내 AI 인프라 자립도를 높이고, 국산 AI 반도체 생태계 확산에 기여하겠다”고 밝혔다.
  • 김영록 지사, SK그룹에 전남광주특별시 반도체 팹 설립 요청

    김영록 지사, SK그룹에 전남광주특별시 반도체 팹 설립 요청

    전라남도가 SK그룹에 전남광주특별시 반도체 팹 설립을 요청하고 나섰다. 김영록 전남지사가 6일 최태원 SK그룹 회장에게 ‘전남광주통합특별시를 반도체 산업의 새로운 거점으로 삼아달라’는 간절한 염원을 담은 서한문을 보냈다. 서한문은 지난 4월 28일 국회 특별강연에서 최 회장이 언급한 AI 산업 성장의 ‘4대 보틀넥(자본·에너지·GPU·메모리)’과 “전기가 있는 곳에 가야 한다”는 소신 발언에 대해 전남광주특별시가 준비된 최적지임을 강조하는 내용이다. 김 지사는 지난해 10월 최 회장이 이재명 대통령, 샘 올트만 오픈에이아이(OpenAI) CEO와 함께 결정한 ‘글로벌 AI 데이터센터 구축’ 결단에 대해서도 “소외된 지역민에게 미래 첨단산업의 중심이 될 수 있다는 뜨거운 희망을 준 쾌거”라고 감사를 표했다. 이어 “이제는 그 희망을 반도체 산업 유치라는 더 큰 결실로 이어가야 한다”고 역설했다. 그는 또 서한문을 통해 “통합특별시는 전국 재생에너지 발전량의 약 20%를 공급하고 잠재량만 444GW에 달하는 에너지의 보고”라며 “신안·영광·해남의 대규모 해상풍력과 태양광 단지는 반도체 기업의 글로벌 생존 조건인 RE100을 실현할 사실상 국내 유일의 입지”라고 설명했다. 또한 “전남광주특별시는 정부의 ‘남부권 반도체 혁신벨트’ 핵심 거점으로서 ARM스쿨, 광주과학기술원(GIST), 한국에너지공대, 전남대학교 등 특화 대학을 통해 반도체 연구개발(R&D) 우수 인재를 안정적으로 공급할 체계를 갖추고 있다”고 덧붙였다. 특히 파격적인 재정적·제도적 지원이 가능하다는 점도 제시했다. 김 지사는 전남·광주 통합에 따른 지역균형발전 통합지원금 20조 원을 전향적으로 활용할 모든 준비가 돼 있으며, ‘반도체 특별법’에 따른 클러스터 지정도 차질 없이 추진하고 있다고 밝혔다. 그는 “SK그룹의 위대한 결단이 지방소멸 위기를 극복하고 대한민국의 새로운 판을 여는 역사적 쾌거가 될 것”이라며 “전남광주통합특별시는 SK그룹의 비전을 신속하게 실현하는 영원한 동반자가 되겠다”고 강력한 협력 의지를 표명했다.
  • “남의 위기가 나의 기회”…칩플레이션 시대에 오히려 웃는 애플 [고든 정의 TECH+]

    “남의 위기가 나의 기회”…칩플레이션 시대에 오히려 웃는 애플 [고든 정의 TECH+]

    최근 글로벌 IT 시장에는 ‘칩플레이션(chipflation’이라는 거대한 파도가 몰아치고 있습니다. AI 데이터 센터 수요 폭증으로 인해 D램과 낸드 플래시 메모리 가격 폭등이 폭등하면서 노트북, 데스크톱, 스마트폰의 제조 비용 역시 빠르게 상승하고 있습니다. 제조사들은 가격을 올리든지 제품 사양을 낮추든지 둘 중 하나를 선택할 수밖에 없는 상황입니다. 시장 조사 기관들의 전망도 어둡습니다. 시그마 인텔, 가트너, IDC 등 시장 조사 기관들은 이로 인해 올해 PC 시장이 5-10% 정도 역성장 할 것으로 예상했습니다. 그런데 이 기관들이 예외적으로 성장할 것으로 예측한 제조사가 있습니다. 바로 애플입니다. 시장 조사 기관들의 예측에 의하면 올해 애플은 9%에서 많게는 21%까지 판매량을 늘려가면서 점유율을 크게 높일 것으로 예상됩니다. 칩플레이션 시대에 애플이 지닌 비장의 무기는 크게 3가지입니다. 바로 맥 OS의 통합 메모리 구조와 효율적 관리가 메모리 관리가 가능한 생태계, 그리고 가격 인상을 효율적으로 통제할 수 있는 생산 구조입니다. 1. AI 시대에 전화위복이 된 통합 메모리(UMA) 구조 애플의 가장 강력한 무기는 통합 메모리 아키텍처(Unified Memory Architecture, UMA)입니다. 애플은 M 시리즈 애플 실리콘을 맥에 탑재하면서 A 시리즈를 사용하는 iOS처럼 하나의 메모리를 CPU와 GPU가 공유하는 방식을 선택했습니다. 이는 단가를 낮추면서 크기와 전력 소모도 줄일 수 있어 맥북 에어처럼 슬립 노트북이니 맥 미니처럼 미니 PC에 제격인 방식입니다. 물론 인텔과 AMD의 최신 프로세서 역시 내장 GPU와 NPU를 지니고 있으며 독립 GPU가 없으면 메모리를 CPU와 공유합니다. 하지만 이는 애플의 통합 메모리와는 다른 개념입니다. 실제로는 내장 GPU에 얼마나 메모리를 할당할지 결정하면 여기에 맞춰 메모리를 분할해 사용하기 때문에 각자 메모리를 지닌 CPU와 GPU가 OS 상에 존재합니다. 이는 독립 그래픽 카드 역시 호환되어야 하는 윈도우 OS의 숙명상 어쩔 수 없는 대목이기도 합니다. 반면 외장 그래픽 카드를 아예 고려하지 않는 맥 OS는 이런 제약에서 자유롭습니다. 물론 고성능 GPU를 사용할 수 없다 보니 게임 성능에서는 다소 제약이 있었지만, 메모리 가격과 그래픽 카드 가격이 폭등하니까 역설적으로 메모리를 통합해서 효율적으로 관리하는 구조가 상당히 비용 효과적인 방식이 된 것입니다. 이 구조는 특히 컴퓨터에서 거대언어모델(LLM)을 구동할 때 매우 두드러진 장점을 제공합니다. 애플의 실리콘(M 시리즈)은 CPU, GPU가 서로 간에 데이터를 복사해 전송할 필요 없이 바로 전달하는 ‘제로 카피(Zero-copy)’ 방식을 사용해 LLM 구동 시 병목 현상은 줄이고 메모리 통합으로 더 큰 모델을 돌릴 수 있습니다. 예를 들어 32GB 시스템 메모리와 RTX 5080처럼 16GB 비디오 메모리를 지닌 고성능 컴퓨터라도 20GB가 넘는 LLM 모델을 한 번에 GPU에서 돌릴 순 없습니다. 반면 32GB 메모리를 지닌 맥북이나 맥 미니는 메모리를 나누지 않기 때문에 훨씬 쾌적하게 돌릴 수 있습니다. 사실 이런 이유 때문에 오픈 클로 같은 로컬 AI용으로 맥 미니 수요가 급증한 이미 급증한 상태입니다. 2. ‘맞춤 정장’과 ‘기성복’ 애플의 메모리 관리 방식은 마치 체형에 딱 맞춘 ‘맞춤 정장’에 비유할 수 있습니다. 맥OS는 정해진 하드웨어에서 사용자 경험을 최적화하는데 초점을 맞췄는데, 메모리도 예외가 아닙니다. 예를 들어 모바일 iOS와 비슷하게 화면에 보이지 않는 앱의 활동을 최소화해 CPU와 메모리를 차지하는 비율을 줄입니다. 여기에 강력한 메모리 압축(Memory Compression) 기술과 SSD를 활용한 지능형 스왑(Smart Swap) 기능이 더해져, 물리적 RAM 용량이 적더라도 실제 체감 성능은 훨씬 높은 수준을 유지합니다. 반면 윈도우 PC는 다양한 사람에게 맞게 나온 ‘기성복’에 비교할 수 있습니다. 윈도우는 다양한 하드웨어에서 다양한 애플리케이션의 작동을 보장하는 개방형 구조입니다. 이는 사용자에게 큰 자유를 보장하지만, 사실 자유는 공짜가 아니고 대가가 따릅니다. 예를 들어 윈도우나 안드로이드는 다양한 하드웨어를 다루기 위해 하드웨어 추상화 계층(HAL, Hardware Abstraction Layer)을 사용합니다. 쉽게 말해 다양한 하드웨어가 다양한 소프트웨어를 돌리다 보니 서로 말이 달라도 통역해 줄 중간 계층이 필요하다는 이야기입니다. 그리고 수많은 하드웨어를 위한 다양한 드라이버 역시 메모리에 상주해야 합니다. 결국 메모리 사용량이 늘어납니다. 이런 윈도우의 단점은 과거 메모리가 저렴하던 시절에는 아무 문제가 되지 않았습니다. 오히려 소비자에게는 같은 메모리 용량을 지닌 윈도우 노트북이 더 저렴하다는 식으로 홍보할 수 있었습니다. 예를 들어 32GB 맥북은 꽤 비싸지만, 32GB 윈도우 노트북은 훨씬 저렴했습니다. 또 하드웨어 제조사 역시 같은 윈도우 OS에서 스펙으로 경쟁하다 보니 더 많은 램 용량으로 소비자에게 어필하는 경우가 많았습니다. 윈도우의 기본 사상이 넉넉한 램 용량으로 가능한 모든 애플리케이션과 하드웨어를 품자는 것이었고 이는 메모리가 저렴하던 시절에는 소비자도 만족했던 덕목이었습니다. 반면 애플은 iOS나 맥OS나 실사용에서는 부드럽긴 했지만, 램크루지라는 별명을 얻을 정도로 메모리에 인색해 보였습니다. 그런데 램 값이 폭등하면서 이제 상황이 180도 바뀐 것입니다. 3. 공급망의 승리 맥은 사실 PC 시장에서 판매량이 많지 않습니다. 하지만 아이폰, 아이패드 같은 모바일 디바이스 판매량이 엄청나다 보니 메모리 시장에서 큰 손입니다. 그래서 막대한 구매 물량을 무기로 유리한 조건으로 장기 메모리 구입이 가능합니다. 그리고 더 중요한 것은 다른 PC 제조사와 달리 본래 마진율이 상당해서 메모리 가격 인상분을 쉽게 흡수할 수 있다는 것입니다. 애플은 맥에 들어가는 CPU를 인텔에서 자체 개발한 애플 실리콘으로 바꿨는데, 덕분에 비용을 대폭 절감할 수 있었습니다. 사실 인텔 CPU에는 제조 원가뿐 아니라 인텔의 수익도 포함되어 있기 때문에 애플 실리콘보다 더 비쌀 수밖에 없습니다. 여기에 윈도우 PC는 마이크로소프트에 윈도우 OS 사용 비용도 지불해야 합니다. 이런 비용들이 없는 애플의 맥은 당연히 가격 대비 사실은 제조 단가가 저렴할 수밖에 없습니다. 따라서 애플은 메모리 가격이 좀 올라도 얼마든지 감당할 수 있습니다. 오히려 이런 시기에 599달러에 불과한 맥북 네오 같은 물건을 출시해서 시장 점유율을 공격적으로 올릴 수 있게 됐으니 전화위복의 계기가 된 것입니다. 맥북 네오의 8GB 메모리는 윈도우에서는 부족해 보이지만, 앞서 설명한 내용 때문에 맥 OS에서는 상대적으로 덜 부족합니다. 과거 메모리 용량에 인색해서 램크루지라는 별명을 들었던 게 지금 상황에서는 오히려 이득이 되고 있습니다. 다만 애플이라고 해서 메모리 공급난에서 완전히 자유로운 건 아닙니다. 상대적으로 유리한 위치이긴 하나 최근 맥 미니나 맥북 네오 같은 일부 제품이 배송 지연이나 품절된 상황으로 공급이 수요를 따라가지 못하는 상황입니다. 그럼에도 최근 상대적으로 유리한 상황을 이용해서 애플이 과거 본래 명칭이었던 애플 컴퓨터에 걸맞은 수준으로 PC 시장에서 점유율을 계속해서 끌어올릴 수 있을지 주목됩니다
  • SK하이닉스, IEEE 첫 기업혁신상

    SK하이닉스는 국제전기전자공학회(IEEE)가 주최한 IEEE 어워즈에서 올해의 기업혁신상을 수상했다고 26일 밝혔다. IEEE는 인류 발전을 위한 기술 혁신을 추구하는 세계 최고 권위의 기술 전문가 단체다. IEEE 어워즈는 메달, 기술분야상, 공로상 등 3개 부문에서 기술 혁신과 사회 발전을 이룬 수상자를 선정한다. 기업혁신상은 공로상 5개 부문 중 하나로 1986년부터 혁신 기술로 산업과 사회 발전에 기여한 기업에 수여한다. SK하이닉스의 수상은 처음이다. 고대역폭 메모리(HBM) 혁신과 응용을 통해 인공지능(AI) 컴퓨팅 확산을 이끌고 글로벌 인공지능(AI) 시장에 HBM 솔루션을 선제적으로 제시한 공로를 인정받은 결과다. SK하이닉스는 2013년 12월 AMD와의 공동 연구를 통해 세계 최초로 HBM을 개발하고 2015년 양산을 시작했다. SK하이닉스 관계자는 “모든 세대의 HBM을 안정적으로 양산해 글로벌 AI 컴퓨팅 생태계 활성화에 기여한 점을 인정받았다. 글로벌 AI 시장에서 신뢰받는 파트너로 자리매김하겠다”고 말했다. 미국 뉴욕에서 지난 24일(현지시간) 열린 시상식에는 안현 SK하이닉스 개발총괄 사장(CDO)이 대표로 참석했다. 안 사장은 “기술 한계에 끊임없이 도전하고 극복해 온 SK하이닉스 구성원들을 대표해 수상하게 돼 영광”이라고 말했다. 한편, 그래픽처리장치(GPU)를 AI에 적용하면서 새로운 시장을 개척한 젠슨 황 엔비디아 최고경영자(CEO)는 이번 시상식에서 ‘영예의 메달’을 받았다.
  • SK하이닉스 이익률 72%… TSMC·엔비디아 넘었다

    SK하이닉스 이익률 72%… TSMC·엔비디아 넘었다

    SK하이닉스가 영업이익률 약 72%를 기록하며 글로벌 반도체 기업을 웃도는 수익성을 보였다. 계속되는 인공지능(AI) 반도체 수요 급증에 힘입어 매출액 52조원, 영업익 37조원을 넘어 역대 최대 실적 기록 행진도 이어 갔다. SK하이닉스는 메모리 수요가 공급을 웃도는 상황이 당분간 이어질 것으로 보고 올해 투자 규모를 전년 대비 크게 늘리며 실적 호조를 이어 갈 방침이다. SK하이닉스는 분기 영업이익률이 71.5%로 지난해 4분기 58.4%를 넘어 역대 최고 기록을 경신했다고 23일 공시했다. 연결 기준 올해 1분기 영업이익은 37조 6103억원으로 전년 동기 대비 405.5% 증가했고, 앞서 역대 최대 기록이었던 지난해 4분기(19조 1696억원)와 비교해도 영업이익이 2배 수준으로 늘었다. 매출액은 52조 5763억원으로 198.1% 증가했다. 영업익과 매출 모두 분기 기준 최대 기록이다. SK하이닉스는 “1분기는 계절적 비수기임에도 AI 인프라 투자 확대로 수요 강세가 이어진 가운데 고대역폭 메모리(HBM)·고용량 서버용 D램 모듈·기업용 고성능 저장장치(eSSD) 등 고부가가치 제품 판매를 확대하며 실적 상승세를 이어 갔다”고 설명했다. 실적의 핵심은 ‘수익성’이다. 영업이익률 72%는 단순한 업황 반등이 아니라 AI 인프라 중심으로 재편된 메모리 산업 구조 변화의 결과로 보인다. 반도체 파운드리 1위인 TSMC의 1분기 영업이익률(58.1%)을 크게 웃돌았고 AI 핵심 기업인 엔비디아의 2026회계연도 4분기(2026년 1월 종료 기준) 영업이익률인 65.0%도 앞섰다. 또 경쟁사인 미국 마이크론의 2026회계연도 2분기 영업이익률(67.6%)보다 4.4% 포인트, 역대 최대 실적을 낸 삼성전자의 올해 1분기 영업이익률(43.0%)보다 29.0% 포인트 높다. 비수기 넘은 수요 확대AI 인프라 투자 확대로 수요 강세고부가가치 메모리 제품 판매 확대이는 단순 비교를 넘어 의미가 크다. 엔비디아는 그래픽처리장치(GPU) 설계라는 고부가가치 팹리스 기업이고 SK하이닉스는 대규모 설비투자가 필요한 메모리 제조업체다. 그럼에도 동일한 수준의 수익성을 달성했다는 것은 AI 가치사슬에서 ‘메모리’가 핵심 수익원으로 이동했음을 보여 준다. 이런 수익성은 HBM·범용 D램·eSSD 수요 급증이 동시에 맞물린 ‘삼박자’ 효과에서 비롯됐다. 우선 HBM은 AI 연산의 필수 부품으로 자리잡으며 가장 높은 수익성을 창출했다. 회사는 이날 콘퍼런스콜에서 “(4세대인) HBM2E부터 원가와 수율, 성능 등 종합적 제품 경쟁력과 고객 신뢰도 측면에서 최고 수준을 유지하고 있다”며 향후 3년간 고객 요청 수요가 SK하이닉스의 생산능력을 훨씬 상회할 것으로 내다봤다. 이어 6세대 HBM인 HBM4도 고객 요구 성능에 맞춰 생산 확대를 준비 중이며, 7세대 HBM4E는 내년 본격 양산을 목표로 하고 있다. 차세대 제품 연속 출시HBM 성능 향상·HBM4 생산 확대6세대 D램·321단 cSSD 공급 탄력HBM의 생산량 확대는 범용 D램 시장에도 파급효과를 미쳤다. HBM 생산은 범용 D램 대비 더 많은 웨이퍼를 소모하는 구조이기 때문에 최신 세대 D램인 DDR5 등 범용 제품 공급이 줄어들었고, 그 결과 가격이 급등했다. 실제 1분기 범용 D램 계약가는 90% 이상 상승하며 공급자 우위 시장이 형성됐다. 향후 회사는 10나노급 6세대(1c) 공정을 적용한 저전력 D램 LPDDR6와 192GB(기가바이트) 소캠(SOCAMM)2 양산을 통해 고성능 D램 공급을 확대할 계획이다. 낸드 부문에서도 변화가 나타났다. 회사는 “AI 모델이 고도화될수록 중간 데이터 처리량이 폭발적으로 증가하고 있다”며 “고성능·고용량 eSSD 채택이 빠르게 확대되고 있다”고 설명했다. 이어 “(이러한 수요에 대응하기 위해) 세계 최초로 321단 쿼드레벨셀(QLC) 낸드를 개발했고 고객 인증을 통해 기술 초격차를 확보했다”고 덧붙였다. 회사는 321단 개인용 고성능 저장장치(cSSD) ‘PQC21’ 공급을 시작했으며 eSSD도 전 영역으로 라인업을 확장하고 있다. 또한 올해 말까지 국내 낸드 생산량의 절반 이상을 321단 제품으로 전환할 계획이다. 앞으로도 메모리에 대한 강한 수요가 지속될 것으로 보인다. 회사는 “이번 메모리 가격 상승은 과거와 다른 구조적 변화”라며 “고객들이 가격보다 물량 확보를 우선시하는 상황이 지속되고 있다”고 밝혔다. 이어 “유의미한 생산능력 확대까지 좀더 시간이 걸리고 우호적 가격 환경이 당분간 유지될 것”이라며 장기공급계약(LTA)과 관련해 고민을 드러냈다. 이는 단기 호황이 아닌 중장기 공급 부족 국면 진입을 시사한다. 미래 전망도 청신호수요 구조적 변화… 장기계약 유리“재무 건전성 위해 100조 확보 목표”수익성 개선은 재무구조에도 반영됐다. 올해 1분기 말 현금성 자산은 54조 3000억원으로, 이는 지난해 말(34조 9000억원) 대비 19조 4000억원 늘어난 수치다. 반면 차입금 규모는 줄었다. 같은 기간 차입금은 2조 9000억원 감소한 19조 3000억원을 기록했다. 이에 따라 35조원의 ‘순현금’을 달성하며 재무 건전성이 한층 강화됐다. SK하이닉스는 이를 바탕으로 용인 반도체 클러스터, 청주 M15X 공장 증설, 극자외선(EUV) 노광장비 확보 등 대규모 투자를 확대할 계획이다. 아울러 글로벌 투자 자금 유치와 순현금 확보를 위해 미국 증권거래위원회(SEC)에 미국 주식예탁증서(ADR) 상장을 위한 신청서를 제출했으며, 올해 하반기 상장을 목표로 절차를 진행 중이다. 곽노정 SK하이닉스 대표이사 사장은 지난달 주주총회에서 “구조적 수요 성장에 대응하고 경쟁력을 유지하기 위해서는 안정적으로 투자할 수 있는 재무 건전성이 필수적”이라며 100조원 이상의 순현금 확보를 목표로 제시했다.
  • 진짜 상태는 엔비디아 아니다? 구글 8세대 TPU에 엿보인 구글의 AI 전략 [고든 정의 TECH+]

    진짜 상태는 엔비디아 아니다? 구글 8세대 TPU에 엿보인 구글의 AI 전략 [고든 정의 TECH+]

    구글이 지난해 8월 7세대 TPU인 아이언우드를 발표한 지 1년도 채 되지 않아 8세대 TPU를 공개하며 AI 가속기 시장에서 속도전을 벌이는 모습입니다. 이렇게 빠르게 차세대 칩을 내놓았다는 것은 7세대 공개 시점에서 이미 8세대를 개발 중이었다는 이야기입니다. 이는 두 개의 팀을 따로 만들어 비용을 더 투자하더라도 개발 경쟁에서 경쟁자를 앞서겠다는 강한 의지 없이는 불가능한 일입니다. 이번 8세대 TPU의 가장 큰 특징은 사상 처음으로 학습과 추론 전용 칩을 분리해 각각 TPU 8t와 TPU 8i로 이원화했다는 점입니다. 특히 이번 세대는 단순한 칩의 성능 향상을 넘어, 스스로 판단하고 행동하는 ‘에이전틱 AI(Agentic AI)’ 시대를 뒷받침하기 위한 ‘AI 하이퍼컴퓨터’ 아키텍처의 핵심 엔진으로 설계됐습니다. 학습 전용인 TPU 8t는 216GB의 HBM 메모리를 탑재하고 단일 슈퍼포드당 최대 9600개의 칩을 3D 토러스(Torus) 토폴로지로 연결해 압도적인 확장성을 자랑합니다. 이를 통해 최첨단 모델의 배포 기간을 수개월에서 수주 단위로 단축할 수 있으며, 포드당 총 121 ExaFlops의 FP4 연산 능력을 제공합니다. 추론 특화 칩인 TPU 8i는 에이전틱 AI의 핵심인 ‘추론(Reasoning)’ 성능을 극대화하기 위해 설계됐습니다. 288GB의 HBM과 더불어 이전 세대보다 3배 늘어난 384MB의 온 칩 (on chip) SRAM을 탑재했습니다. 이는 최근 엔비디아가 공개한 추론 가속기인 그록(Groq) LPU의 SRAM 전략과 유사한 것으로 평가됩니다. 결론적으로 세대별 성능 향상 측면에서 TPU8t 트레이닝 칩은 대규모 학습에서 전 세대 대비 2.7배 향상된 가격 대비 성능을 제공하며, TPU8i 역시 추론 환경에서 전 세대 대비 80% 향상된 가격 대비 성능을 제공합니다. 또 두 칩 모두 와트당 성능이 두 배 향상됐는데, 이는 전력 비용을 줄여 전체적인 AI 총소유비용(TCO)를 크게 줄일 수 있습니다. 이와 같은 비용 절감은 앞으로 AI 서비스의 수익화에 매우 중요한 요소입니다. 다만 기본적으로 엔비디아의 베라 루빈 플랫폼은 여전히 8세대 TPU보다 강력한 성능을 지니고 있습니다. 단일 칩 기준으로만 보면 루빈 GPU는 50 PFLOPS에 달하는 연산 능력을 지녀 8세대 TPU보다 몇 배 빠른 성능을 지니고 있습니다. 문제는 비싼 가격입니다. 엔비디아 플랫폼이 비싼 이유는 칩 자체의 생산 비용도 있지만, 높은 이윤을 남기면서 팔고 있는 것도 중요한 이유입니다. 그런데 여기서 구글이 자체 칩을 만들어 마진을 흡수하면 오픈 AI나 앤스로픽 같은 경쟁자보다 비용을 대폭 절감할 수 있습니다. 최근 칩플레이션과 에너지 비용 급상승으로 AI 서비스 비용은 비싸지고 수익화는 이를 따라가지 못하는 상황에서 구글이 누리는 비용 절감 효과는 결국 AI 경쟁에서 최종 승자가 될 가능성을 높일 수 있습니다. 언뜻 보기에는 구글 TPU가 엔비디아를 겨냥한 것 같지만, 사실은 엔비디아 플랫폼을 사용할 수밖에 없는 다른 경쟁자가 더 압박을 받을 수밖에 없는 셈입니다. 자체 TPU 개발의 또 다른 이점은 자체 서비스에 최적화된 플랫폼과 생태계입니다. 마치 애플의 A 시리즈 및 M 시리즈 프로세서가 iOS 및 맥 OS, 그리고 애플 서비스에 최적화된 기능을 제공할 수 있어 비용은 절감하고 서비스 품질과 사용자 경험은 높일 수 있는 것과 동일한 구조입니다. 사실 이런 이유 때문에 구글뿐 아니라 오픈 AI나 앤스로픽 역시 자체 칩 플랫폼을 개발하거나 타사 플랫폼 활용을 고려하고 있지만, 이미 10년 이상 개발해온 TPU의 노하우를 따라잡기는 쉽지 않습니다. 반대로 이야기하면 구글 입장에서는 앞선 TPU 설계와 이미 구축해 놓은 생태계가 이들과의 경쟁에서 매우 큰 무기인 셈입니다. 결국 TPU의 개발 목적은 엔비디아와의 직접적인 경쟁보다는, 자사 인프라에 최적화된 저비용·고효율 환경을 구축하여 AI 서비스 대중화 시대의 수익성을 선점하는 데 있습니다. 이러한 탄탄한 하드웨어 경쟁력과 기존의 방대한 서비스 플랫폼이 결합된 AI 생태계를 통해 구글이 최종적인 승자가 될 수 있을지 주목됩니다.
  • 소캠2 메모리 규격, AI 넘어 서버 시장의 미래될까? [고든 정의 TECH+]

    소캠2 메모리 규격, AI 넘어 서버 시장의 미래될까? [고든 정의 TECH+]

    AI 데이터 센터 건설 붐이 거센 가운데, 메모리 수요 역시 폭증하고 있습니다. 메모리 종류 역시 전통적인 HBM이나 DDR5 메모리뿐 아니라 그래픽 카드용 GDDR 메모리는 물론 스마트폰용으로 개발된 LPDDR 메모리까지 AI 데이터센터가 블랙홀처럼 빨아 들이고 있습니다. 이런 현상을 보여주는 대표적인 제품이 엔비디아의 베라 루빈 (Vera Rubin) 입니다. Arm 아키텍처 기반의 베라 CPU와 루빈 GPU를 결합한 제품으로 루빈 GPU에는 최초로 HBM4 메모리가 탑재됩니다. 하지만 베라 CPX 같은 일부 제품은 HBM4 메모리 대신 저렴한 GDDR7 128GB 메모리를 탑재해 소비자용 그래픽 카드의 메모리 수급난이 더 심해질 것으로 예상됩니다. 베라 CPU의 경우 전통적인 DDR5 메모리는 물론 차세대 메모리 규격인 SOCAMM 2 (Small Outline Compression Attached Memory Module 2, 이하 소캠 2)을 사용할 수 있습니다. 소캠 2는 LPDDR5x 메모리를 서버에서도 사용할 수 있게 만든 규격으로 기존의 서버 메모리 모듈의 대세인 RDIMM를 대체할 수 있는 규격으로 주목받고 있습니다. LPDDR5x 메모리는 본래 스마트폰 등 모바일 기기를 위해 제안된 규격이기 때문에 메모리를 PCB 기판에 직접 붙이는 방식을 사용합니다. 따라서 교체나 업그레이드가 불가능합니다. 이는 스마트폰에서는 큰 문제가 되지 않으나 수리를 위해 메모리를 교체하거나 혹은 메모리 증설이 필요한 서버에서는 매우 불리한 방식입니다. 이런 단점을 개선하기 위해 LPDDR5x 메모리를 탈부착이 가능한 규격으로 만든 것이 소캠 2라고 할 수 있습니다. 소캠은 사실 노트북용으로 개발된 규격인 캠 (Compression Attached Memory Module, 압축 부착 메모리 모듈, CAMM)에서 유래한 규격입니다. 본래 의도는 노트북에서 사용되는 SO-DIMM이라는 오래된 규격을 대신해 LPDDR 메모리를 노트북에서도 사용할 수 있게 하는 것이었습니다. 하지만 캠 규격은 노트북 시장에서는 기대만큼 널리 사용되지 못했습니다. 인텔은 아예 LPDDR5x 메모리를 CPU와 함께 패키징 했고 AMD도 일부 모델에서 메모리를 같이 패키징 해서 크기를 줄이는 방향으로 개발했기 때문입니다. 그런데 LPDDR5x 메모리를 스마트폰 말고 컴퓨터에서도 쓰자는 아이디어가 AI 서버에서 더 주목받게 됩니다. 서버용 소캠 2 규격은 단일 모듈로 최대 256GB의 대용량을 구현할 수 있으며, 기존 DDR5보다 월등히 높은 153.6GB/s의 대역폭을 확보할 수 있습니다. 더욱 주목할 점은 장착 방식의 변화입니다. 수직으로 세워 장착하던 기존 RDIMM과 달리, 소캠 2는 CPU나 GPU처럼 기판에 평평하게 눕혀 장착하는 ‘압축 부착’ 방식을 취합니다. 덕분에 시스템 전체의 높이를 낮출 수 있고 일체형 냉각 솔루션을 적용하기가 훨씬 수월해졌습니다. 이는 강력한 발열 관리를 위해 수랭식 시스템 도입이 필수적인 베라 루빈 같은 고성능 서버에 매우 유리한 물리적 특성입니다. 여기에 막대한 전력 소모와 발열 문제로 골머리를 앓는 AI 데이터 센터 운영자들에게 저전력 특성을 지닌 LPDDR5x 기반의 소캠 2는 운영 비용을 절감할 수 있는 매력적인 해법입니다. 기본적으로 저전력인 LPDDR 규격인 데다 메인보드와 메모리 사이의 거리를 줄인 압축 부착 방식 덕분에 데이터 전송 과정에서 발생하는 전력 손실과 신호 간섭을 줄여 전력 소모는 줄이고 성능은 높일 수 있습니다. 최근 하이닉스의 192GB 소캠 2 메모리 양산을 발표했는데, 베라 CPU는 소캠 모듈 8개를 지원해 1.5TB의 용량을 채울 수 있습니다. 그리고 삼성과 마이크론 모두 256GB 소캠 2 제품의 샘플을 출하한 상태이기 때문에 미래에는 2TB 메모리 (256GB x8)까지 확장할 수 있을 것으로 보입니다. 물론 소캠 2의 장점은 엔비디아만 주목하는 것이 아닙니다. 경쟁자인 AMD 역시 차세대 에픽 서버 CPU인 베라노 (Verano)에 소캠 2를 지원할 예정입니다. 베라노는 2027년 출시를 목표로 하고 있으며 인스팅트 IM500 GPU와 함께 AMD의 AI 플랫폼을 구성할 예정입니다. 사정이 이렇다면 인텔 역시 서버 제품에서 소캠 2 지원을 고려하지 않을 수 없을 것입니다. 이렇게 AI 데이터 센터 시장에서 소캠 2 채택이 확산되면 소비자용 스마트폰 및 노트북 시장까지 영향이 있을 것으로 예상됩니다. LPDDR5x까지 데이터 센터로 빨려 들어가기 때문입니다. 물론 현재는 모든 형태의 메모리가 AI 데이터 센터로 향하고 있다고 해도 과언이 아닌 시기이기도 합니다. 다만 현재와 같은 AI 데이터 센터 붐이 가라앉더라도 LPDDR 메모리를 서버에서 사용할 때 누릴 수 있는 장점이 확실하기 때문에 결국 서버 시장에서 소캠이 새로운 대세로 자리잡을 가능성이 높아 보입니다. 그리고 언젠가 데스크톱 시장 역시 소캠이나 혹은 노트북용인 CAMM 규격이 확산되어 높은 성능과 낮은 전력 소모라는 장점을 누릴 날이 올 것으로 기대합니다.
  • SK하이닉스 전성비갑 ‘소캠2’ 출격… AI 메모리 새판짜기

    SK하이닉스 전성비갑 ‘소캠2’ 출격… AI 메모리 새판짜기

    적은 전기로 데이터 처리 속도 2배엔비디아 슈퍼칩 ‘베라 루빈’ 최적화HBM과 투트랙으로 효율성 높여차세대 기술서도 주도권 확보 총력“메모리 성능의 새로운 기준 될 것” SK하이닉스가 차세대 인공지능(AI) 서버용 메모리 모듈인 ‘소캠2(SOCAMM2) 192GB’를 본격 양산한다고 20일 밝혔다. 스마트폰 등에 쓰이던 저전력 D램(LPDDR5X)을 AI 서버에서 빠른 속도로 구동하면서도 전력 소비는 낮도록 개량한 제품이다. AI의 추론기능이 중요해지면서 전력 소비 대비 높은 성능이 요구되는 가운데 SK하이닉스가 고대역폭메모리(HBM)에 이어 차세대 영역에서도 주도권을 잡겠다고 선언한 셈이다. SK하이닉스는 “소캠2는 (DDR5를 활용한) 기존 서버용 메모리 모듈(RDIMM) 대비 데이터 처리 속도(대역폭)가 2배 이상 빠르고, 전력 효율은 75% 이상 개선된 고성능 AI 연산 최적화 솔루션”이라고 이날 밝혔다. 더 적은 전기로 더 많은 데이터를 처리할 수 있다는 의미다. 특히 이 제품은 엔비디아의 차세대 AI 플랫폼 ‘베라 루빈’에 맞춰 설계돼 향후 AI 서버에 본격 적용될 가능성이 크다. 이번 발표가 주목받는 이유는 AI 메모리 시장의 구조 변화와 맞물려 있어서다. 그간 AI 서버는 그래픽처리장치(GPU)가 연산을 수행하고, 이를 초고속으로 지원하는 HBM과 데이터를 저장·공급하는 RDIMM 중심으로 구성돼 왔다. GPU가 요리사라면 HBM은 바로 사용할 재료를 올려두는 도마, RDIMM은 재료를 보관하다 필요할 때 꺼내 쓰는 냉장고 역할을 했던 셈이다. 다만 AI 연산 속도가 급격히 빨라지면서 RDIMM의 데이터 공급 속도와 전력 효율이 병목 요인으로 지적돼 왔다. HBM 중심 구조를 유지하면서도, 보다 빠르고 효율적인 메모리에 대한 수요가 확대된 이유다. SK하이닉스는 소캠2를 통해 이런한 문제를 줄여, AI 처리 속도를 높이겠다는 전략이다. 업계에서는 소캠2에 대해 HBM의 완전한 대체품보다 역할을 나눌 것으로 보고 있다. HBM이 최고 성능을 담당한다면, 소캠2는 전력과 비용을 줄이면서 데이터를 효율적으로 공급하는 역할을 맡는 식이다. 이를 통해 AI 서버는 더 많은 작업을 보다 효율적으로 처리할 수 있게 된다. 이 같은 흐름은 AI 시장이 ‘학습’ 중심에서 ‘추론’ 중심으로 이동하는 변화와도 맞닿아 있다. 학습은 데이터를 이용해 AI 모델을 훈련시키는 과정이고, 추론은 학습된 AI를 실제 서비스에 활용하는 단계다. 최근에는 많은 기업들이 AI를 실제 서비스에 적용하면서 전력 효율이 높은 메모리 수요가 빠르게 늘고 있다. SK하이닉스 김주선 AI 인프라 사장은 “소캠2 192GB 제품 공급으로 AI 메모리 성능의 새로운 기준을 세웠다”며 “글로벌 AI 고객과의 긴밀한 협력을 바탕으로 최적의 성능을 제공하고, 신뢰받는 AI 메모리 솔루션 기업으로 자리매김하겠다”고 밝혔다.
  • 퓨리오사AI, 2세대 AI 반도체 공개…“엔비디아 대비 전력 효율 7.4배”

    퓨리오사AI, 2세대 AI 반도체 공개…“엔비디아 대비 전력 효율 7.4배”

    국내 AI 반도체 스타트업 퓨리오사AI가 2세대 신경망처리장치(NPU) ‘레니게이드(RNGD)’를 공개하며 글로벌 추론용 반도체 시장 공략에 나섰다. 엔비디아 등 기존 GPU 강자들이 주도하는 시장에서 압도적인 전력 효율과 비용 절감 효과를 앞세워 국산 AI 반도체의 상용화 시대를 열겠다는 포부다. 2일 서울 강남구에서 열린 ‘레니게이드 2026 서밋’에서 퓨리오사AI는 국내외 파트너사 200여명을 대상으로 RNGD의 성능과 생태계 확장 계획을 발표했다. 백준호 퓨리오사AI 대표는 “AI 인프라 경쟁의 중심이 학습에서 실질적인 서비스 구현인 ‘추론’으로 이동하고 있다”며 “반복적인 추론 비용을 낮추는 것이 향후 데이터센터 설계의 핵심이 될 것”이라고 강조했다. RNGD는 고대역폭메모리(HBM)를 탑재한 고성능 NPU로, 해외 고객사 벤치마킹 결과 엔비디아 ‘RTX 프로 6000’ 대비 동일 전력 기준 최대 7.4배 많은 사용자를 동시에 처리할 수 있는 것으로 나타났다. 또한 180와트(W)의 낮은 열설계전력(TDP)을 기반으로 데이터센터의 총소유비용(TCO)을 약 40% 절감할 수 있다는 것이 회사 측 설명이다. 퓨리오사AI는 이미 올해 1월 4000장 규모의 1차 양산을 개시하며 기술적 신뢰도를 입증했다. 주목할 점은 실제 서비스로 이어지는 상용화 행보다. 이날 행사에서 삼성SDS는 오는 7월부터 삼성 클라우드 플랫폼(SCP)을 통해 레니게이드를 구독형 서비스(NPUaaS)로 공급한다고 밝혔다. 고객들은 필요에 따라 칩 단위를 선택해 활용할 수 있다. 국내 클라우드 서비스 제공사(CSP) 중 최초의 NPU 구독 서비스 도입이다. 아울러 LG AI연구원, LG유플러스, 네이버클라우드, 업스테이지 등 주요 파트너사들도 참여해 실제 적용 사례를 공유했다. 김성훈 업스테이지 대표는 “정부가 초기 마중물 역할을 하여 AI 토큰이 활발히 유통되는 ‘토크노믹스’ 생태계를 조성해야 한다”고 제언했다. 퓨리오사AI는 향후 글로벌 파트너십을 강화해 국산 AI 반도체의 글로벌 점유율을 확대해 나갈 방침이다.
  • 게임 대신 AI에 승부수 던진 인텔, ‘가성비 32GB 그래픽 카드’ Arc Pro B70 공개 [고든 정의 TECH+]

    게임 대신 AI에 승부수 던진 인텔, ‘가성비 32GB 그래픽 카드’ Arc Pro B70 공개 [고든 정의 TECH+]

    인텔은 흔히 CPU 제조사로 잘 알려져 있지만, 사실 생각보다 오랫동안 그래픽 프로세서를 개발해 왔습니다. 다만 1세대 외장 그래픽 카드였던 i740 이후 수십 년간 내장 그래픽에만 집중하다 보니, 상대적으로 기술력이 엔비디아나 AMD에 뒤처지며 독립 GPU 시장에는 쉽게 진입하지 못했습니다. 그러다 AI GPU의 중요성이 급격히 커지자 인텔은 뒤늦게 GPU 개발에 총력을 기울였고, 그 결과물로 ‘아크(Arc)’ 그래픽 카드를 선보였습니다. 현재 인텔 아크 내장 그래픽은 경쟁사인 AMD의 라데온 내장 그래픽과 어느 정도 견줄 만큼 발전했습니다. 하지만 독립형 그래픽 카드 시장에서는 여전히 힘을 쓰지 못하고 있는 것이 현실입니다. 실제로 엔비디아가 시장의 90% 이상을 장악하고 라데온이 10% 미만을 점유하는 반면, 인텔 아크의 비중은 1%에도 미치지 못하는 것으로 알려져 있습니다. 여기에 최근 인텔의 재정 상태가 악화하면서 독립형 그래픽 카드 시장에서 아예 철수하고 내장 그래픽 형태로만 남게 될 것이라는 예측도 나왔습니다. 하지만 인텔은 최근 ‘아크 프로(Arc Pro) B70’과 ‘B65’를 전격 공개하며 이러한 우려를 단숨에 일축했습니다. 이번 아크 프로 B70과 B65의 가장 핵심적인 특징은 32GB의 대용량 메모리를 탑재했다는 점입니다. 특히 상위 모델인 B70의 출시가는 949달러 수준에 불과해 32GB급 그래픽 카드 가운데 가장 저렴합니다. 현재 국내 시장에서 32GB 메모리를 갖춘 최신 하이엔드 그래픽 카드인 RTX 5090이 약 600만 원대의 높은 가격에 판매되고 있다는 점을 고려하면, 4분의 1 이하의 가격으로 동일한 용량의 그래픽 카드를 사용할 수 있다는 파격적인 장점이 있습니다. 심지어 이는 메모리 용량이 절반인 16GB 급 RTX 5080 모델들과 비교해도 훨씬 저렴한 수준입니다. 사양을 자세히 살펴보면 무엇보다 메모리 용량에 집중한 인텔의 의도를 더욱 명확히 알 수 있습니다. 인텔 아크 프로 B70은 32개의 Xe2-HPG 코어와 367 INT8 TOPS의 AI 연산 능력을 갖추고 있습니다. 순수 AI 연산 속도만 놓고 본다면 RTX 5080보다 낮지만, 대용량 메모리 덕분에 내 컴퓨터에서 더 거대한 로컬 LLM(대규모 언어 모델)을 돌릴 수 있다는 독보적인 이점이 생깁니다. 로컬 AI를 돌리는 데는 대용량의 메모리가 필수적입니다. RTX 5080이 인텔 아크 프로 B70보다 훨씬 빨라도 16GB의 메모리 한계 때문에 일정 크기 이상의 모델은 아예 올릴 수가 없습니다. 하지만 32GB 메모리를 확보하면 더 큰 모델도 구동이 가능하며, 같은 모델이라도 훨씬 넓은 문맥 유지(Context Window) 용량을 확보할 수 있습니다. 속도는 기다리면 되는 문제이지만, 애당초 용량이 안되는 문제는 어떻게 극복할 수가 없습니다. 두 장 이상의 그래픽 카드를 사용하는 멀티 GPU 환경에서도 아크 프로 시리즈의 장점은 더욱 뚜렷합니다. 가격 부담이 적을 뿐만 아니라, 서버 및 워크스테이션에 적합한 블로워 팬 디자인으로 설계되어 PC 케이스와 메인보드에 여러 개를 장착해도 공간적 여유가 있습니다. 여기에 RTX 5090 한 장이 약 600W에 달하는 전력을 소모하는 반면, B70은 성능이 낮은 대신 160~290W 수준으로 전력 소모량이 적습니다. 결과적으로 하이엔드 카드 한 장을 마련할 비용으로 인텔 아크 프로 B70 세 장을 구축하면, 무려 96GB의 VRAM을 확보할 수 있습니다. 이는 약 75GB 이상의 VRAM이 필요한 Llama 3 70B 8비트 모델까지 합리적인 비용으로 돌릴 수 있는 가능성을 보여줍니다. 물론 연산 속도의 근본적인 한계와 더불어, AI 개발 생태계가 여전히 엔비디아의 CUDA 중심으로 돌아가고 있다는 점은 극복해야 할 과제입니다. 하지만 이미 엔비디아 중심 생태계가 확고히 자리잡은 게임 시장에 도전하는 것은 더 큰 무리수가 될 수 있습니다. 어쩌면 AI 워크로드 시장에 가성비로 파고드는 것이 인텔 아크가 선택할 수 있는 가장 영리한 생존 전략일지도 모릅니다. 가성비 AI GPU로 과감한 승부수를 던진 인텔의 도전이 통할 수 있을지 주목됩니다.
  • 구글 ‘터보퀀트’ 반도체 저승사자냐 시장 키울 촉진제냐

    구글 ‘터보퀀트’ 반도체 저승사자냐 시장 키울 촉진제냐

    소프트웨어가 하드웨어 수요 잠식‘훈련’ 필요 없어 이르면 연내 가능비용 줄어 ‘온디바이스 AI’ 앞당겨판매 대수 늘면 반도체 수요도 증가‘지능형 메모리’ 미래 기술 선점해야 구글 리서치가 인공지능(AI) 모델의 메모리 사용량을 6분의1로 줄이는 혁신 알고리즘 ‘터보퀀트’(TurboQuant)를 전격 공개해 글로벌 반도체 시장에 파장이 일고 있다. 소프트웨어가 하드웨어 수요를 잠식할 것이라는 ‘수요 절벽’ 위기론과 시장 파이가 커질 것이라는 낙관론이 팽팽하다. 29일 핵심 쟁점을 일문일답으로 풀었다. Q. 터보퀀트란 어떤 기술인가. A. AI가 대화 맥락을 기억하는 ‘실시간 메모장’(KV 캐시)의 용량을 획기적으로 줄이는 기술이다. 기존에 데이터를 무거운 ‘고화질 사진’로 저장했다면, 화질 손상은 거의 없으면서 용량만 6분의 1로 줄인 ‘고효율 압축 이미지’로 변환하는 식이다. 여기에 보정 필터를 더해 미세 정보까지 선명하게 되살린다. 예컨대 백과사전 6권을 핵심만 요약한 1권으로 만들면서도 답변 정확도는 그대로 유지하는 셈이다. Q. 과거 구글의 ‘텐서 처리 장치’(TPU)가 공개됐을 때보다 시장이 더 민감한 이유는. A. TPU가 엔비디아 그래픽처리장치(GPU)라는 하드웨어 장비를 ‘구글 칩’으로 바꿔보겠다는 하드웨어 간의 대체 경쟁이었다면, 터보퀀트는 어떤 연산 장치를 써도 메모리 ‘구매량’ 자체를 6분의 1로 줄일 수 있는 범용 소프트웨어 솔루션이다. 메모리 업체 입장에서 고객사가 칩 브랜드(하드웨어)를 바꾸는 게 아니라, 주문서의 수량(메모리 용량) 자체를 지워버리는 셈이라 타격의 결이 다르다. Q. 그럼에도 ‘장기 낙관론’이 나오는 이유는. A. 자원의 이용 효율이 높아져 비용이 낮아지면 전체 소비량이 늘어나는 ‘제본스의 역설’ 때문이다. AI 운영비가 낮아지면 모든 기기에 AI가 기본 탑재되는 ‘온디바이스 AI’ 시대가 앞당겨진다. 개별 기기당 탑재량은 줄어도 판매 대수가 압도적으로 늘어 전체 메모리 수요는 더 커질 것으로 전망된다. Q. 시장에선 상용화가 이르면 연내 가능할 것으로 보는데. A. 그렇다. 터보퀀트는 기존 AI 모델을 새로 학습시킬 필요 없이 운영 중인 시스템에 ‘필터’처럼 갈아 끼우는 ‘훈련 불필요’ 방식이다. Q. 상용화 신중론이 나오는 이유는. A. 해결할 과제가 많다. 수만 대의 서버가 얽힌 클라우드 시스템에 병목 없이 녹여내는 기술적 최적화가 필수다. 다양한 모델에서 동일한 품질을 내는지 증명해야 하고, 주요 환경에서 별도 튜닝 없이 쓸 수 있는 범용 표준으로 채택돼야 한다. 데이터 복원 과정에서 발생하는 시간 지연과 실시간 대화 품질 저하 우려도 넘어야 한다. Q. 한국 기업들은 어떻게 대응해야 하나. A. 삼성전자나 SK하이닉스는 단순히 정해진 규격의 부품만 납품하는 공급자에서 벗어나 AI 시스템 전체의 효율을 설계하는 ‘통합 솔루션 파트너’로서의 역량을 입증해야 한다. 메모리 스스로 연산까지 돕는 지능형 메모리(PIM)나 기기 간 연결 장벽을 허무는 차세대 연결 기술(CXL) 같은 미래 기술을 선점해야 한다.
  • 삼성SDS, 국내 첫 ‘B300’ GPU 서비스… AI 추론 시장 공략

    삼성SDS가 엔비디아의 최신 그래픽처리장치(GPU)인 ‘B300’을 기반으로 한 클라우드 서비스를 국내 처음 선보였다. 삼성SDS는 자사 클라우드 플랫폼 ‘삼성 클라우드 플랫폼(SCP)’을 통해 B300 기반 GPU 구독형 서비스 GPUaaS를 출시했다고 23일 밝혔다. 기업들이 인공지능(AI) 모델 개발을 넘어 실제 서비스에 적용하는 ‘AI 추론’ 단계로 진입하면서, 급증하는 고성능 컴퓨팅 수요에 대응하려는 것이다. B300 GPU는 12단 고대역폭메모리 HBM3E를 탑재해 GPU당 288GB의 메모리 용량과 초당 8TB의 대역폭을 제공한다. 복잡한 연산이 필요한 AI 추론 영역에서 H100 대비 용량은 3.6배, 대역폭은 2.4배로 메모리 성능이 향상됐다. 이에 따라 대규모 언어 모델(LLM) 실행 시 GPU의 빠른 연산 속도 대비 느린 메모리의 데이터 전송 속도로 인해 전반적인 성능이 저하되는 데이터 병목 현상이 획기적으로 개선됐다. SCP B300 GPUaaS를 도입하면 고용량 메모리를 통해 거대 AI 모델을 효율적으로 처리할 수 있어 AI 에이전트, 이미지·영상·코드 생성 및 분석 등 고성능이 필요한 AI 서비스의 지연 시간을 최소화할 수 있다.
  • “캐릭터 얼굴이 왜 이래?”…박수 칠 줄 알았는데, DLSS 5 논란에 당혹스러운 엔비디아 [고든 정의 TECH+]

    “캐릭터 얼굴이 왜 이래?”…박수 칠 줄 알았는데, DLSS 5 논란에 당혹스러운 엔비디아 [고든 정의 TECH+]

    엔비디아는 ‘GTC 2026’ 행사를 통해 여러 가지 흥미로운 신기술을 소개했습니다. 가장 주목을 끈 대목은 올해 출시를 준비 중인 차세대 AI CPU+GPU 시스템인 베라 루빈과, 새로 공개한 Groq의 3세대 LPU 시스템입니다. 해당 LPU는 AI 추론을 빠르게 처리하는 전용 가속기로, 베라 루빈 시스템과 함께 사용할 경우 전체 AI 처리 성능을 크게 끌어올릴 수 있어 주목받고 있습니다. 다만 이번에도 RTX 50 시리즈 이후 출시될 차세대 일반 소비자용 GPU에 대한 구체적인 소개는 빠졌습니다. 최근 메모리 공급과 파운드리 수급 문제 등이 이어지면서 소비자용 GPU 출시가 지연될 가능성도 높아지는 가운데 아쉬운 대목입니다. 하지만 대신 AI 그래픽 기술인 DLSS 5가 공개되며 큰 관심을 끌었습니다. DLSS 4.5 이전까지 DLSS 기술은 이미 GPU가 렌더링한 그래픽을 AI를 이용해 더 선명한 이미지로 보정하거나, 프레임과 프레임 사이에 새로운 화면을 만들어 넣어 게임 속도를 높이는 데 집중해 왔습니다. 하지만 DLSS 5는 뉴럴 렌더링(neural rendering) 기술을 적용해 그래픽 생성 단계부터 AI가 관여해 게임 그래픽을 더 근본적으로 바꿀 수 있습니다. 물체의 기본 형태는 유지하면서도, 표면의 질감이나 조명, 디테일과 같은 시각적 요소를 AI가 다시 구성하는 방식입니다. 그 결과 이전보다 훨씬 현실적인 그래픽과 인체 표현이 가능해졌다는 것이 엔비디아의 설명입니다. 이날 무대에 오른 젠슨 황 CEO는 DLSS 5를 “프로그래머블 셰이더 이후 컴퓨터 그래픽스의 재발명”이자 “그래픽의 GPT 모먼트”라고 평가하며, 2018년 실시간 하드웨어 레이 트레이싱 이후 가장 큰 혁신이라고 강조했습니다. 실제로 공개된 영상과 이미지를 보면 DLSS 5 적용 시 과거와는 다른 수준의 세밀한 캐릭터 묘사가 두드러집니다. 보통 이런 신기술이 공개되면 사람들은 환호하고 여기저기서 박수가 쏟아지기 마련입니다. 하지만 기대와 달리, 발표 직후 DLSS 5는 예상치 못한 논쟁에 휩싸이게 됩니다. 일부 캐릭터 표현이 이른바 ‘AI 슬롭(slop)’처럼 보인다는 비판이 제기된 것입니다. AI 슬롭은 생성형 AI가 만들어낸 저품질·무의미한 콘텐츠를 가리키는 표현으로, 원래 ‘음식물 찌꺼기’를 뜻하는 단어에서 유래했습니다. DLSS 5에서는 캐릭터 얼굴이 과도하게 보정되면서 마치 AI 필터를 적용한 것처럼 어색해 보인다는 지적과, 게임마다 비슷한 느낌이 난다는 비판이 이어지고 있습니다. 심지어 전혀 다른 이미지에 DLSS 5를 적용했다는 식의 패러디까지 등장하고 있는 상황입니다. 실제 사례를 보면 ‘레지던트 이블 레퀴엠’에서는 입술이 두꺼워지고 광대뼈가 강조되면서 얼굴 구조 자체가 바뀐 것처럼 보인다는 지적이 나오고 있습니다. ‘호그와트 레거시’에서는 노인의 주름 표현이 과도해 오히려 부자연스럽고 기괴하다는 평가도 있습니다. 여기에 프레임마다 AI가 이미지를 생성하는 과정에서 장면 간 미묘한 어긋남이 발생해 영상이 어색하게 느껴진다는 문제도 제기됩니다. 이러한 현상은 단순히 화질이 떨어지는 문제가 아니라, 캐릭터의 얼굴이나 장면의 분위기 자체가 달라지는 ‘의미 수준의 왜곡(semantic distortion)’에 가깝습니다. 이에 대해 젠슨 황 CEO는 “게이머들이 완전히 틀렸다”고 반박하며, 모든 결과는 개발자의 통제 하에 있다고 강조했습니다. 실제 적용 수준과 방식은 개발자가 결정하며, 사용자 역시 옵션을 통해 DLSS 5 적용 여부를 선택할 수 있다는 설명입니다. 이 같은 논쟁은 DLSS 초기 논쟁과도 비교됩니다. 당시에는 이미지가 뿌옇게 흐려지는 블러(blur), 빠르게 움직이는 물체 뒤에 잔상이 남는 고스트(ghost), 화면이 미세하게 흔들리거나 깜빡이는 플리커링(flickering) 같은 문제가 있었습니다. 이는 이미지 품질을 높이거나 새로운 프레임을 만들어내는 과정에서 발생하는 오류였습니다. 이후 DLSS 3와 4를 거치며 이러한 문제들은 상당 부분 개선되었습니다. 반면 DLSS 5에서 제기되는 논란은 단순한 그래픽 품질 문제가 아니라, 아예 다른 그래픽이 만들어지는 것 아니냐는 데 있습니다. 즉, 같은 장면을 더 선명하게 보여주는 것이 아니라 AI가 장면을 새롭게 해석해 바꿔버리는 것에 대한 거부감이 핵심입니다. 결국 DLSS 5는 단순한 그래픽 향상 기술을 넘어, AI가 게임의 시각적 결과를 어디까지 바꿀 수 있는가라는 근본적인 질문을 던지고 있습니다. AI 왜곡 못지 않은 논쟁은 접근성입니다. RTX 50 시리즈의 가격이 높게 책정된 데다, AI 수요 증가로 인해 실제 시장 가격은 출시가보다 더 상승한 상태입니다. 그 결과 많은 소비자들이 새로운 그래픽 카드 구매를 미루고 있으며, 여전히 구형 GPU를 사용하는 경우도 적지 않습니다. 이로 인해 상당수 사용자들이 DLSS 4조차 충분히 활용하지 못하는 상황에서, 훨씬 더 많은 연산 자원을 요구하는 DLSS 5가 공개되면서 ‘그림의 떡’이라는 평가도 나오고 있습니다. 실제로 이날 시연에는 최고급 그래픽 카드 RTX 5090이 두 장이 사용됐습니다. 엔비디아는 가을 정식 출시 전에 한 장의 그래픽 카드에서도 돌아갈 수 있도록 개선하겠다고 발표했지만, RTX 5090 한 장으로도 간신히 돌아가는 수준이 아니냐는 의구심이 제기되고 있습니다. 현재 200만원 넘는 RTX 5080을 구매한 소비자조차도 쉽게 사용할 수 없는 것 아니냐는 우려가 나오는 대목입니다. 아무리 혁신적인 기술이라도 많은 사람들이 접근하기 어렵다면 그 의미는 제한적일 수밖에 없습니다. AI 그래픽 기술의 진정한 확산은 성능뿐 아니라 가격과 접근성까지 함께 해결될 때 가능할 것입니다.
  • 삼성, AMD에 HBM4 우선 공급…‘20년 동맹’ 파운드리까지 넓힌다

    삼성, AMD에 HBM4 우선 공급…‘20년 동맹’ 파운드리까지 넓힌다

    AI가속기 1·2위에 모두 공급GPU 넘어 메모리 협력 강화AI 반도체 시장 주도권 속도수, 오늘 하정우 수석과 회동 이재용 삼성전자 회장이 18일 방한한 리사 수 AMD 최고경영자(CEO)와 만나 인공지능(AI) 반도체 협력 강화에 뜻을 모았다. 전날 젠슨 황 엔비디아 CEO도 그록3 언어처리장치(LPU)를 삼성전자가 생산 중이라고 공개한 바 있다. 삼성전자가 글로벌 AI 가속기 시장의 1위인 엔비디아와 2위인 AMD 모두와 손을 잡으며 AI 반도체 시장의 주도권 확보에 속도를 내는 모습이다. 수 CEO는 이날 이 회장과 서울 용산구 한남동에 있는 승지원에서 만찬 회동을 갖고 차세대 반도체 협력 방안을 논의했다. 이 회장은 먼저 만찬 장소에 도착해 수 CEO를 맞을 준비를 했다. 이 자리에는 전영현 DS부문장(부회장), 한진만 파운드리 사업부장(사장), 송재혁 최고기술책임자(CTO) 등 반도체 사업을 담당하는 핵심 경영진이 동석했다. 승지원은 고 이병철 창업 회장의 거처를 개조한 곳으로 이 회장은 국내외 귀빈을 만날 때 영빈관으로 사용하고 있다. 수 CEO는 만찬 전에는 삼성전자 평택캠퍼스를 방문해 차세대 AI 메모리와 컴퓨팅 기술 분야에서 협력을 확대하는 업무협약(MOU)을 체결했다. 전 부문장은 “삼성과 AMD는 AI 컴퓨팅 발전이라는 공통된 목표를 공유하고 있으며, 이번 협약으로 양사 협력 범위가 확대될 것”이라고 말했다. 이에 수 CEO는 “삼성의 첨단 메모리 기술 리더십과 AMD의 인스팅트 그래픽처리장치(GPU), 에픽 중앙처리장치(EPYC CPU), 랙 스케일 플랫폼을 결합하게 돼 매우 기쁘다”고 화답했다. 업계에서는 2007년 삼성전자의 D램이 AMD 그래픽 카드에 탑재되며 시작돼 20년간 이어진 양사의 협력이 AI 반도체 생태계 전반으로 확장됐다는 평가가 나온다. 특히 삼성전자는 AMD AI 가속기에 탑재되는 6세대 고대역폭메모리(HBM4) 우선 공급업체로 지정됐다. 이에 따라 삼성전자는 AMD의 데이터센터용 AI 연산 가속기 ‘인스팅트 MI455X’ GPU에 HBM4를 본격 탑재할 계획이다. AMD가 공식적으로 삼성전자를 자사의 HBM 우선 공급자로 선정한 것은 이번이 처음이다. 삼성전자는 지난달 업계 최초로 1c D램, 4나노 베이스다이 기술 기반 HBM4를 양산 출하했다. 이번 공급을 계기로 AMD와의 파트너십은 한층 강화되고 HBM 시장 주도권도 더욱 공고해질 전망이다. 삼성전자는 지난해부터 AMD의 AI 가속기에 HBM3E를 공급하고 있다. 양사의 협력은 AI 반도체 산업 발전과 함께 메모리 기술과 연산 칩 설계 간 통합이 중요해지고 있는 흐름을 보여 주는 사례로 꼽힌다. AI 가속기 성능이 높아질수록 GPU와 HBM 간 설계 최적화가 중요해지면서 메모리 업체와 GPU 설계 기업 간 협력도 더욱 긴밀해지고 있다. 앞으로 AMD의 AI 가속기 설계와 삼성의 메모리·파운드리 기술 간 시너지도 확대될 것으로 관측된다. 삼성전자와 AMD는 AI 데이터센터 랙 단위 데이터센터 플랫폼 헬리오스(Helios)와 6세대 차세대 데이터센터 서버용 CPU의 성능을 극대화하기 위해 고성능 DDR5 메모리 솔루션 분야에서도 협력하기로 했다. 또 팹리스(반도체 설계기업)인 AMD의 차세대 제품을 위탁 생산하는 파운드리 협력에 대해서도 논의해 나가기로 했다. 업계에서는 이번 협력이 삼성전자의 ‘아픈 손가락’으로 꼽혀 온 파운드리 경쟁력을 회복하는 계기가 될 수 있다는 기대가 나온다. 삼성전자는 메모리, 파운드리(반도체 위탁생산), 패키징까지 ‘원스톱 솔루션’이 가능하다는 점을 강조하며 글로벌 빅테크 기업과의 협력 확대에 나서고 있다. 한편 한국을 처음 찾은 수 CEO는 19일에는 하정우 청와대 AI미래기획수석과 만나 정부의 AI 고속도로 구축 등 AI 생태계 전반에 대해 의견을 나누고 협력 방안을 논의한다. 이 자리에는 임문영 국가인공지능전략위원회 부위원장도 참석한다. 같은 날 노태문 삼성전자 대표이사 겸 DX부문장, AI 스타트업 업스테이지의 김성훈 대표와도 회동하며 ‘광폭 행보’를 이어 간다.
  • 최태원 “2030년까지 칩 부족… 국내 생산 시설로 신속 대응”

    최태원 “2030년까지 칩 부족… 국내 생산 시설로 신속 대응”

    최 회장 “가격 안정화 계획 곧 발표”SK하이닉스, 미국 ADR 상장 검토젠슨 황 “여러분들 완벽하다” 극찬 최태원 SK그룹 회장이 인공지능(AI) 혁명에 따른 메모리 반도체 공급 부족 현상이 2030년까지 이어질 것이라는 분석을 내놨다. 최 회장은 시장의 수급 불균형에 대응하기 위해 국내 생산 기지를 활용한 신속 대응 체제를 강조하는 한편, 기업 가치 재평가를 위한 미국 주식예탁증서(ADR) 상장 검토 사실을 공식화했다. 최 회장은 16일(현지시간) 미국 새너제이에서 열린 엔비디아의 연례 개발자 콘퍼런스(GTC 2026)에 곽노정 SK하이닉스 사장 등 핵심 경영진과 함께 참석했다. 최 회장이 GTC를 직접 찾은 것은 이번이 처음이다. 젠슨 황 엔비디아 최고경영자(CEO)의 기조연설 직후 취재진과 만난 최 회장은 “웨이퍼 확보에만 최소 4, 5년이 걸리는 만큼 2030년까지 업계 전반의 (메모리) 공급 부족이 20% 이상 지속될 가능성이 높다”고 진단했다. 특히 특정 제품군에만 수요가 쏠리는 현상을 경계하며 “HBM에 너무 집중하면 일반 D램 부족으로 스마트폰 등 기존 산업이 타격을 입는다”며 균형 있는 생태계 조성을 위한 가격 안정화 계획을 조만간 발표할 것이라고 덧붙였다. 최 회장은 해외 공장 설립에 대해 “전력·용수·건설 여건·엔지니어링 인력이 갖춰져야 한다”며 한국 생산 시설에 집중하겠다는 뜻을 밝혔다. SK하이닉스의 미국 ADR 상장 가능성에 대해선 “글로벌 주주들에게 노출을 확대해 더 글로벌한 회사가 되기 위한 검토를 진행 중”이라고 밝혔다. 최 회장은 이날 오후 SK하이닉스 부스를 직접 찾은 황 CEO와 재회했다. 지난달 비공식 ‘치맥 회동’ 이후 한 달여 만에 다시 마주한 두 사람은 부스 내 전시된 차세대 메모리 솔루션들을 차례로 살폈다. 황 CEO는 차세대 HBM4와 서버용 D램 모듈인 SOCAMM2가 실제 GPU 모듈에 장착된 전시용 모형을 유심히 살폈으며, 최신 ‘그레이스 블랙웰(GB300)’ 기반 시스템 실물을 통해 양사의 기술 결합력을 확인했다. 현장에서 황 CEO는 “여러분들은 완벽하다(You guys are perfect)”는 극찬을 건네기도 했다. 그러면서 양사의 핵심 협력 제품인 ‘베라 루빈 200’ 패키지 위에 “JENSEN♡SK HYNIX”라는 친필 사인을 남기며 파트너십을 재확인했다. 최 회장 역시 전시장 이동 중 황 CEO의 딸인 매디슨 황 엔비디아 총괄과 인사를 나누며 각별한 유대를 보여줬다. 다만 시장의 경쟁 구도는 한층 치열해지는 양상이다. 황 CEO가 SK하이닉스뿐만 아니라 삼성전자와 마이크론 부스를 잇달아 방문한 것은 엔비디아가 특정 업체에 대한 의존도를 낮추는 ‘공급망 다변화’ 전략을 본격화했음을 시사한다. 실제로 마이크론은 이날 베라 루빈용 HBM4 12단 제품의 양산 출하를 공식화했고, 삼성전자는 차세대 ‘HBM4E’ 실물 칩을 전격 공개하며 추격에 박차를 가했다.
  • 젠슨 황 “내년 매출 1500조원”… 삼성이 ‘차세대 AI칩’ 찍어낸다

    젠슨 황 “내년 매출 1500조원”… 삼성이 ‘차세대 AI칩’ 찍어낸다

    젠슨 황 엔비디아 최고경영자(CEO)가 16일(현지시간) 미국 새너제이 SAP 센터에서 열린 엔비디아의 연례 개발자 콘퍼런스(GTC 2026) 기조연설에서 “2027년 엔비디아가 맞이할 인공지능(AI) 칩 매출 기회가 1조 달러(약 1500조원)에 달할 것”이라고 선언했다. 지난 GTC에서 제시한 전망치보다 2배 커진 숫자에 현장에서는 환호성이 나왔다. 엔비디아는 이 새로운 전환을 현실화할 전략적 우군으로 삼성전자를 지목했다. 추론 특화 LPU ‘그록3’ 공개AI슈퍼컴퓨터 ‘베라 루빈’에 통합언어 추론 시간 줄여 효율 극대화그록 칩 80% ‘삼성 S램’으로 채워황 CEO는 최근 시장에서 제기된 ‘AI 버블’과 ‘빅테크의 자체 칩 개발’이라는 의구심을 정면 돌파했다. 황 CEO는 자신을 ‘토큰 킹’이라 부르며, AI 답변 생성 단위인 ‘토큰’을 ‘새로운 시대의 원자재’로 정의한 뒤 “엔비디아 시스템의 토큰당 생성 비용은 세계에서 가장 저렴하다”고 강조했다. 빅테크들이 막대한 고정비를 들여 직접 칩을 설계하는 것보다 엔비디아 생태계 안에서 토큰을 생산하는 것이 경제적이라는 의미다. 엔비디아는 이날 빠른 추론에 특화된 전용 칩인 언어처리장치(LPU) ‘그록3’를 공개하고, 이를 차세대 AI 슈퍼컴퓨터 ‘베라 루빈’에 통합한다고 밝혔다. 기존의 ‘루빈’ 그래픽처리장치(GPU)는 대규모 데이터 처리에 강하고 새로운 LPU는 언어 추론의 지연 시간을 줄인다. 이 둘을 함께 쓰면 성능과 효율을 모두 높일 수 있다는 의미다. 이 중 엔비디아식 고효율 비용 파괴를 실현할 그록3는 삼성전자가 평택 공장에서 위탁 생산하고 있다. 삼성이 제조한 그록 칩은 내부의 80%가 S램(SRAM)으로 채워져 전력당 토큰 처리량을 35배 높이는 ‘괴물 같은 성능’을 자랑한다. 황 CEO는 이날 기조연설 중 “삼성이 우리를 위해 칩을 제조해줘 정말 감사하다”고 이례적인 감사를 표했다. 해당 제품은 올해 3분기 말에서 4분기 초 양산에 들어갈 예정이다. 삼성전자는 메모리와 파운드리를 하나로 묶는 독보적인 ‘종합 반도체 업체’(IDM)의 면모를 보이며 화답했다. 삼성은 GTC 전시장에서 메모리업체 중 유일하게 차세대 GPU인 ‘베라 루빈’ 플랫폼에 HBM4, 저전력 메모리(SOCAMM2), 초고속 SSD가 모두 탑재된 실물 서버를 공개했다. 베라 루빈은 단일 칩을 넘어 CPU, GPU, 네트워크, 보안, 메모리를 시스템으로 통합한 아키텍처다. 삼성전자 독보적 종합 반도체 업체HBM4 등 탑재된 실물 서버 공개2나노 도입 계획… 기술 초격차 자신“성능 최적화 위해 선단 공정 불가피”황상준 삼성전자 메모리개발담당 부사장은 현장에서 “올해 HBM 생산량을 작년보다 3배 이상 늘리고 이 중 절반 이상을 6세대 HBM4로 채우겠다”며 프리미엄 시장 주도권을 확보하겠다는 뜻을 보였다. 차세대 로드맵도 구체화했다. 삼성은 현재 양산 중인 6세대 HBM4와 7세대 HBM4E 베이스 다이(HBM 맨 아래 탑재되는 핵심 부품)에 4나노 공정을 적용하고, 8세대 HBM5부터는 삼성 파운드리의 2나노 선단 공정을 전격 도입한다. 황 부사장은 “성능 최적화를 위해 선단 공정 활용은 불가피하다”며 기술 초격차에 대한 자신감을 드러냈다. 기조연설 직후 삼성전자 전시장을 찾은 황 CEO는 HBM4 코어다이에 ‘어메이징(Amazing) HBM4!’, 평택산 그록 웨이퍼에는 ‘그록 슈퍼 패스트’(Groq Super Fast)라고 서명하며 기술력을 공인했다. 이튿날인 18일에는 리사 수 AMD CEO도 삼성 평택캠퍼스를 방문해 파운드리 협력 확대를 논의할 예정이다. 엔비디아와 AMD라는 반도체 양강이 동시에 삼성에 손을 내미는 셈이다. 젠슨 황 “어메이징 HBM4”평택산 웨이퍼에 ‘슈퍼 패스트’ 서명AMD CEO도 오늘 평택공장 방문반도체 2강, 삼성전자에 손 내밀어이날 엔비디아는 삼성전자가 생산하는 그록 LPU를 포함한 차세대 로드맵을 발표했다. 황 CEO는 차세대 GPU인 ‘루빈’ 아키텍처를 기반으로 144개의 GPU를 연결하는 ‘루빈 울트라’ 시스템을 공개했다. 여기에 에이전트 AI 연산을 지휘할 차세대 CPU ‘로자’, 그리고 루빈의 뒤를 이을 차차세대 GPU ‘파인만’을 차례로 발표했다. 특히 소프트웨어 플랫폼 ‘네모클로’를 소개하며 AI가 스스로 작업을 수행하는 ‘에이전트’ 개발 생태계까지 엔비디아 내에 구축하겠다는 야심을 드러냈다. 연설 말미에는 지상 너머 우주 데이터센터인 ‘베라 루빈 스페이스 원’을 깜짝 공개하며 우주에서도 가속 컴퓨팅이 가동되는 시대를 예고했다.
  • 가격 동결, 최소 인상, 혹은 제값 받기…메모리 대란 속 애플의 선택

    가격 동결, 최소 인상, 혹은 제값 받기…메모리 대란 속 애플의 선택

    애플이 대거 신제품을 공개했습니다. 우선 아이폰 17e가 깜짝 출시됐는데, 기본적으로 보급형으로 아이폰 16e와 외형상 차이가 없지만, 놀라운 변화가 있었습니다. 그것은 가격을 599달러로 동결하면서 기본 용량을 128GB에서 256GB로 늘렸다는 것과 맥세이프 같은 일부 기능도 같이 넣어줬다는 것입니다. 아이폰 17e에 들어가는 A19 칩은 아이폰 17과 차등을 두기 위해 5코어 대신 4코어 GPU를 사용하고 있으나 CPU와 뉴럴 엔진은 동일한 사양으로 성능 면에서 아이폰 16보다 나을 것으로 보입니다. 무엇보다 메모리 가격 폭등으로 다른 스마트폰들이 가격을 올리는 상황에서 가격을 동결하고 용량을 늘린 점은 놀라운 결단이 아닐 수 없습니다. 참고로 긁힘에 강한 세라믹 실드 2와 새로운 7중 레이어 반사방지 코팅도 추가되어 보급형 아이폰 중 최고 수준의 가성비 제품이 됐습니다. 아이패드 에어 M4 역시 가격을 동결한 반면 오히려 메모리 용량은 8GB에서 12GB로 늘려서 놀라움을 사고 있습니다. 아이패드 에어 신형은 M4 칩을 탑재해 전작(M3) 대비 CPU/GPU 성능이 최대 30% 향상되었으며, 12GB로 늘어난 통합 메모리와 16코어 뉴럴 엔진으로 애플 인텔리전스(AI) 처리 성능이 크게 개선되었습니다. 이 두 제품은 모두 가성비를 강조한 제품이라 메모리 가격 폭등에도 가격 인상을 고민할 수밖에 없긴 하지만, 메모리와 저장 용량을 늘리고 가격을 동결한 것은 꽤 의외의 결정입니다. 아무리 마진율이 높은 애플이라도 수익이 줄어들 수밖에 없는 상황이기 때문입니다. 한편 애플의 보급형 노트북 라인업인 맥북 에어에서는 좀 더 고민한 흔적이 보입니다. 기본적으로 메모리가 16GB에서 시작하다 보니 동결은 아무래도 힘들어서 SSD 용량을 512GB로 늘린 대신 가격을 100달러씩 올려 체감 가격이 전작과 비슷하게 만들었기 때문입니다. M5는 M4와 비교해서 CPU 성능은 15%, GPU 성능은 30% 정도 높아졌고 게임에서 현실적인 광원 효과에 중요한 레이 트레이싱 성능은 45% 정도 높아졌습니다. 메모리 대역폭도 27.5% 높아진 153GB/s에 달하며 SSD도 두 배 빨라졌습니다. 그리고 M5는 GPU 코어마다 뉴럴 가속기가 들어가 있어 AI 연산 성능이 M4 대비 최대 4배 높아졌습니다. 국내에서는 13인치가 16GB 메모리 512GB SSD 기준으로 179만원, 15인치가 같은 사양으로 209만원부터 시작으로 사양을 감안할 때 소비자 체감 가격은 큰 변화가 없는 수준입니다. 메모리 대란으로 노트북, 데스크톱 할 것 없이 가격이 오르는 상황에서 물론 비싸지만, 그래도 상대적으로 가격 인상폭이 적게 느껴지는 상황입니다. 다만 M5 프로와 맥스를 탑재한 맥북 프로의 가격은 상당한 폭으로 인상됐습니다. 본래 시스템 메모리와 SSD 용량이 커서 그런 것도 있겠지만, 새로운 M5 프로와 맥스 자체의 가격이 비싸진 것도 이유로 추측됩니다. 맥북 프로에 탑재되는 M5 프로와 맥스는 퓨전 아키텍처라는 새로운 아키텍처를 통해 두 개의 다이를 연결해 만들었습니다. TSMC의 3세대 3nm 공정과 2.5D 패키징 기술(SOIC-MH)을 사용하여 두 개의 다이를 본딩(Bonding)해 통해 칩 크기를 키우지 않고도 전력 효율과 수율을 동시에 잡았습니다. M5 프로와 맥스는 모두 18개의 CPU 코어를 지니고 있습니다. 애플이 이번에 새롭게 개발한 6개의 슈퍼 코어 (Super Cores)와 12개의 차세대 성능 코어 (Performance Cores)를 합쳐 최대 18개입니다. 애플의 주장에 따르면 슈퍼 코어는 세계에서 가장 빠른 싱글 스레드 성능을 자랑하며 성능 코어는 다중 스레드 작업에 최적화되어 있습니다. 전작 대비 멀티스레드 성능이 약 15~30% 높아졌다는 것이 애플의 설명입니다. GPU는 프로와 맥스가 각각 최대 20코어, 40코어 구성으로 각 코어에 통합 메모리 대역폭이 향상된 뉴럴 가속기가 탑재되어 AI 연산에 필요한 GPU 컴퓨팅 성능이 4배 이상 향상되었습니다. 레이 트레이싱을 사용하는 프로그램은 M4 프로와 맥스 대비 최대 35% 더 빠른 속도를 자랑하며 GPU 자체의 전반적인 속도는 전작 대비 20% 빨라졌습니다. 메모리 대역폭 역시 M5 프로가 307GB/s, M5 맥스가 614GB/s로 높아졌으며 통합 메모리 지원 용량도 각각 64GB, 128GB에 달합니다. 요약하면 새로운 반도체 패키징 기술을 적용해 CPU와 GPU 성능을 모두 높였고 AI 성능을 특히 획기적으로 높여 AI 연산 작업이나 기타 전문적인 그래픽, 이미지 작업에 최적화된 제품이라고 할 수 있습니다. 전문가용 제품은 비싸도 작업에 필요하면 구매하기 때문에 애플은 맥북 프로의 경우에는 가격을 상당히 올렸습니다. 14인치 M5 맥북 프로는 2199달러, 16인치 M5 맥스 맥북 프로는 3899달러부터 시작하며 국내에서는 14인치 기준으로 M5가 269만원, M5 프로가 349만원, M5 맥스가 579만원부터입니다. 이름처럼 프로패셔널하게 사용하는 경우가 아니라면 쉽게 접할 수 없는 가격이 됐습니다. 메모리 대란에서 애플 역시 자유롭지 않은 상태일 것입니다. 하지만 본래 고가 제품만 판매하는 전략을 취하다 보니 오히려 이런 상황에서 가격 인상 요인을 어느 정도 흡수해 가격 인상 폭을 최소화할 수 있다는 장점도 있습니다. 다만 애플은 무조건 다 인상 요인을 흡수하는 게 아니라 보급형 제품일수록 가격 인상을 최소화하고 고급형 제품은 제값을 받는 투트랙 전략을 사용하고 있습니다. 나름 고심 끝에 내린 묘안인데, 일단 수요가 많은 제품군에서 가격 인상폭이 적어 지금 같은 상황에서 소비자의 환영을 받을 것으로 예상됩니다.
  • 가격 동결, 최소 인상, 혹은 제값 받기…메모리 대란 속 애플의 선택 [고든 정의 TECH+]

    가격 동결, 최소 인상, 혹은 제값 받기…메모리 대란 속 애플의 선택 [고든 정의 TECH+]

    애플이 대거 신제품을 공개했습니다. 우선 아이폰 17e가 깜짝 출시됐는데, 기본적으로 보급형으로 아이폰 16e와 외형상 차이가 없지만, 놀라운 변화가 있었습니다. 그것은 가격을 599달러로 동결하면서 기본 용량을 128GB에서 256GB로 늘렸다는 것과 맥세이프 같은 일부 기능도 같이 넣어줬다는 것입니다. 아이폰 17e에 들어가는 A19 칩은 아이폰 17과 차등을 두기 위해 5코어 대신 4코어 GPU를 사용하고 있으나 CPU와 뉴럴 엔진은 동일한 사양으로 성능 면에서 아이폰 16보다 나을 것으로 보입니다. 무엇보다 메모리 가격 폭등으로 다른 스마트폰들이 가격을 올리는 상황에서 가격을 동결하고 용량을 늘린 점은 놀라운 결단이 아닐 수 없습니다. 참고로 긁힘에 강한 세라믹 실드 2와 새로운 7중 레이어 반사방지 코팅도 추가되어 보급형 아이폰 중 최고 수준의 가성비 제품이 됐습니다. 아이패드 에어 M4 역시 가격을 동결한 반면 오히려 메모리 용량은 8GB에서 12GB로 늘려서 놀라움을 사고 있습니다. 아이패드 에어 신형은 M4 칩을 탑재해 전작(M3) 대비 CPU/GPU 성능이 최대 30% 향상되었으며, 12GB로 늘어난 통합 메모리와 16코어 뉴럴 엔진으로 애플 인텔리전스(AI) 처리 성능이 크게 개선되었습니다. 이 두 제품은 모두 가성비를 강조한 제품이라 메모리 가격 폭등에도 가격 인상을 고민할 수밖에 없긴 하지만, 메모리와 저장 용량을 늘리고 가격을 동결한 것은 꽤 의외의 결정입니다. 아무리 마진율이 높은 애플이라도 수익이 줄어들 수밖에 없는 상황이기 때문입니다. 한편 애플의 보급형 노트북 라인업인 맥북 에어에서는 좀 더 고민한 흔적이 보입니다. 기본적으로 메모리가 16GB에서 시작하다 보니 동결은 아무래도 힘들어서 SSD 용량을 512GB로 늘린 대신 가격을 100달러씩 올려 체감 가격이 전작과 비슷하게 만들었기 때문입니다. M5는 M4와 비교해서 CPU 성능은 15%, GPU 성능은 30% 정도 높아졌고 게임에서 현실적인 광원 효과에 중요한 레이 트레이싱 성능은 45% 정도 높아졌습니다. 메모리 대역폭도 27.5% 높아진 153GB/s에 달하며 SSD도 두 배 빨라졌습니다. 그리고 M5는 GPU 코어마다 뉴럴 가속기가 들어가 있어 AI 연산 성능이 M4 대비 최대 4배 높아졌습니다. 국내에서는 13인치가 16GB 메모리 512GB SSD 기준으로 179만원, 15인치가 같은 사양으로 209만원부터 시작으로 사양을 감안할 때 소비자 체감 가격은 큰 변화가 없는 수준입니다. 메모리 대란으로 노트북, 데스크톱 할 것 없이 가격이 오르는 상황에서 물론 비싸지만, 그래도 상대적으로 가격 인상폭이 적게 느껴지는 상황입니다. 다만 M5 프로와 맥스를 탑재한 맥북 프로의 가격은 상당한 폭으로 인상됐습니다. 본래 시스템 메모리와 SSD 용량이 커서 그런 것도 있겠지만, 새로운 M5 프로와 맥스 자체의 가격이 비싸진 것도 이유로 추측됩니다. 맥북 프로에 탑재되는 M5 프로와 맥스는 퓨전 아키텍처라는 새로운 아키텍처를 통해 두 개의 다이를 연결해 만들었습니다. TSMC의 3세대 3nm 공정과 2.5D 패키징 기술(SOIC-MH)을 사용하여 두 개의 다이를 본딩(Bonding)해 통해 칩 크기를 키우지 않고도 전력 효율과 수율을 동시에 잡았습니다. M5 프로와 맥스는 모두 18개의 CPU 코어를 지니고 있습니다. 애플이 이번에 새롭게 개발한 6개의 슈퍼 코어 (Super Cores)와 12개의 차세대 성능 코어 (Performance Cores)를 합쳐 최대 18개입니다. 애플의 주장에 따르면 슈퍼 코어는 세계에서 가장 빠른 싱글 스레드 성능을 자랑하며 성능 코어는 다중 스레드 작업에 최적화되어 있습니다. 전작 대비 멀티스레드 성능이 약 15~30% 높아졌다는 것이 애플의 설명입니다. GPU는 프로와 맥스가 각각 최대 20코어, 40코어 구성으로 각 코어에 통합 메모리 대역폭이 향상된 뉴럴 가속기가 탑재되어 AI 연산에 필요한 GPU 컴퓨팅 성능이 4배 이상 향상되었습니다. 레이 트레이싱을 사용하는 프로그램은 M4 프로와 맥스 대비 최대 35% 더 빠른 속도를 자랑하며 GPU 자체의 전반적인 속도는 전작 대비 20% 빨라졌습니다. 메모리 대역폭 역시 M5 프로가 307GB/s, M5 맥스가 614GB/s로 높아졌으며 통합 메모리 지원 용량도 각각 64GB, 128GB에 달합니다. 요약하면 새로운 반도체 패키징 기술을 적용해 CPU와 GPU 성능을 모두 높였고 AI 성능을 특히 획기적으로 높여 AI 연산 작업이나 기타 전문적인 그래픽, 이미지 작업에 최적화된 제품이라고 할 수 있습니다. 전문가용 제품은 비싸도 작업에 필요하면 구매하기 때문에 애플은 맥북 프로의 경우에는 가격을 상당히 올렸습니다. 14인치 M5 맥북 프로는 2199달러, 16인치 M5 맥스 맥북 프로는 3899달러부터 시작하며 국내에서는 14인치 기준으로 M5가 269만원, M5 프로가 349만원, M5 맥스가 579만원부터입니다. 이름처럼 프로패셔널하게 사용하는 경우가 아니라면 쉽게 접할 수 없는 가격이 됐습니다. 메모리 대란에서 애플 역시 자유롭지 않은 상태일 것입니다. 하지만 본래 고가 제품만 판매하는 전략을 취하다 보니 오히려 이런 상황에서 가격 인상 요인을 어느 정도 흡수해 가격 인상 폭을 최소화할 수 있다는 장점도 있습니다. 다만 애플은 무조건 다 인상 요인을 흡수하는 게 아니라 보급형 제품일수록 가격 인상을 최소화하고 고급형 제품은 제값을 받는 투트랙 전략을 사용하고 있습니다. 나름 고심 끝에 내린 묘안인데, 일단 수요가 많은 제품군에서 가격 인상폭이 적어 지금 같은 상황에서 소비자의 환영을 받을 것으로 예상됩니다.
  • ‘AI 거품론’ 잠재운 엔비디아… K반도체, 더 높이 날아오른다

    ‘AI 거품론’ 잠재운 엔비디아… K반도체, 더 높이 날아오른다

    엔비디아가 역대 최고 매출을 기록하며 시장의 ‘인공지능(AI) 거품론’을 잠재웠다. 이에 엔비디아의 차세대 제품인 ‘루빈(Rubin)’과 6세대 고대역폭메모리(HBM4)에 핵심 역할을 하는 삼성전자와 SK하이닉스의 고공비행이 지속될 것으로 보인다. 엔비디아는 25일(현지시간) 회계연도 4분기 매출이 681억 3000만 달러(약 98조원)를 기록했다고 공시했다. 이는 전년 동기 대비 73% 증가한 수치로 시장 전망치(662억 달러)를 크게 웃돌았다. 매출의 91% 이상인 623억 달러가 데이터센터 부문에서 발생했다. 또 총마진율은 75%를 기록해 반도체 시장에서 공급자가 여전히 우위에 있음을 재확인했다. 성장의 기세는 하반기 차기 라인업으로 이어진다. 젠슨 황 CEO는 컨퍼런스 콜에서 “에이전트형 AI의 변곡점을 맞이하면서 컴퓨팅 수요가 기하급수적으로 늘고 있다”며 “거의 모든 고객이 베라 루빈 칩을 구매할 것으로 예상한다”고 밝혔다. 엔비디아는 미국의 규제로 인한 중국 시장 내 데이터센터 매출을 제외하고도 다음 분기 매출 전망치를 월가 예상치를 상회하는 780억 달러(약 112조원)로 제시했다. 엔비디아의 차기 플랫폼인 ‘루빈’ 출시에 맞춰 삼성전자는 지난 12일 세계 최초로 HBM4를 양산 출하했다. 엔비디아의 최대 파트너사인 SK하이닉스가 전체 물량의 약 65%를 배정받을 것으로 추산되는 가운데, 삼성전자 역시 약 30%의 점유율을 확보하고 있다. 특히 엔비디아가 최근 불안정해진 공급망을 안정시키려 두 회사 모두 핵심 파트너로 삼고 더욱 긴밀한 관계를 맺을 것이라는 분석도 나온다. SK하이닉스는 이날 ‘HBM’의 성공을 이을 차세대 솔루션인 고대역폭플래시(HBF)를 전격 공개하며 영토 확장에 나섰다. 메모리 전문기업 샌디스크와 손잡고 HBF의 글로벌 표준화를 추진하기로 했다. AI 서비스의 중심이 ‘학습’에서 ‘추론’으로 이동하는 시점을 선제 공략하려는 포석으로 읽힌다. HBF는 HBM의 고성능과 SSD의 대용량 특성을 결합했다. 컴퓨팅 수요가 급증할수록 메모리 공급자가 시장의 주도권을 쥐는 ‘슈퍼 을’ 현상은 심화할 전망이다. 아무리 연산 장치의 성능이 뛰어나도 데이터를 공급하는 메모리 속도가 받쳐주지 못하는 ‘메모리 벽’ 현상이 발생하기 때문이다. 이에 따라 엔비디아의 차세대 GPU 로드맵에 맞춘 삼성전자와 SK하이닉스의 기술 개발 일정은 전체 AI 생태계의 성장 속도를 결정짓는 핵심 변수가 됐다. 이에 글로벌 투자은행 맥쿼리는 지난 24일(현지시간) 삼성전자와 SK하이닉스의 목표주가를 각각 34만원과 170만원으로 대폭 상향했다.
  • 오픈 AI와 손잡은 세레브라스…AI 프로세서 시장 새 판 짤 수 있을까? [고든 정의 TECH+]

    오픈 AI와 손잡은 세레브라스…AI 프로세서 시장 새 판 짤 수 있을까? [고든 정의 TECH+]

    오픈 AI는 최근 웨이퍼 스케일 엔진(Wafer Scale Engine, 이하 WSE)을 개발하는 미국의 스타트업인 세레브라스(Cerebras)와 인프라 도입 계약을 체결했습니다. 세레브라스의 WSE 기반의 750MW 데이터 센터를 구축하는 계획으로 2028년 가동을 목표로 하고 있습니다. 투자 규모는 공개하지 않았지만, 일부 언론 보도에서는 100억 달러에 달하는 것으로 추정되고 있습니다. 오픈 AI는 세레브라스의 최신 WSE3-3 기반의 GPT-5.3-Codex-Spark를 공개해 이 프로세서에서 가능성을 보여주고 있습니다. 물론 현재는 엔비디아 의존도가 여전히 높고 두 회사가 기존에 맺은 상호 투자 계획들은 여전히 유효하지만, 이런 행보는 오픈 AI가 새로운 대안을 찾고 있다는 인상을 주기에는 충분합니다. 이를 통해 엔비디아와의 협상에서 우위를 점하는 것은 물론 더 비용 합리적인 대안을 찾을 수도 있는 것입니다. 다만 웨이퍼 스케일 엔진이라는 새로운 기술을 들고나온 세레브라스가 실제 그만큼의 성과를 보여줄 수 있을지는 아직 미지수입니다. 세레브라스는 2015년 설립된 스타트업으로 2019년 첫 번째 WSE 제품을 내놓았습니다. 이 기술에 웨이퍼 스케일이라는 명칭이 붙은 이유는 간단합니다. 프로세서를 만들 때 사용되는 둥근 원판인 웨이퍼를 잘라서 칩을 만드는 게 아니라 웨이퍼 전체를 통째로 하나의 프로세서로 사용하기 때문입니다. 현대적인 프로세서와 메모리 모두 웨이퍼를 잘라서 제품을 만들고 있지만, 웨이퍼를 여러 개로 잘라서 프로세서를 만든 후 이들을 별도의 시스템에서 병렬로 연결한다는 것은 사실 제조 비용 상승은 물론 프로세서 간 데이터 전송 시 발생하는 병목현상으로 인해 성능이 떨어질 우려가 있습니다. 따라서 발상을 바꿔 아예 웨이퍼 하나를 통째로 멀티코어 프로세서로 활용하자는 아이디어는 이전부터 있어 왔으나 몇 가지 큰 걸림돌이 있어 실현되지는 못했습니다. 첫 번째는 프로세서 제조 과정에서 사소한 오류 하나만 생겨도 웨이퍼 전체를 못 쓰게 되는 위험성이 있다는 것입니다. 예를 들어 기존의 프로세서는 웨이퍼 하나에서 150개 정도의 제품이 나왔을 때 100개 정도만 양품이면 나머지 50개를 버려도 충분히 수익을 낼 수 있습니다. 하지만 웨이퍼 전체에서 치명적인 오류가 한 번만 발생하면 웨이퍼 전체를 못 쓰게 되어 손해가 클 수밖에 없습니다. 웨이퍼 안에 수많은 코어를 탑재할 경우 코어 간 병목 현상과 메모리 병목 현상 역시 우려될 수 있는 문제입니다. 마지막으로 이렇게 거대한 프로세서는 전력 소모량과 발열량 역시 엄청나게 클 수밖에 없어 실용적인 시스템을 구축하기 힘들었습니다. 세레브라스는 새로운 방법으로 이 한계를 극복했습니다. 우선 하나의 큰 코어 대신 작은 코어 여러 개를 연결해 반복되는 구조를 만든 후 각 코어가 모두 연결되어 있어 일부 코어와 연결 회로에 오류가 생기더라도 나머지 부분이 정상 작동하도록 만들었습니다. 그리고 대용량의 SRAM을 프로세서에 통합해 메모리 병목 현상을 최소화했습니다. 2024년 공개한 세레브라스의 최신 프로세서인 WSE-3의 경우 TSMC의 5nm 공정을 이용해 4조 개의 트랜지스터를 집적한 역대 가장 거대한 프로세서로 90만 개의 코어를 집적했습니다. 실제로는 90만 개보다 더 많은 코어를 넣어서 오류가 나더라도 90만 개 정도의 코어 숫자를 보장한 것입니다. 하지만 코어가 많다고 해서 성능이 바로 그만큼 높아지는 것은 아닙니다. 구슬이 서말이라도 꿰어야 보배라는 속담처럼, 수많은 코어가 유기적으로 연결되어야 합니다. WSE-3는 코어들은 거대한 메쉬(Mesh) 구조로 연결되어 있습니다. 하나의 실리콘 안에서 모든 코어가 연결된 덕분에 수천 개의 GPU를 묶을 때 발생하는 병목 현상을 피하고 데이터 전송 속도가 매우 빠른 것이 특징입니다. WSE-3는 90만 개의 코어를 뒷받침하기 위해 44GB SRAM 메모리를 칩에 통합하고 있습니다. 다만 이것만으로는 대규모 AI 연산에 필요한 대규모 데이터를 모두 담을 수 없기 때문에 가중치(Weights)를 칩 외부의 전용 스토리지에 보관하고, 연산 시 필요한 부분만 초고속 스트리밍으로 칩에 공급하는 방식을 사용합니다. 이런 독특한 구조를 통해 웨이퍼 스케일 엔진 기술은 기본 AI 프로세서가 지닌 한계를 극복할 차세대 AI 솔루션으로 주목받고 있습니다. 하지만 장밋빛 미래만 보이는 것은 아닙니다. 현재 AI 생태계 자체가 엔비디아의 CUDA에 기반해 있고 AI 서비스 솔루션 자체도 GPU에 최적화되어 있다는 점은 무시하기 어려운 장벽입니다. 더구나 현재도 적자인 오픈 AI는 여기저기 투자 계획과 협업 프로젝트를 발표하고 있지만, 이 막대한 자금들을 어디서 조달할 수 있을지 의구심이 제기되고 있습니다. 지금 흑자를 내고 있다고 해도 앞으로 계획된 투자를 진행하기 위해서 필요한 천문학적인 자금을 조달하기는 쉽지 않을 것입니다. 그런데 또 대규모 투자 계획을 발표하니 의문이 제기되는 것도 당연합니다. 마지막으로 실제 WSE-3나 혹은 그 후속 프로세서들이 이론이 아니라 실제로 엔비디아의 GPU보다 더 앞선 성능을 보여줄 수 있는지 역시 충분히 검증되지 않은 상태입니다. 현재 여러 AI 제조사가 자사의 기술이 엔비디아보다 우월하다고 주장하고 있지만, 현재까지 의미 있는 대항마로 성장한 곳은 구글의 TPU 정도이며 오랜 라이벌인 AMD 조차도 아직 엔비디아의 아성에 도전할 수준은 되지 않고 있습니다. 오랜 세월 축적된 엔비디아의 기술을 신생 스타트업이 쉽게 뛰어넘을 수 있을지 아무래도 의문인데, 확실하지 않은 곳에 많은 자금을 투자할 정도로 재무 사정이 넉넉하지 않아 보인다는 것이 솔직한 평가일 것입니다. 물론 엔비디아의 현재 모습을 10년 전 대부분 예상 못한 것처럼 앞으로 10년 후 역시 예상하기 어려운 게 사실입니다. 과연 10년 후 엔비디아의 독점이 계속 유지될 수 있을지, 아니면 예상치 못한 다크호스가 시장을 뒤흔들게 될지 궁금합니다.
위로