찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 추론 성능
    2026-06-12
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
172
  • 중국 수학천재 소녀, 1년 만에 기업가치 ‘2조 4000억원’ 유니콘 만들었다 [여기는 중국]

    중국 수학천재 소녀, 1년 만에 기업가치 ‘2조 4000억원’ 유니콘 만들었다 [여기는 중국]

    지난달 실리콘밸리 AI 업계를 발칵 뒤집어 놓은 인물이 있다. 광저우 출신 25세 홍러통(洪乐潼, Carina Hong)이 창업한 AI 스타트업 액시옴(Axiom)이 2억 달러(약 3010억 원) 규모의 시리즈A 투자 유치에 성공했다. 최상위 벤처캐피털 멘로 벤처스(Menlo Ventures)가 이번 투자를 주도했고, 그레이크로프트(Greycroft)·마드로나 벤처(Madrona Venture)·B 캐피털·도요타 벤처스 등 기존 주주들도 추가 투자에 나섰다. 회사 설립 후 1년도 채 안 돼 기업 가치는 16억 달러(약 2조 4080억 원)에 달하며, 세계에서 가장 젊은 유니콘 기업 중 하나로 올라섰다. 6일 중국 언론 펑멘신문에 따르면 광저우에서 태어난 홍러통은 평범한 노동자 가정 출신이다. 어릴 때부터 수학에 남다른 재능을 보였으며, 2018년 17세의 나이에 MIT에 입학해 수학·물리학 이중 전공을 선택한 그는 단 3년 만에 두 학위를 마쳤다. 학부 재학 중에만 9편의 학술 논문을 발표했으며, 전미 여성 수학자 최고 영예인 앨리스 T. 섀퍼(Alice T. Schafer) 수학상, 북미 수학 학부생 최우수 연구상인 AMS-MAA-SIAM 모건상을 잇따라 수상했다. 2021년에는 세계에서 가장 권위 있는 국제 장학금 중 하나인 옥스퍼드 로즈 장학금을 받아 그해 중국인 수상자 4명 중 한 명이 됐다. 옥스퍼드에서 신경과학 석사 과정 중 런던대학교(UCL) 개츠비 계산 신경과학 유닛(Gatsby Computational Neuroscience Unit)에서 딥러닝 연구를 시작하며 AI 분야에 발을 들였고, 이후 스탠퍼드에서 수학·법학 이중 박사 과정을 밟다가 중도에 학업을 포기하고 창업에 뛰어들었다. 홍러통이 포착한 AI 업계의 모순은 명확했다. 대형 언어 모델의 성능은 폭발적으로 성장하지만, 신뢰성은 여전히 ‘암흑’이라는 점이다. “일상적인 오류는 큰 문제가 아닐 수 있지만, 금융·국방·핵심 인프라 분야에서 확률에 기반한 오류는 재앙이 될 수 있다”는 게 그의 문제의식이었다. 수학 용어 ‘공리(Axiom)’에서 이름을 딴 이 회사의 목표는 AI가 컴퓨터 코드를 자동으로 검증할 수 있는 시스템을 구축하는 것이다. 핵심 기술은 형식화 검증(formal verification)으로, 린(Lean) 프로그래밍 언어를 통해 수학적 증명을 실행 가능한 프로그램으로 변환해 결과의 정확성을 근본적으로 보장한다. 대형 모델이 확률로 답을 ‘추측’하는 대신, 코드를 엄격한 수학 논리로 변환해 모든 추론 단계를 결정론적 검증기로 검증하는 방식이다. 이 시스템의 실력은 이미 증명됐다. 2025년 12월 미국 대학생 수학 경시대회인 퍼트넘(Putnam) 대회에서 액시옴의 핵심 시스템이 12문제 전부를 맞히는 만점을 기록했다. 100년에 가까운 대회 역사상 만점을 받은 사람은 단 5명에 불과하다. 이후 이 시스템은 여러 미해결 정수론 추측도 독자적으로 증명해냈다. 회사의 시작은 2024년 가을 스탠퍼드 인근 카페에서였다. 홍러통은 그곳에서 당시 메타(Meta) AI 연구 총괄이던 수보 셍굽타(Shubho Sengupta)를 만나 몇 시간의 대화 끝에 창업을 결심했고, 셍굽타는 현 CTO가 됐다. 홍러통의 MIT 시절 지도교수였던 수학계 거장 오노 켄(小野健, Ken Ono)도 버지니아대학교 종신교수직을 내려놓고 합류했다. 현재 액시옴의 팀원은 20여 명으로, 절반이 메타 AI 연구소 출신이다. 투자자들의 확신도 분명하다. 멘로 벤처스의 파트너 매트 크래닝(Matt Kraning)은 “AI가 거의 모든 소프트웨어를 작성하는 세상이 오고 있는데, 아무도 언급하지 않는 문제가 있다. 그 코드들이 전혀 검증되지 않는다는 것”이라며 “AI가 코드를 작성하고, 수학이 그 코드가 옳은지 검증할 것”이라고 말했다. 홍러통은 향후 액시옴의 제품이 헤지펀드와 퀀트 운용사에서 자산 가격 책정, 주가 예측 등 복잡한 수학 문제를 빠르게 해결하는 데 활용될 것으로 보고 있다. 같은 분야 경쟁사 하모닉(Harmonic)이 첫 번째 수학적 이정표를 세우는 데 2년 이상 걸렸다면, 액시옴은 그보다 훨씬 빠르게 성과를 냈다고 자신했다. 박사 학위도, 안정된 교수직도 내려놓고 증명의 세계에서 창업의 세계로 뛰어든 이 천재 소녀가 수학으로 AI의 신뢰성 문제를 풀어낼 수 있을지, 업계의 이목이 집중되고 있다.
  • 삼성전자 ‘유럽판 챗GPT’ 미스트랄과 협력 나서나

    유럽의 오픈AI로 불리는 프랑스 인공지능(AI) 스타트업 ‘미스트랄 AI’가 삼성전자와 메모리 반도체 협력 방안을 논의했다. 5일 업계에 따르면 에마뉘엘 마크롱 프랑스 대통령의 국빈 방한을 계기로 한국을 찾은 아르튀르 멘슈 최고경영자(CEO) 등 미스트랄 AI 경영진은 지난 2일 삼성전자 화성캠퍼스에서 전영현 삼성전자 대표이사 겸 디바이스솔루션(DS) 부문장(부회장) 등을 만났다. 미스트랄 AI는 구글 딥마인드와 메타 출신 인력들이 2023년 설립했다. 오픈AI의 GPT-4에 필적하는 성능을 갖춘 대형언어모델(LLM) ‘미스트랄 라지(Large)’ 및 챗봇 ‘르 샤(Le Chat)’를 선보였다. 미스트랄 AI는 미국·중국 테크 기업에 의존하지 않는 유럽의 ‘소버린 AI(기술 주권)’를 추구한다. 미스트랄 AI는 프랑스 파리 인근에 건설 중인 신규 데이터센터를 통해 AI 모델 학습 및 추론 서비스를 제공할 예정인데, 삼성전자가 여기에 탑재될 고성능 메모리를 공급할 것이라는 관측이 나온다. 업계 관계자는 “이번 삼성전자 방문은 자사 모델 운영 및 AI 인프라 구축에 필요한 반도체 경쟁력을 강화하려는 행보”라고 말했다.
  • 퓨리오사AI, 2세대 AI 반도체 공개…“엔비디아 대비 전력 효율 7.4배”

    퓨리오사AI, 2세대 AI 반도체 공개…“엔비디아 대비 전력 효율 7.4배”

    국내 AI 반도체 스타트업 퓨리오사AI가 2세대 신경망처리장치(NPU) ‘레니게이드(RNGD)’를 공개하며 글로벌 추론용 반도체 시장 공략에 나섰다. 엔비디아 등 기존 GPU 강자들이 주도하는 시장에서 압도적인 전력 효율과 비용 절감 효과를 앞세워 국산 AI 반도체의 상용화 시대를 열겠다는 포부다. 2일 서울 강남구에서 열린 ‘레니게이드 2026 서밋’에서 퓨리오사AI는 국내외 파트너사 200여명을 대상으로 RNGD의 성능과 생태계 확장 계획을 발표했다. 백준호 퓨리오사AI 대표는 “AI 인프라 경쟁의 중심이 학습에서 실질적인 서비스 구현인 ‘추론’으로 이동하고 있다”며 “반복적인 추론 비용을 낮추는 것이 향후 데이터센터 설계의 핵심이 될 것”이라고 강조했다. RNGD는 고대역폭메모리(HBM)를 탑재한 고성능 NPU로, 해외 고객사 벤치마킹 결과 엔비디아 ‘RTX 프로 6000’ 대비 동일 전력 기준 최대 7.4배 많은 사용자를 동시에 처리할 수 있는 것으로 나타났다. 또한 180와트(W)의 낮은 열설계전력(TDP)을 기반으로 데이터센터의 총소유비용(TCO)을 약 40% 절감할 수 있다는 것이 회사 측 설명이다. 퓨리오사AI는 이미 올해 1월 4000장 규모의 1차 양산을 개시하며 기술적 신뢰도를 입증했다. 주목할 점은 실제 서비스로 이어지는 상용화 행보다. 이날 행사에서 삼성SDS는 오는 7월부터 삼성 클라우드 플랫폼(SCP)을 통해 레니게이드를 구독형 서비스(NPUaaS)로 공급한다고 밝혔다. 고객들은 필요에 따라 칩 단위를 선택해 활용할 수 있다. 국내 클라우드 서비스 제공사(CSP) 중 최초의 NPU 구독 서비스 도입이다. 아울러 LG AI연구원, LG유플러스, 네이버클라우드, 업스테이지 등 주요 파트너사들도 참여해 실제 적용 사례를 공유했다. 김성훈 업스테이지 대표는 “정부가 초기 마중물 역할을 하여 AI 토큰이 활발히 유통되는 ‘토크노믹스’ 생태계를 조성해야 한다”고 제언했다. 퓨리오사AI는 향후 글로벌 파트너십을 강화해 국산 AI 반도체의 글로벌 점유율을 확대해 나갈 방침이다.
  • 배터리 오래가요? ‘전성비’ 전성시대

    배터리 오래가요? ‘전성비’ 전성시대

    인공지능(AI) 확산으로 전력 소비가 급증하면서 가전제품부터 휴대전화, 로봇, 반도체에 이르기까지 정보기술(IT) 업계가 ‘전성비(전력 대비 성능)’ 상품 출시 경쟁에 뛰어들었다. 고연산 AI 확산에 따른 전력 공급 부족에 대한 대응은 물론, 소비자의 전기요금 부담을 덜고 에너지 효율로 온실가스 배출도 함께 줄이겠다는 취지다. 24일 업계에 따르면 저전력 고효율 제품이 봇물처럼 쏟아지는 데는 전력비용과 전력망 부담 급증, 전력 감축 기술의 성숙, PC·휴대전화·로봇 등 AI의 상용화 등이 배경에 깔려 있다. 즉, 배터리·발열·지연시간 문제가 소비자 체감 이슈가 됐다는 의미다. 저전력 혁신은 AI 시대의 핵심 부품인 메모리반도체 경쟁에서 가장 뚜렷하다. 삼성전자는 지난달 고대역폭메모리(HBM)4를 첫 양산 출하했다고 밝히며, 코어 다이에 저전력 설계를 적용해 전작 대비 에너지 효율을 40% 개선했다고 설명했다. AI 연산에서 발열과 전력 효율은 곧 성능과 직결된다. 모바일과 서버에 쓰이는 저전력 D램인 LPDDR 역시 빠르게 진화하고 있다. SK하이닉스는 지난 10일 세계 최초로 10나노급 6세대(1c) 공정을 적용한 16Gb LPDDR6 개발 인증을 완료했다며, 데이터 처리 속도는 33.00% 향상됐지만 전력 소모는 전작 대비 20% 이상 줄였다고 강조했다. AI 반도체 기업 엔비디아는 지난 16일 연례 개발자 회의(GTC 2026)에서 새 CPU ‘베라’와 이를 256개 탑재한 CPU 랙을 선보였는데, 에너지 효율을 2배 높인 것이 특징이었다. AI가 단순 학습과 추론을 넘어 물리적 환경에서 작동하는 ‘피지컬 AI’로 확장되면서 저전력 반도체의 중요성은 더 커지고 있다. 한국은행은 ‘3월 통화신용정책보고서’에서 “피지컬 AI는 복잡한 현실을 정밀하게 모사하고 이를 실시간으로 처리해야 한다는 점에서 고성능과 저전력 반도체 수요를 동시에 확대시키고 있다”고 분석했다. 이어 “자율주행차 한 대가 영상 수집 등을 통해 하루에 생성하는 데이터는 약 32TB로, 개인의 하루 스마트폰 사용 데이터(약 1.20GB)의 2만 6000배를 넘는다”고 설명했다. 로봇 분야의 전력 효율 경쟁은 배터리 기술로 확장되고 있다. 로봇에 탑재되려면 작고 가벼우면서도 효율이 높은 배터리가 필수적이다. 이에 따라 전고체 배터리와 리튬메탈 등 차세대 기술 개발 경쟁이 치열하다. 삼성SDI는 2027년을 목표로 전고체 배터리 양산을 준비하고 있다. LG에너지솔루션은 에너지 효율을 극대화한 무음극계 전고체 배터리를 2030년 도입하겠다고 밝혔다. IT 업계의 이런 트렌드는 소비 시장에도 영향을 미친다. 가전업계 관계자는 “AI 기능 사용이 늘면서 소비자들은 스마트폰과 노트북 배터리가 빠르게 소모된다고 체감한다”며 “앞으로는 저전력 설계와 배터리 효율이 제품 경쟁력을 좌우하는 핵심 요소가 될 것”이라고 밝혔다. 디스플레이는 사용 단계에서 발생하는 전력 소비가 탄소 배출과 직결되는 만큼, 전력 절감 기술 확보가 중요하다. LG디스플레이는 화면 변화에 따라 새로고침 빈도를 유연하게 조절하는 ‘옥사이드 1Hz’ 기술을 적용한 노트북용 LCD 패널을 세계 최초로 양산한다. 이를 적용하면 배터리 사용 시간을 기존 대비 48.00% 이상 늘릴 수 있다. 애플의 ‘아이폰 17e’는 보급형 모델이지만 최신 칩셋 A19를 탑재해 성능을 끌어올렸다. 여기에 자체 개발한 셀룰러 모뎀 C1X를 적용해 데이터 처리 속도를 전작 대비 두 배 수준으로 높이고 전력 효율도 개선했다. 애플은 배터리 성능이 ‘아이폰 16 프로’ 대비 최대 30.00% 향상됐다고 설명했다.
  • 삼성SDS, 국내 첫 ‘B300’ GPU 서비스… AI 추론 시장 공략

    삼성SDS가 엔비디아의 최신 그래픽처리장치(GPU)인 ‘B300’을 기반으로 한 클라우드 서비스를 국내 처음 선보였다. 삼성SDS는 자사 클라우드 플랫폼 ‘삼성 클라우드 플랫폼(SCP)’을 통해 B300 기반 GPU 구독형 서비스 GPUaaS를 출시했다고 23일 밝혔다. 기업들이 인공지능(AI) 모델 개발을 넘어 실제 서비스에 적용하는 ‘AI 추론’ 단계로 진입하면서, 급증하는 고성능 컴퓨팅 수요에 대응하려는 것이다. B300 GPU는 12단 고대역폭메모리 HBM3E를 탑재해 GPU당 288GB의 메모리 용량과 초당 8TB의 대역폭을 제공한다. 복잡한 연산이 필요한 AI 추론 영역에서 H100 대비 용량은 3.6배, 대역폭은 2.4배로 메모리 성능이 향상됐다. 이에 따라 대규모 언어 모델(LLM) 실행 시 GPU의 빠른 연산 속도 대비 느린 메모리의 데이터 전송 속도로 인해 전반적인 성능이 저하되는 데이터 병목 현상이 획기적으로 개선됐다. SCP B300 GPUaaS를 도입하면 고용량 메모리를 통해 거대 AI 모델을 효율적으로 처리할 수 있어 AI 에이전트, 이미지·영상·코드 생성 및 분석 등 고성능이 필요한 AI 서비스의 지연 시간을 최소화할 수 있다.
  • “캐릭터 얼굴이 왜 이래?”…박수 칠 줄 알았는데, DLSS 5 논란에 당혹스러운 엔비디아 [고든 정의 TECH+]

    “캐릭터 얼굴이 왜 이래?”…박수 칠 줄 알았는데, DLSS 5 논란에 당혹스러운 엔비디아 [고든 정의 TECH+]

    엔비디아는 ‘GTC 2026’ 행사를 통해 여러 가지 흥미로운 신기술을 소개했습니다. 가장 주목을 끈 대목은 올해 출시를 준비 중인 차세대 AI CPU+GPU 시스템인 베라 루빈과, 새로 공개한 Groq의 3세대 LPU 시스템입니다. 해당 LPU는 AI 추론을 빠르게 처리하는 전용 가속기로, 베라 루빈 시스템과 함께 사용할 경우 전체 AI 처리 성능을 크게 끌어올릴 수 있어 주목받고 있습니다. 다만 이번에도 RTX 50 시리즈 이후 출시될 차세대 일반 소비자용 GPU에 대한 구체적인 소개는 빠졌습니다. 최근 메모리 공급과 파운드리 수급 문제 등이 이어지면서 소비자용 GPU 출시가 지연될 가능성도 높아지는 가운데 아쉬운 대목입니다. 하지만 대신 AI 그래픽 기술인 DLSS 5가 공개되며 큰 관심을 끌었습니다. DLSS 4.5 이전까지 DLSS 기술은 이미 GPU가 렌더링한 그래픽을 AI를 이용해 더 선명한 이미지로 보정하거나, 프레임과 프레임 사이에 새로운 화면을 만들어 넣어 게임 속도를 높이는 데 집중해 왔습니다. 하지만 DLSS 5는 뉴럴 렌더링(neural rendering) 기술을 적용해 그래픽 생성 단계부터 AI가 관여해 게임 그래픽을 더 근본적으로 바꿀 수 있습니다. 물체의 기본 형태는 유지하면서도, 표면의 질감이나 조명, 디테일과 같은 시각적 요소를 AI가 다시 구성하는 방식입니다. 그 결과 이전보다 훨씬 현실적인 그래픽과 인체 표현이 가능해졌다는 것이 엔비디아의 설명입니다. 이날 무대에 오른 젠슨 황 CEO는 DLSS 5를 “프로그래머블 셰이더 이후 컴퓨터 그래픽스의 재발명”이자 “그래픽의 GPT 모먼트”라고 평가하며, 2018년 실시간 하드웨어 레이 트레이싱 이후 가장 큰 혁신이라고 강조했습니다. 실제로 공개된 영상과 이미지를 보면 DLSS 5 적용 시 과거와는 다른 수준의 세밀한 캐릭터 묘사가 두드러집니다. 보통 이런 신기술이 공개되면 사람들은 환호하고 여기저기서 박수가 쏟아지기 마련입니다. 하지만 기대와 달리, 발표 직후 DLSS 5는 예상치 못한 논쟁에 휩싸이게 됩니다. 일부 캐릭터 표현이 이른바 ‘AI 슬롭(slop)’처럼 보인다는 비판이 제기된 것입니다. AI 슬롭은 생성형 AI가 만들어낸 저품질·무의미한 콘텐츠를 가리키는 표현으로, 원래 ‘음식물 찌꺼기’를 뜻하는 단어에서 유래했습니다. DLSS 5에서는 캐릭터 얼굴이 과도하게 보정되면서 마치 AI 필터를 적용한 것처럼 어색해 보인다는 지적과, 게임마다 비슷한 느낌이 난다는 비판이 이어지고 있습니다. 심지어 전혀 다른 이미지에 DLSS 5를 적용했다는 식의 패러디까지 등장하고 있는 상황입니다. 실제 사례를 보면 ‘레지던트 이블 레퀴엠’에서는 입술이 두꺼워지고 광대뼈가 강조되면서 얼굴 구조 자체가 바뀐 것처럼 보인다는 지적이 나오고 있습니다. ‘호그와트 레거시’에서는 노인의 주름 표현이 과도해 오히려 부자연스럽고 기괴하다는 평가도 있습니다. 여기에 프레임마다 AI가 이미지를 생성하는 과정에서 장면 간 미묘한 어긋남이 발생해 영상이 어색하게 느껴진다는 문제도 제기됩니다. 이러한 현상은 단순히 화질이 떨어지는 문제가 아니라, 캐릭터의 얼굴이나 장면의 분위기 자체가 달라지는 ‘의미 수준의 왜곡(semantic distortion)’에 가깝습니다. 이에 대해 젠슨 황 CEO는 “게이머들이 완전히 틀렸다”고 반박하며, 모든 결과는 개발자의 통제 하에 있다고 강조했습니다. 실제 적용 수준과 방식은 개발자가 결정하며, 사용자 역시 옵션을 통해 DLSS 5 적용 여부를 선택할 수 있다는 설명입니다. 이 같은 논쟁은 DLSS 초기 논쟁과도 비교됩니다. 당시에는 이미지가 뿌옇게 흐려지는 블러(blur), 빠르게 움직이는 물체 뒤에 잔상이 남는 고스트(ghost), 화면이 미세하게 흔들리거나 깜빡이는 플리커링(flickering) 같은 문제가 있었습니다. 이는 이미지 품질을 높이거나 새로운 프레임을 만들어내는 과정에서 발생하는 오류였습니다. 이후 DLSS 3와 4를 거치며 이러한 문제들은 상당 부분 개선되었습니다. 반면 DLSS 5에서 제기되는 논란은 단순한 그래픽 품질 문제가 아니라, 아예 다른 그래픽이 만들어지는 것 아니냐는 데 있습니다. 즉, 같은 장면을 더 선명하게 보여주는 것이 아니라 AI가 장면을 새롭게 해석해 바꿔버리는 것에 대한 거부감이 핵심입니다. 결국 DLSS 5는 단순한 그래픽 향상 기술을 넘어, AI가 게임의 시각적 결과를 어디까지 바꿀 수 있는가라는 근본적인 질문을 던지고 있습니다. AI 왜곡 못지 않은 논쟁은 접근성입니다. RTX 50 시리즈의 가격이 높게 책정된 데다, AI 수요 증가로 인해 실제 시장 가격은 출시가보다 더 상승한 상태입니다. 그 결과 많은 소비자들이 새로운 그래픽 카드 구매를 미루고 있으며, 여전히 구형 GPU를 사용하는 경우도 적지 않습니다. 이로 인해 상당수 사용자들이 DLSS 4조차 충분히 활용하지 못하는 상황에서, 훨씬 더 많은 연산 자원을 요구하는 DLSS 5가 공개되면서 ‘그림의 떡’이라는 평가도 나오고 있습니다. 실제로 이날 시연에는 최고급 그래픽 카드 RTX 5090이 두 장이 사용됐습니다. 엔비디아는 가을 정식 출시 전에 한 장의 그래픽 카드에서도 돌아갈 수 있도록 개선하겠다고 발표했지만, RTX 5090 한 장으로도 간신히 돌아가는 수준이 아니냐는 의구심이 제기되고 있습니다. 현재 200만원 넘는 RTX 5080을 구매한 소비자조차도 쉽게 사용할 수 없는 것 아니냐는 우려가 나오는 대목입니다. 아무리 혁신적인 기술이라도 많은 사람들이 접근하기 어렵다면 그 의미는 제한적일 수밖에 없습니다. AI 그래픽 기술의 진정한 확산은 성능뿐 아니라 가격과 접근성까지 함께 해결될 때 가능할 것입니다.
  • 젠슨 황 “내년 매출 1500조원”… 삼성이 ‘차세대 AI칩’ 찍어낸다

    젠슨 황 “내년 매출 1500조원”… 삼성이 ‘차세대 AI칩’ 찍어낸다

    젠슨 황 엔비디아 최고경영자(CEO)가 16일(현지시간) 미국 새너제이 SAP 센터에서 열린 엔비디아의 연례 개발자 콘퍼런스(GTC 2026) 기조연설에서 “2027년 엔비디아가 맞이할 인공지능(AI) 칩 매출 기회가 1조 달러(약 1500조원)에 달할 것”이라고 선언했다. 지난 GTC에서 제시한 전망치보다 2배 커진 숫자에 현장에서는 환호성이 나왔다. 엔비디아는 이 새로운 전환을 현실화할 전략적 우군으로 삼성전자를 지목했다. 추론 특화 LPU ‘그록3’ 공개AI슈퍼컴퓨터 ‘베라 루빈’에 통합언어 추론 시간 줄여 효율 극대화그록 칩 80% ‘삼성 S램’으로 채워황 CEO는 최근 시장에서 제기된 ‘AI 버블’과 ‘빅테크의 자체 칩 개발’이라는 의구심을 정면 돌파했다. 황 CEO는 자신을 ‘토큰 킹’이라 부르며, AI 답변 생성 단위인 ‘토큰’을 ‘새로운 시대의 원자재’로 정의한 뒤 “엔비디아 시스템의 토큰당 생성 비용은 세계에서 가장 저렴하다”고 강조했다. 빅테크들이 막대한 고정비를 들여 직접 칩을 설계하는 것보다 엔비디아 생태계 안에서 토큰을 생산하는 것이 경제적이라는 의미다. 엔비디아는 이날 빠른 추론에 특화된 전용 칩인 언어처리장치(LPU) ‘그록3’를 공개하고, 이를 차세대 AI 슈퍼컴퓨터 ‘베라 루빈’에 통합한다고 밝혔다. 기존의 ‘루빈’ 그래픽처리장치(GPU)는 대규모 데이터 처리에 강하고 새로운 LPU는 언어 추론의 지연 시간을 줄인다. 이 둘을 함께 쓰면 성능과 효율을 모두 높일 수 있다는 의미다. 이 중 엔비디아식 고효율 비용 파괴를 실현할 그록3는 삼성전자가 평택 공장에서 위탁 생산하고 있다. 삼성이 제조한 그록 칩은 내부의 80%가 S램(SRAM)으로 채워져 전력당 토큰 처리량을 35배 높이는 ‘괴물 같은 성능’을 자랑한다. 황 CEO는 이날 기조연설 중 “삼성이 우리를 위해 칩을 제조해줘 정말 감사하다”고 이례적인 감사를 표했다. 해당 제품은 올해 3분기 말에서 4분기 초 양산에 들어갈 예정이다. 삼성전자는 메모리와 파운드리를 하나로 묶는 독보적인 ‘종합 반도체 업체’(IDM)의 면모를 보이며 화답했다. 삼성은 GTC 전시장에서 메모리업체 중 유일하게 차세대 GPU인 ‘베라 루빈’ 플랫폼에 HBM4, 저전력 메모리(SOCAMM2), 초고속 SSD가 모두 탑재된 실물 서버를 공개했다. 베라 루빈은 단일 칩을 넘어 CPU, GPU, 네트워크, 보안, 메모리를 시스템으로 통합한 아키텍처다. 삼성전자 독보적 종합 반도체 업체HBM4 등 탑재된 실물 서버 공개2나노 도입 계획… 기술 초격차 자신“성능 최적화 위해 선단 공정 불가피”황상준 삼성전자 메모리개발담당 부사장은 현장에서 “올해 HBM 생산량을 작년보다 3배 이상 늘리고 이 중 절반 이상을 6세대 HBM4로 채우겠다”며 프리미엄 시장 주도권을 확보하겠다는 뜻을 보였다. 차세대 로드맵도 구체화했다. 삼성은 현재 양산 중인 6세대 HBM4와 7세대 HBM4E 베이스 다이(HBM 맨 아래 탑재되는 핵심 부품)에 4나노 공정을 적용하고, 8세대 HBM5부터는 삼성 파운드리의 2나노 선단 공정을 전격 도입한다. 황 부사장은 “성능 최적화를 위해 선단 공정 활용은 불가피하다”며 기술 초격차에 대한 자신감을 드러냈다. 기조연설 직후 삼성전자 전시장을 찾은 황 CEO는 HBM4 코어다이에 ‘어메이징(Amazing) HBM4!’, 평택산 그록 웨이퍼에는 ‘그록 슈퍼 패스트’(Groq Super Fast)라고 서명하며 기술력을 공인했다. 이튿날인 18일에는 리사 수 AMD CEO도 삼성 평택캠퍼스를 방문해 파운드리 협력 확대를 논의할 예정이다. 엔비디아와 AMD라는 반도체 양강이 동시에 삼성에 손을 내미는 셈이다. 젠슨 황 “어메이징 HBM4”평택산 웨이퍼에 ‘슈퍼 패스트’ 서명AMD CEO도 오늘 평택공장 방문반도체 2강, 삼성전자에 손 내밀어이날 엔비디아는 삼성전자가 생산하는 그록 LPU를 포함한 차세대 로드맵을 발표했다. 황 CEO는 차세대 GPU인 ‘루빈’ 아키텍처를 기반으로 144개의 GPU를 연결하는 ‘루빈 울트라’ 시스템을 공개했다. 여기에 에이전트 AI 연산을 지휘할 차세대 CPU ‘로자’, 그리고 루빈의 뒤를 이을 차차세대 GPU ‘파인만’을 차례로 발표했다. 특히 소프트웨어 플랫폼 ‘네모클로’를 소개하며 AI가 스스로 작업을 수행하는 ‘에이전트’ 개발 생태계까지 엔비디아 내에 구축하겠다는 야심을 드러냈다. 연설 말미에는 지상 너머 우주 데이터센터인 ‘베라 루빈 스페이스 원’을 깜짝 공개하며 우주에서도 가속 컴퓨팅이 가동되는 시대를 예고했다.
  • ‘AI 거품론’ 잠재운 엔비디아… K반도체, 더 높이 날아오른다

    ‘AI 거품론’ 잠재운 엔비디아… K반도체, 더 높이 날아오른다

    엔비디아가 역대 최고 매출을 기록하며 시장의 ‘인공지능(AI) 거품론’을 잠재웠다. 이에 엔비디아의 차세대 제품인 ‘루빈(Rubin)’과 6세대 고대역폭메모리(HBM4)에 핵심 역할을 하는 삼성전자와 SK하이닉스의 고공비행이 지속될 것으로 보인다. 엔비디아는 25일(현지시간) 회계연도 4분기 매출이 681억 3000만 달러(약 98조원)를 기록했다고 공시했다. 이는 전년 동기 대비 73% 증가한 수치로 시장 전망치(662억 달러)를 크게 웃돌았다. 매출의 91% 이상인 623억 달러가 데이터센터 부문에서 발생했다. 또 총마진율은 75%를 기록해 반도체 시장에서 공급자가 여전히 우위에 있음을 재확인했다. 성장의 기세는 하반기 차기 라인업으로 이어진다. 젠슨 황 CEO는 컨퍼런스 콜에서 “에이전트형 AI의 변곡점을 맞이하면서 컴퓨팅 수요가 기하급수적으로 늘고 있다”며 “거의 모든 고객이 베라 루빈 칩을 구매할 것으로 예상한다”고 밝혔다. 엔비디아는 미국의 규제로 인한 중국 시장 내 데이터센터 매출을 제외하고도 다음 분기 매출 전망치를 월가 예상치를 상회하는 780억 달러(약 112조원)로 제시했다. 엔비디아의 차기 플랫폼인 ‘루빈’ 출시에 맞춰 삼성전자는 지난 12일 세계 최초로 HBM4를 양산 출하했다. 엔비디아의 최대 파트너사인 SK하이닉스가 전체 물량의 약 65%를 배정받을 것으로 추산되는 가운데, 삼성전자 역시 약 30%의 점유율을 확보하고 있다. 특히 엔비디아가 최근 불안정해진 공급망을 안정시키려 두 회사 모두 핵심 파트너로 삼고 더욱 긴밀한 관계를 맺을 것이라는 분석도 나온다. SK하이닉스는 이날 ‘HBM’의 성공을 이을 차세대 솔루션인 고대역폭플래시(HBF)를 전격 공개하며 영토 확장에 나섰다. 메모리 전문기업 샌디스크와 손잡고 HBF의 글로벌 표준화를 추진하기로 했다. AI 서비스의 중심이 ‘학습’에서 ‘추론’으로 이동하는 시점을 선제 공략하려는 포석으로 읽힌다. HBF는 HBM의 고성능과 SSD의 대용량 특성을 결합했다. 컴퓨팅 수요가 급증할수록 메모리 공급자가 시장의 주도권을 쥐는 ‘슈퍼 을’ 현상은 심화할 전망이다. 아무리 연산 장치의 성능이 뛰어나도 데이터를 공급하는 메모리 속도가 받쳐주지 못하는 ‘메모리 벽’ 현상이 발생하기 때문이다. 이에 따라 엔비디아의 차세대 GPU 로드맵에 맞춘 삼성전자와 SK하이닉스의 기술 개발 일정은 전체 AI 생태계의 성장 속도를 결정짓는 핵심 변수가 됐다. 이에 글로벌 투자은행 맥쿼리는 지난 24일(현지시간) 삼성전자와 SK하이닉스의 목표주가를 각각 34만원과 170만원으로 대폭 상향했다.
  • ‘2026년 지속가능한 AI 전환 전략’ 발표

    ‘2026년 지속가능한 AI 전환 전략’ 발표

    AI·데이터 인프라 솔루션 전문기업 HS효성인포메이션시스템이 기업 환경 변화에 대응하기 위한 ‘2026년 지속가능한 AI 전환 전략’을 발표했다. 25일 HS효성인포메이션시스템에 따르면 이번 전략의 핵심은 크게 네 가지로 구성된다. ‘파트너 에코시스템 강화’, ‘프라이빗 클라우드(Private Cloud) AI 인프라 확대’, ‘HS효성 AI 플랫폼 고도화’, ‘VSP One 데이터 플랫폼 강화’ 등이다. HS효성인포메이션시스템은 GPU 서버, 고성능 스토리지, 저전력 Arm 서버, 데이터 레이크, AIOps 등을 통합한 ‘HS효성 AI 플랫폼’을 통해 구축부터 운영까지 AI 인프라 전 과정을 지원하고 있다. 향후 DataOps, MLOps, LLMOps, AI 에이전트 등 활용 고도화 영역까지 포트폴리오를 확대한다는 계획이다. 또한 AI 연산 최적화를 중심으로 빠르게 진화하는 클라우드 환경에 맞춰 프라이빗 클라우드 기반 AI 인프라 수요에도 대응하고 있다. GPU 자원 관리와 AI 워크로드 운영을 통합한 ‘UCP 프라이빗 클라우드 AI’ 솔루션을 통해 모델 학습부터 추론, 운영까지 지원하는 풀스택 환경을 제공한다. 데이터 인프라 부문에서는 스토리지와 소프트웨어 정의 스토리지를 통합한 ‘VSP One’ 포트폴리오를 중심으로 랜섬웨어 대응과 재해복구 역량을 강화하고 있다.
  • AI가 인간 의사보다 ‘진료 판단’ 정확했다

    AI가 인간 의사보다 ‘진료 판단’ 정확했다

    인공지능(AI)이 실제 환자 사례를 분석한 결과 의료진보다 더 높은 진단 정확도를 보였다는 연구 결과가 나왔다. 다만 연구진은 AI가 의사를 대신하기보다는 복잡한 판단을 돕는 보조 도구로 활용될 가능성이 크다고 선을 그었다. 연세대 의대 본과생들과 용인세브란스병원 교수 연구팀은 오픈AI의 멀티모달·추론 인공지능 모델의 임상 판단 성능을 의료진과 비교·분석한 결과를 10일 발표했다. 연구팀은 2011년부터 2024년까지 의료 교육 플랫폼 ‘메드스케이프’에 공개된 환자 사례 1426건을 활용했다. 각 사례에는 병력과 검사 수치뿐 아니라 엑스레이(X-ray), 컴퓨터단층촬영(CT), 자기공명영상(MRI), 심전도, 병리 슬라이드 등 총 917건의 의료 영상이 포함돼 실제 진료 현장과 유사한 조건을 갖췄다. 분석 결과 다수 의료진이 선택한 답안의 평균 정확도는 85.0%였다. 반면 오픈AI ‘GPT-4o’ 모델은 88.4%, 최신 추론 모델 ‘o1’은 94.3%의 정확도를 기록했다. 특히 o1은 진단뿐 아니라 질병 특성 파악, 검사 계획 수립, 치료 방향 설정 등 전 과정에서 90% 이상의 성능을 유지했다. 같은 사례를 다섯 차례 반복 분석한 결과에서도 AI의 판단은 비교적 일관됐다. o1 모델은 90.7%의 사례에서 다섯 번 모두 같은 정답을 제시했다. 연구진은 “단순한 우연이나 무작위 선택이 아닌 체계적인 추론을 바탕으로 답을 도출했음을 보여주는 결과”라고 설명했다. 배성아·박진영 용인세브란스병원 교수는 “AI가 텍스트와 의료 영상을 통합해 실제 임상의 수준 판단을 내릴 수 있다는 점을 객관적으로 입증한 사례”라면서도 “이는 AI가 의료진의 판단을 대체한다기보다, 복잡한 임상 상황에서 의사 결정을 보조하고 안전성을 높이는 도구로 활용될 수 있음을 보여준다”고 밝혔다. 연구 결과는 국제 의학 학술지 ‘메디신(볼티모어)’ 최신 호에 게재됐다.
  • 엔비디아 천하 끝낸다… MS도 AI칩 독립선언

    엔비디아 천하 끝낸다… MS도 AI칩 독립선언

    구글·아마존도 자체 칩 본격화삼성·SK, HBM 다변화 기회로 글로벌 인공지능(AI) 반도체 시장이 범용 성능을 앞세운 ‘엔비디아 표준’과 비용·전력 효율을 극대화한 ‘빅테크 전용 칩’ 간에 2차 경쟁 국면으로 진입했다. 구글과 아마존에 이어 마이크로소프트(MS)까지 독자 AI 가속기를 공개하며 자체 칩 생태계를 확대한 가운데, SK하이닉스가 MS의 신규 가속기에 고대역폭메모리(HBM)를 단독 공급하는 등 우리나라 반도체 산업의 선전은 계속될 전망된다. MS는 26일(현지시간) 자체 개발한 AI 가속기 ‘마이아 200’을 공개하고 “MS가 지금까지 배포한 추론 시스템 가운데 가장 효율적이며, 현재 운영 중인 최신 시스템 대비 달러당 성능이 30% 더 좋다”고 밝혔다. 마이아200은 대만 TSMC의 3나노 공정을 적용한 주문형 반도체(ASIC) 기반 칩으로, 대규모 AI 추론 작업의 효율을 극대화한다. 마이아 200에는 총 216GB의 5세대 고대역폭 메모리(HBM3E)가 탑재됐고, SK하이닉스가 12단 HBM3E를 단독 공급하는 것으로 알려졌다. 구글과 아마존웹서비스(AWS) 역시 엔비디아 의존도를 낮추기 위한 행보를 이어가고 있다. 구글은 브로드컴과 공동 설계한 텐서처리장치(TPU) ‘트릴리움’을 고도화해 자사 AI 서비스 전반에 적용 중이며, AWS는 AI 학습에 특화된 전용 칩 ‘트레이니엄’을 중심으로 자체 칩 전략을 확대하고 있다. 이들 전용 칩은 범용 연산에 강점을 지닌 GPU와 달리, AI 연산의 핵심인 행렬 계산에 자원을 집중하는 구조로 설계돼 비용과 전력 효율을 크게 끌어올린 것이 특징이다. 엔비디아는 이에 맞서 차세대 플랫폼 ‘루빈(Rubin)’을 통해 기술 격차를 다시 벌리겠다는 전략을 내세우고 있다. 루빈은 차세대 고대역폭 메모리인 HBM4를 기반으로 성능과 확장성을 동시에 강화하는 것이 핵심으로, 자체 AI 칩 확산에 ‘절대 성능’으로 대응하겠다는 구상으로 해석된다. 이 같은 ‘탈 엔비디아’ 흐름은 국내 메모리 반도체 업계에는 오히려 기회로 작용하고 있다. SK하이닉스는 MS의 마이아 200을 비롯해 구글, AWS 등 글로벌 빅테크의 자체 AI 전용 칩으로 HBM 공급처를 빠르게 넓히며 시장 1위의 입지를 공고히 하고 있다. AI 학습에서 추론으로 무게중심이 이동하는 2차 경쟁 국면 역시 고성능 메모리 수요를 확대하는 요인으로 작용하고 있다. 삼성전자는 최근 엔비디아와 AMD가 진행한 HBM4 관련 품질 테스트에서 긍정적인 평가를 받은 것으로 전해졌고, 차세대 제품 양산을 목표로 준비에 속도를 내고 있다.
  • 골렘 x 샐러드 연합, ‘기존 대비 10분의 1 비용으로 저렴’… GPU 렌더링 시장 가격 파괴 예고

    골렘 x 샐러드 연합, ‘기존 대비 10분의 1 비용으로 저렴’… GPU 렌더링 시장 가격 파괴 예고

    3D 렌더링 및 클라우드 컴퓨팅 시장에서 골렘 네트워크(Golem Network)와 샐러드(Salad)의 전략적 파트너십이 업계의 주목을 받고 있다. 13일 발표된 파트너십의 핵심은 샐러드가 보유한 대규모 분산형 GPU 인프라를 골렘의 탈중앙화 프로토콜 위에서 구동하는 것이다. 양사는 이를 통해 고비용 구조인 기존 렌더링 시장의 비효율을 개선하겠다는 계획이며, 업계에서는 이번 결합이 가져올 가성비에 주목하고 있다. 양사가 공개한 벤치마크 데이터에 따르면 RTX 2070급 그래픽카드를 기준으로 블렌더(Blender) 렌더링 작업을 수행할 경우 샐러드의 유휴 자원 활용 모델은 시간당 약 0.02달러 수준으로 이용 가능하다. 이는 기존 업계 주요 경쟁 서비스들의 이코노미 요금(시간당 약 0.27달러 선) 대비 약 10분의 1 수준의 비용으로 동일한 블렌더(Blender) 렌더링 작업을 수행할 수 있게 된다. 골렘 네트워크의 안정적인 결제 및 리소스 할당 기술에 샐러드의 방대한 하드웨어 공급망이 더해지면서 3D 렌더링뿐만 아니라 AI 추론, 신약 개발 시뮬레이션 등 고성능 연산이 필요한 다양한 워크로드를 유연하게 지원할 수 있게 됐다. 카일 도슨(Kyle Dodson) 샐러드 CTO는 “골렘과의 협력을 통해 비용 효율성과 컴퓨팅 오케스트레이션을 더욱 강화할 것”이라고 밝혔다. 이번 파트너십은 고비용 문제로 어려움을 겪던 기존 렌더링 플랫폼 사용자들에게 새로운 선택지를 제공하며 시장 점유율을 빠르게 확대할 것으로 전망된다.
  • 젠슨 황 “첫 자율주행차 1분기에 출시” 리사 수 “GPU 연산 능력 10배로 향상”

    젠슨 황 “첫 자율주행차 1분기에 출시” 리사 수 “GPU 연산 능력 10배로 향상”

    엔비디아 내년 로보택시 서비스차세대 슈퍼칩 ‘베라 루빈’도 공개AMD 새 GPU ‘MI455X’로 맞불 세계 최대 인공지능(AI) 반도체 기업인 엔비디아가 메르세데스 벤츠와 손잡고 올해 1분기 자율주행차를 출시한다. 또 내년에는 로보택시 서비스를 개시한다. 자율주행차를 앞세워 피지컬 AI의 본격 상용화를 선언한 것이다. 젠슨 황 엔비디아 최고경영자(CEO)는 5일(현지시간) 미국 라스베이거스 퐁텐블로 호텔에서 열린 ‘CES 2026 특별 연설’을 통해 자율주행 차량 플랫폼 ‘알파마요’를 공개한 뒤 “엔비디아가 첫 자율주행 차량을 출시한다. 미국은 1분기, 유럽은 2분기, 아시아는 3~4분기로 예정됐다”고 말했다. 알파마요는 카메라와 각종 센서 입력을 종합해 주변 상황을 이해한 뒤 적합한 운전 결정을 내리는 AI로 신형 메르세데스 벤츠 CLA에 우선 적용된다. 엔비디아는 내년부터 파트너사들과 함께 운전자 개입이 필요하지 않은 레벨4 수준의 자율주행 로보택시도 시험 운영할 계획이다. 황 CEO는 이와 함께 현재 ‘그레이스 블랙웰’(GB)을 잇는 차세대 슈퍼칩 ‘베라 루빈’(VR)을 전격 공개하며 이르면 올해 하반기에 출시한다고 예고했다. ‘베라 루빈 NVL72’는 기존 GB 기반 제품 대비 추론 성능이 5배 뛰어나며, AI 모델이 데이터를 처리하는 토큰당 비용을 10분의1 수준으로 낮췄다. 미국 반도체 기업 AMD의 리사 수 CEO도 이날 라스베이거스 베네시안 호텔에서 기조연설을 통해 신형 GPU ‘인스팅트 MI455X’ 등을 공개하며 엔비디아에 맞불을 놨다. 인스팅트 MI455X GPU는 오픈AI를 비롯한 AI 기업의 데이터 서버를 구축하는 데 사용된다. 수 CEO는 “이전 모델(MI335X)보다 연산 성능이 10배 이상 좋아졌다”고 말했다.
  • 미스터 ‘아틀라스’… “저 공장에 붙었대요”

    미스터 ‘아틀라스’… “저 공장에 붙었대요”

    관절 360도 꺾고, 손엔 촉각 센서… “인간처럼 인간과 일해요”구글 손잡고 제미나이 두뇌 장착2028년 현대차 미국 공장에 투입 현대자동차그룹이 구글의 인공지능(AI) 조직 딥마인드와 손잡고 인간과 로봇이 협업하는 ‘차세대 로보틱스 생태계’를 구축하겠다고 선언했다. 최대 50㎏의 짐을 들고, 손을 뻗으면 2.3m 높이까지 도달하는 AI 로봇 ‘아틀라스’가 2028년부터 현대차 공장에서 직원들과 함께 일한다. 완성차 업체에서 ‘인간·로봇 협업 사회’를 이끌 피지컬 AI 선도기업으로 변신하겠다는 것이다. 현대차그룹은 5일(현지시간) 미국 라스베이거스 만달레이베이 컨벤션센터에서 ‘CES 2026 미디어데이’를 열고 미국 내 로보틱스 계열사 보스턴다이내믹스와 구글 딥마인드가 ‘미래 휴머노이드 기술 개발 가속화를 위한 전략적 파트너십’을 맺었다고 밝혔다. 운동 능력을 가진 보스턴다이내믹스 아틀라스에 지능을 보유한 딥마인드의 AI 모델 제미나이를 결합해 로봇이 인지·추론하고 인간과 자연스럽게 상호작용하도록 하는 구상이다. 현대차그룹은 이를 위해 올해 미국 내에 ‘로봇 메타플랜트 응용센터’(RMAC)를 개소한다. 지난해 세계 최대 반도체 기업 엔비디아와 피지컬 AI 역량 고도화를 위한 업무협약을 체결한 데 이어 글로벌 선도 기업들과 협력 체제를 가속하는 모습이다. 현대차그룹이 이날 최초로 공개한 휴머노이드 로봇 아틀라스는 제조 현장에 투입되는 ‘개발형 모델’과 핵심 기능을 테스트하는 ‘연구형 모델’로 나뉜다. 이날 아틀라스 연구형 모델은 컨벤션센터 무대 왼쪽에서 누웠다가 일어서 중앙으로 걸어 나온 뒤 청중들에게 손을 흔들었다. 이어 무대 앞으로 걸어가 목, 어깨, 허리, 손목 등 여러 관절을 360도로 회전시켰다. 곧바로 바닥에 떨어진 물건을 줍는 시늉을 하고 손을 뻗어 물건을 꺼내는 듯 섬세한 손놀림도 보였다. 무대 오른편으로 걸어가 멈춰 서더니 두 손을 뻗어 무대 끝에 등장한 아틀라스 개발형 모델을 손으로 가리키기도 했다. 가장 구현이 어렵다는 손가락의 섬세한 동작들도 자연스러운 구도로 완벽하게 보여 줬다. 아틀라스 연구형 모델은 360도 회전하는 관절을 갖췄다. 개발형 모델도 56개의 자유도(DoF·독립적으로 움직일 수 있는 방향의 수)를 갖춰 대부분의 관절이 완전히 회전할 수 있고 사람과 유사한 크기의 손에 촉각 센서를 탑재했다. 또 360도 카메라를 통해 모든 방향을 인식할 수 있다. 사람과 비슷한 키 1.9m에 무게 90㎏으로 최대 50㎏의 무게를 들 수 있고 손을 뻗으면 2.3m 높이까지 도달할 수 있다. 내구성이 뛰어나 섭씨 영하 20도에서 영상 40도 환경에서도 완전한 성능을 발휘하고 방수 기능을 갖춰 세척이 가능하다. 대부분의 작업을 하루 이내에 학습하는 능력을 갖췄고, 배터리가 부족해지면 스스로 충전소로 이동해 배터리를 교체하고 즉시 작업을 재개할 수 있도록 설계됐다. 아틀라스는 현대차그룹의 RMAC에서 로봇이 최적의 행동을 자체 설계하는 ‘매핑 기반 학습’을 통해 사전 훈련을 거친 뒤 실제 생산 현장인 미국 조지아주 메타플랜트 아메리카(HMGMA) 공장에 투입돼 실전 데이터를 쌓는다. 로봇이 RMAC에서 학습한 훈련 데이터와 HMGMA에서 학습한 실전 데이터가 순환적 시너지 구조를 거듭해 사람과 함께 일하는 법을 배우고 진화하는 식이다. 현대차그룹은 2028년부터 아틀라스를 HMGMA에서 부품 분류와 같은 쉬운 작업에 투입하고, 2030년부터는 부품 조립까지 작업 범위를 넓혀 단계적으로 국내외 생산 현장 전반으로 확대한다는 방침이다. 아울러 축적된 데이터는 로봇을 넘어 자율주행 기술에도 이식돼 테슬라 등 선두 주자와의 격차를 좁힐 동력이 될 전망이다. 현대차그룹은 내부 계열사 역량을 총결집해 AI 로보틱스 생태계를 조성해 나가겠다는 계획이다. 연구개발, 학습·검증, 양산, 서비스 운영에 이르는 통합 관리 체제를 마련하고 2028년까지 연간 3만대의 로봇 생산 시스템을 구축하겠다는 목표다. 이를 위해 현대차·기아는 제조 인프라, 공정 제어, 생산 데이터 등을 제공하고 현대모비스는 정밀 액추에이터 개발, 현대글로비스는 물류·공급망 흐름 최적화를 담당한다. 현대차그룹은 로봇에 대한 구독 서비스 ‘원스톱 RaaS’도 도입할 계획이다. 장재훈 현대차그룹 부회장은 산업 현장의 로봇 도입으로 인한 일자리 축소 우려에 대해 “로봇은 단순히 노동을 대체하는 것이 아니다”라며 “단순 반복적이거나 위험해서 기피하는 노동에 대해 생산성 있는 로봇을 투입하고 그 로봇과 관련된 새로운 노동이 생겨나는 것이 중요하다”고 설명했다. 경쟁사에 비해 뒤진다고 평가받는 자율주행차 기술과 관련해서는 “글로벌 업체들과 함께함으로써 시장에 확신을 줄 수 있는 부분을 조만간 말씀드릴 수 있고 절대 늦지 않을 것이라고 생각한다”고 했다.
  • SK하이닉스, HBM4 16단 첫 공개… AI 메모리 신화 이어간다

    SK하이닉스, HBM4 16단 첫 공개… AI 메모리 신화 이어간다

    SK하이닉스가 미국 라스베이거스에서 열리는 ‘CES 2026’에 기업고객용 전시관을 열고 ‘고대역폭메모리(HBM)4 16단 48GB’를 처음 선보인다고 6일 밝혔다. HBM4 16단 48GB는 현재 업계 최고 속도인 11.7Gbps(초당 11.7기가비트)를 구현한 HBM4 12단 36GB의 후속 모델로 글로벌 초격차를 가속하는 데 일조할 것으로 보인다. 또 올해 전체 HBM 시장을 선도할 ‘HBM3E 12단 36GB’도 전시된다. HBM3E 12단 36GB는 엔비디아의 최신 인공지능(AI) 서버용 그래픽처리장치(GPU)에 탑재되는 모델이다. 이번 전시장에는 GPU 모듈을 함께 전시해 SK하이닉스의 HBM3E 12단 36GB가 AI 시스템 내에서 하는 역할을 시각적으로 구체화해 보여 줄 예정이다. 곽노정 대표이사(사장), 김주선 AI 인프라 사장(CMO) 등 SK하이닉스 임원진은 이날 오후 라스베이거스 퐁텐블로 호텔에서 열린 젠슨 황 엔비디아 최고경영자(CEO)의 특별 연설 직후 이곳을 찾아 엔비디아 측 인사들과 만났다. 엔비디아에 HBM4, HBM3E 등을 공급하는 핵심 협력사로서의 입지를 공고히 하는 행보로 보인다. 또 SK하이닉스 전시관엔 AI 서버에 특화돼 AI 서버 수요가 폭증할 경우에 대비한 저전력 메모리 모듈 ‘소캠2’도 전시된다. 온디바이스 AI 구현에 최적화된 차세대 저전력 메모리 LPDDR6도 선보인다. 낸드 분야에서는 AI 데이터센터 구축 확대로 수요가 급증하는 초고용량 기업용 메모리 저장장치(eSSD)에 최적화된 321단 2Tb 쿼드레벨 셀(QLC) 제품도 공개된다. QLC는 전력 효율과 성능을 크게 개선해 데이터센터의 저전력 환경에 적합하다. 이런 솔루션들이 실제 AI 생태계에서 어떻게 연결돼 움직이는지 살펴볼 수 있는 ‘AI 시스템 데모존’도 마련됐다. 특히 데모존에서는 고객 요청 사항을 반영해 GPU 등에 있던 일부 기능을 HBM에 옮기는 고객 맞춤형 cHBM(커스텀 HBM)의 내부 구조를 직접 확인할 수 있는 대형 모형이 등장한다. 해당 전시는 AI의 경쟁 축이 단순 성능에서 추론 효율과 비용 최적화로 이동하고 있다는 것을 보여 준다.
  • [포토] 로봇과 함께 기조연설하는 젠슨 황

    [포토] 로봇과 함께 기조연설하는 젠슨 황

    젠슨 황 엔비디아 최고경영자(CEO)는 5일(현지시간) 미국 라스베이거스 퐁텐블로 호텔 블로라이브 극장에서 개최한 ‘CES 2026’ 기조연설에서 베라 루빈을 전격 공개했다. 중앙처리장치(CPU) ‘베라’ 36개와 그래픽처리장치(GPU) ‘루빈’ 72개를 하나로 구성한 ‘베라 루빈 NVL72’는 기존 GB 기반 제품 대비 추론 성능이 5배에 달하고, 토큰당 비용은 10분의 1 수준으로 낮췄다. 모델 훈련에 필요한 GPU 수도 4분의 1로 줄였다. 이에 따라 기업들이 기존보다 훨씬 적은 비용으로 대규모 AI 모델을 운용할 수 있을 것으로 보인다. 엔비디아는 현재 블랙웰 제품이 시장에서 좋은 반응을 보이는 상황에서 베라 루빈을 조기에 공개했다. 황 CEO는 “우리는 단 1년도 뒤처지지 않고 매년 컴퓨팅 기술 수준을 발전시켜야 한다고 생각했다”며 “그러기 위해서는 지금쯤 생산에 들어가야 한다. 그래서 베라 루빈은 현재 본격적인 양산 단계에 있다”고 강조했다 엔비디아는 루빈 기반 제품이 올해 하반기 시장에 출시된다고 예고했다. 사진은 젠슨 황 CEO가 미국 네바다주 라스베이거스 퐁텐블로 호텔에서 열린 엔비디아 CES 2026 라이브에서 로봇과 함께 기조연설을 하고 있다.
  • 2026 Tech Trend

    2026 Tech Trend

    2026년에는 실험단계였던 첨단기술이 일상 속에서 공존할 전망이다. 인공지능(AI)은 기존의 모델 경쟁을 넘어 인프라 전쟁으로 확대하고, 스마트폰 영역에선 글로벌 ‘접기 대전’이 예상된다. 연이은 개인정보유출 사태로 위기감이 커진 보안 분야에서는 ‘AI 창’ 대 ‘AI 방패’의 승부가 펼쳐질 전망이다. 이런 변화를 감지할 첫 무대는 오는 6일(현지시간) 미국 라스베이거스에서 열리는 CES다. AI 인프라 전쟁뭉쳐라!… 전력부터 칩까지 AI 한꺼번에글로벌 빅테크의 AI 경쟁은 더 이상 모델 성능 향상에만 머물지 않는다. 실제 서비스를 얼마나 안정적으로, 장기간 운영할 수 있냐가 경쟁의 새로운 축이다. 따라서 전력·데이터센터·반도체 등 기초 인프라 구축이 핵심으로 떠오르고 있다. 월스트리트저널(WSJ)은 “AI 투자 경쟁은 소프트웨어를 넘어 데이터센터와 반도체, 전력 인프라로 옮겨가고 있다”며 “추론 비용을 낮추지 못하는 기업은 장기 경쟁에서 밀릴 수밖에 없다”고 짚었다. 영상 생성, 로봇 제어 등 연산량과 전력 소모가 큰 서비스가 상용화 단계에 접어들면서 기존의 전력망과 범용 서버 등으로는 수요를 감당하기 어렵다는 것이다. 이에 구글은 최근 약 7조원을 투입해 에너지 인프라 기업 ‘인터섹트’를 인수했다. 데이터센터 전력을 외부망에만 의존하지 않고, 발전 설비와 데이터센터를 한 부지에 통합해 장기적으로 전력 수급 안정성을 꾀하려는 것이다. 오픈AI 진영이 공공 전력망과 분리된 초대형 데이터센터 프로젝트 ‘스타게이트’를 추진하고, 아마존웹서비스(AWS)가 원전 및 소형모듈원자(SMR) 협력으로 독자적인 전력 공급망 구축에 나선 것도 같은 맥락이다. 삼성전자와 SK하이닉스는 글로벌 AI 인프라 경쟁의 핵심 축으로 부상하고 있다. 양사는 올해 6세대 고대역폭 메모리(HBM4) 양산에 본격 돌입하며, AI 서버의 연산 병목을 해소할 핵심 공급사로 주목받고 있다. 업계에서는 HBM을 포함한 AI 특화 메모리 수요가 가파르게 늘어나면서 범용 D램 중심이던 메모리 시장의 수익 구조가 재편될 것으로 보고 있다. 피지컬 AI붙여라!… 자율주행 등 AI 제품 결합 가속지난해까지 AI가 모니터 속 학습·추론 경쟁에 몰두했다면 올해는 자동차·로봇·생활용품 등과 결합하는 ‘피지컬 AI’가 구체화할 전망이다. 삼정KPMG 경제연구원은 세계 최대 가전·정보기술(IT) 박람회 ‘CES 2026’의 첫 번째 키워드로 ‘피지컬 AI’를 꼽으며 “단순 자동화를 넘어 물리적 환경을 이해·판단·조작하는 AI 디바이스가 다수 공개되고, 제조·건설·물류·서비스 등 다양한 분야에서의 실질적 적용 가능성이 구체적으로 제시될 것”이라고 예상했다. 대표적으로 모빌리티에선 실험 단계였던 자율주행 시장이 올해 크게 확대될 전망이다. 지난해 미국에서 무인 로보택시를 운영한 구글의 자율주행 자회사 ‘웨이모’는 올해 차량 호출 앱 ‘웨이모 원’을 내놓으며 대중을 상대로 서비스를 확대할 예정이다. 중국에선 바이두의 자율주행 자회사 ‘아폴로 고’가 자율주행 레벨4(고도자동화) 수준의 로보택시를 상용화하며 웨이모를 바짝 추격하고 있다. 우리나라의 경우 현대차그룹의 자회사 ‘포티투닷’이 오는 8월 첫 자율주행 실험차 ‘SDV 페이스카’를 공개할 예정이다. 지난해 스마트홈 각축전을 벌였던 가전 분야와 단순 자동화 극복이 과제인 산업 분야에서 기업들은 올해 AI를 탑재한 휴머노이드를 앞다퉈 내놓을 예정이다. LG전자는 CES 2026에서 다섯 손가락을 갖춰 집안일에 최적화된 가전용 휴머노이드 ‘클로이드’를 공개한다. 보스턴다이내믹스도 휴머노이드 ‘아틀라스’를 처음 선보인다. AI가 접목된 웨어러블 기기도 경쟁이 치열할 전망이다. 메타가 지난해 선보인 스마트 안경 ‘레이밴 메타’로 시장을 선점하는 가운데 구글은 올해 중 자사 AI인 ‘제미나이’가 탑재된 스마트 안경을 출시한다. 스마트폰접어라!… 몇 번이든, 차세대 폴더블폰 전쟁스마트폰 시장에서는 대형 화면을 접는 ‘폴더블폰’이 주류 프리미엄 폼팩터(기기 형태)로 자리매김하며 글로벌 싸움이 치열해질 것으로 보인다. 지난해 삼성전자는 두 번 접히는 ‘갤럭시 트라이폴드’를 선보이며 중국 화웨이가 독점하던 트라이폴드 경쟁에 뛰어들었다. 갤럭시 트라이폴드는 360만원이라는 초고가에다 한정된 물량만 시중에 푸는 ‘플래그십’을 펼쳤지만 연일 완판 행진을 했다. 올해는 중국 샤오미와 미국 애플이 트라이폴드 시장에 진입할 것으로 보인다. 샤오미타임 등 외신에 따르면 샤오미는 지난해 세계이동통신사업자연합회(GSMA)에 신제품을 등록했는데, 태블릿 사이즈로 펼쳐지는 트라이폴드형일 가능성이 거론된다. 애플 역시 아이폰18 시리즈와 함께 자사 첫 폴더블폰인 ‘아이폰 폴드’ 모델을 준비 중이다. 양산 막바지인 세부 디자인 조정 단계에 진입한 것으로 전해지면서 출시가 임박한 것으로 예측된다. 아이폰 팬층의 탄탄한 수요를 고려하면 아이폰 폴드 출시와 함께 폴더블폰 시장이 요동칠 수 있다. 시장 조사 기관인 IDC는 아이폰 폴드의 출시로 세계 폴더블폰 시장이 올해 30% 성장할 것으로 예측했다. 해킹막아라!… 뚫리면 끝장, 보안 단속에 사활안랩은 지난해 말 발간한 ‘2025년 사이버 위협 동향 및 2026년 전망’ 보고서에서 첫 번째 보안 위협으로 ‘AI 기반 공격의 전방위 확산’을 꼽았다. 안랩은 “AI가 피해자의 환경을 분석하고 표적을 정확하게 타격할 수 있는 ‘적응형 공격’이 확대될 것”이라고 분석했다. 또 개인이 AI를 식별하기 어려울 정도로 기술이 발전하면서 딥페이크 등 AI를 악용한 정교한 피싱이 증가하고, AI를 활용한 해킹 신기술이 급속도로 발전하며 해킹의 진입 장벽을 낮출 것이라고 우려했다. 다만 AI에 따른 보안 위협에 대응하는 도구로도 AI가 부상할 전망이다. 보안업체 ‘시큐아이’는 ‘2026년 보안 트렌드’ 보고서에서 “공격과 방어 전반에 AI가 확산하며 사이버 보안이 본격적인 ‘AI 대 AI’의 경쟁 구도로 전환 될 것”이라고 분석했다. 김명주 AI안전연구소장은 “지난해보다 올해 생성형 AI로 만든 사진·영상을 식별하기가 훨씬 어려워졌고, 지방선거 등 큰 행사가 있는 만큼 AI 악용이 본격화될 것”이라며 “AI기본법이 시행되면 정부 차원에서도 AI 부작용에 대비하는 체계를 마련해야 한다”고 지적했다.
  • 초대규모·고난도 추론도…한국형 ‘소버린 AI’ 전쟁

    초대규모·고난도 추론도…한국형 ‘소버린 AI’ 전쟁

    SKT, 매개변수 500B AI 모델 발표네이버클라우드, 옴니모달 AI 2종LG, 엑사원 통한 품질·추론력 강조글로벌 선두와 격차 속 기반 구축 국가 주도의 ‘소버린 AI’를 둘러싼 기업 간 경쟁이 본격화됐다. 국가대표 인공지능(AI) 자리를 두고 각축전에 돌입한 5개 정예팀(네이버클라우드·SK텔레콤·LG AI연구원·업스테이지·NC AI)은 30일 서울 강남 코엑스 오디토리움에서 열린 ‘독자 AI 파운데이션 모델’ 1차 발표회에서 초대규모 모델, 효율 중심 설계, 산업 현장 적용 등 서로 다른 전략을 앞세워 한국형 AI 모델을 제시했고 1000여명의 관람객은 연신 탄성을 내뱉었다. 시선이 가장 집중된 발표는 SK텔레콤이었다. 도입 영상에 ‘페이커’가 등장하자 객석은 환호했다. 이어 공개된 ‘A.X K1’이 매개변수 500B(5000억개) 규모라는 설명이 나오자 분위기는 한층 달아올랐다. 발표 말미에는 최태원 SK그룹 회장이 영상 메시지로 “우리말 모델이 없으면 주도권을 가질 수 없다”며 독자 AI의 필요성을 강조했다. 네이버클라우드는 옴니모달 AI 모델 2종을 공개했다. 국내 최초로 텍스트·이미지·음성을 하나의 구조에서 함께 학습한 8B 규모의 네이티브 옴니모달 모델과 여기에 추론 및 도구 활용을 결합한 32B 모델이다. 네이버클라우드는 이들 모델을 토대로 추후 ‘초대규모 옴니모달 파운데이션 모델’을 선보인 뒤 산업·서비스별로 특화된 버티컬 AI로 확장한다는 계획이다. LG AI연구원은 규모보다 ‘질’을 내세웠다. 236B급 ‘K-엑사원’을 통해 고난도 추론과 판단 능력을 강조하며, 개발 목표로 잡았던 모델과 대비해 평균 성능이 웃돌았다는 수치를 제시했다. 단순한 크기 경쟁이 아니라 실제 운영 가능한 프런티어 AI를 지향한다는 메시지다. 유일한 스타트업인 업스테이지는 효율과 책임을 강조했다. 김성훈 업스테이지 대표는 “이건 투자 실험이 아니라 여러분들의 세금으로 하는 일”이라며 “목표는 분명하다. 글로벌 3강에 들어가는 것”이라고 밝혔다. 100B급 ‘솔라 오픈’을 출발점으로 단계적 확장을 예고했다. 산업 현장성을 전면에 내세운 NC AI는 이연수 대표가 직접 나서 제조·국방·게임 등 실제 현장 적용을 전제로 한 100B급 ‘VAETKI’와 단계적 고도화 로드맵을 제시하며 도메인 중심 전략을 분명히 했다. 이날 공개된 국내 모델들의 성과는 글로벌 AI 평가지표에서도 일부 확인됐다. 글로벌 AI 성능 평가기관 ‘아티피셜 애널리시스’의 인텔리전스 지수에 따르면 네이버클라우드가 이날 공개한 고성능 추론 모델은 44점을 기록했다. LG AI연구원과 업스테이지의 기존 모델은 각각 43점, 38점이었고 이날 공개된 최신 모델은 더 높은 점수를 기록할 것으로 보인다. 최상위권에는 각각 73점을 기록한 구글의 ‘제미나이 3 프로’와 오픈AI의 ‘챗GPT 5’가 자리하고 있다. 이런 격차에도 이번 프로젝트는 단기 순위 경쟁이 아니라 데이터 주권과 산업 적용력을 포함한 소버린 AI의 기반을 쌓는 과정에 가깝다는 게 중론이다. 과기정통부는 1차 평가 결과를 내년 1월 중 발표할 예정이다. 5개 정예팀 가운데 한 곳이 1차 평가에서 탈락하며, 이후 최종 1~2개 팀이 남을 때까지 약 6개월 주기로 경쟁이 이어진다.
  • ‘중국판 엔비디아’ 무어스레드, 차세대 AI 칩 공개… “딥시크급 충격 올 것”

    ‘중국판 엔비디아’ 무어스레드, 차세대 AI 칩 공개… “딥시크급 충격 올 것”

    중국의 칩 제조업체 무어스레드가 엔비디아 최신 칩과 비슷한 성능의 최신 제품을 공개했다. 중국 인공지능(AI) 딥시크가 챗GPT의 100분 1 가격으로 개발된 것처럼 1~2년 안에 저렴한 중국산 칩이 경쟁력까지 갖추는 ‘반도체의 딥시크 충격’이 올 것이란 전망도 나왔다. 홍콩 사우스차이나모닝포스트(SCMP)는 엔비디아 중국 시장 총괄 매니저를 역임하다 2020년 ‘중국판 엔비디아’로 불리는 무어스레드를 설립한 장젠중 최고경영자(CEO)가 지난 20일 ‘화산’과 ‘루산’이란 두 종류의 차세대 칩을 공개했다고 21일 전했다. 이들 칩의 명칭은 각각 중국의 유명한 산 이름에서 유래했다. 장 CEO는 “AI 학습 및 추론을 위해 설계된 화산 칩은 엔비디아의 최신 블랙웰과 비슷한 성능”이라고 밝혔다. 무어스레드는 화산 칩의 성능이 최근 미국 정부가 중국 수출을 허가한 H200을 능가한다고 주장했지만, 칩의 구체적인 사양은 공개하지 않았다. 루산 칩은 고성능 그래픽 처리에 특화된 제품으로, 장 CEO는 “루산 칩이 AAA급 게임(대규모 제작비가 투입된 게임)에서 15배 더 높은 게임 성능을 제공한다”고 주장했다. 그는 또 두 칩 모두 내년에 대량 생산에 들어갈 예정이라고 밝혔다. 지난 5일 상하이 증시에 성공적으로 상장하며 500% 가까운 주가 상승을 보인 무어스레드 주가는 22일 오전 최고 688위안(약 14만원)을 기록했다. 블룸버그통신은 “2026~2027년쯤 저렴하고 경쟁력 있는 중국산 반도체가 생산되는 ‘딥시크’와 같은 순간이 올 것”이라며 “이는 엔비디아와 그 공급망에 큰 혼란을 초래할 수 있다”고 전망했다. 한편 무어스레드의 성공적인 상장에 힘입어 상하이 비런테크놀로지, 쿤룬신, 쑤이위안커지 등 여러 중국 칩 업체들이 상하이나 홍콩 증시 상장을 기다리고 있다. 특히 쑤이위안커지는 엔비디아의 미국 경쟁사인 AMD 출신 직원들이 설립했다.
  • 중국 반도체의 딥시크 오나…무어스레드 “엔비디아와 성능 비슷”

    중국 반도체의 딥시크 오나…무어스레드 “엔비디아와 성능 비슷”

    ‘중국판 엔비디아’로 불리는 중국의 칩 제조업체 무어스레드가 엔비디아 최신 칩과 비슷한 성능의 최신 제품을 공개했다. 중국 인공지능(AI) 딥시크가 챗GPT의 100분의 1 가격으로 개발된 것처럼 1~2년 안에 저렴한 중국산 칩이 경쟁력까지 갖추는 ‘반도체의 딥시크 충격’이 올 것이라는 전망도 나왔다. 홍콩 사우스차이나모닝포스트는 엔비디아 중국 시장 총괄 매니저를 역임하다 2020년 무어스레드를 설립한 장젠중(59)이 지난 20일 ‘화산’과 ‘루산’이란 두 종류의 차세대 칩을 공개했다고 전했다. 각각 중국의 명산 이름을 딴 무어스레드의 칩에 대해 장은 “AI 학습 및 추론을 위해 설계된 화산 칩은 엔비디아의 최신 블랙웰과 비슷한 성능”이라고 밝혔다. 무어스레드는 지난 5일 상하이 증시에 성공적으로 상장하며 500% 가까운 주가 상승을 보였고, 22일 오전 최고 688위안(약 13만원)을 기록했다. 무어스레드의 화산 칩은 최근 미국 정부가 중국 수출을 허가한 H200을 능가한다는 주장이지만, 칩의 구체적인 사양은 공개하지 않았다. 도널드 트럼프 대통령은 중국 기술 발전을 관리한다는 전략적 판단에 따라 블랙웰은 금지하고 H200의 중국 수출은 허가했으나 중국 정부는 H200의 국내 판매를 아직 승인하지 않았다. 루산 칩은 고성능 그래픽 처리에 특화된 제품으로 장은 “루산 칩이 AAA급 게임(대규모 제작비가 투입된 게임)에서 15배 더 높은 게임 성능을 제공한다”고 주장했다. 무어스레드의 성공적인 상장에 힘입어 상하이 비런 테크놀로지, 쿤룬신, 텐슈지신, 쑤이위안커지 등 여러 중국 칩 업체들이 상하이 또는 홍콩 증시 상장을 기다리고 있다. 특히 쑤이위안커지는 엔비디아의 미국 경쟁사인 AMD 출신 직원들이 설립했다. 블룸버그 통신은 중국 반도체 제조업체들이 기술 자립이라는 국가적 목표 달성과 미국과의 AI 경쟁에서 승리하기 위해 기업공개 시장에 앞다투어 진출한다고 분석했다. 맷 톰스 바클레이즈 증권 아시아태평양 총괄은 통신에 “중국이 반도체 경쟁에서 빠르게 따라잡고 있어 2026~2027년 저렴하고 경쟁력 있는 중국산 반도체가 생산되는 ‘딥시크’와 같은 순간이 올 것”이라며 “이는 엔비디아와 그 공급망에 큰 혼란을 초래할 수 있다”고 전망했다.
위로