서울신문 검색

현 시대 AI 하드웨어 최강자…엔비디아 블랙웰 GPU [고든 정의 TECH+]

엔비디아는 AI 시대에 가장 가치가 치솟은 기업입니다. 현재의 AI 기술 중 상당 부분이 이 회사가 만든 GPU에 의존하고 있기 때문입니다. 오래전부터 GPU의 병렬 연산을 위해 CUDA 코어와 소프트웨어를 공개했고 이를 AI 연산에 활용하는 생태계를 구축해 왔기 때문에 지금 와서 다른 회사의 하드웨어로 이를 대체하기 힘든 것이 현실입니다. 오랜 경쟁자인 AMD도 데이터 센터 GPU를 계속 공개하고 있고 인텔도 새로운 AI 시장 공략을 위해 GPU를 공개했지만, 시장을 먼저 선점한 엔비디아의 아성을 깨뜨리기는 쉽지 않습니다. 이런 상황에서 새로 공개한 블랙웰 GPU는 반도체 미세 공정의 한계를 극복하고 AI 연산 성능을 높여 누구도 따라잡기 쉽지 않은 경쟁력을 유지하려는 의도로 풀이됩니다. 블랙웰 GPU는 TSMC의 4nm 공정의 개량형인 4NP 공정으로 제조되었습니다. 3nm 공정을 적용하지 않은 이유는 확실치 않지만, 비용 및 공급 부족 등이 이유가 된 것으로 보입니다. 하지만 그런 만큼 트랜지스터 집적도를 전 세대인 호퍼 (Hopper)보다 더 높이기 힘든 상황입니다. 800억 개의 트랜지스터를 집적한 호퍼 H100 GPU는 4nm 공정에서 다이(die, 웨이퍼에서 잘라낸 반도체 칩) 면적이 814㎟에 달합니다. 이는 현재 반도체 제조 기술에서 이론적인 다이 크기의 한계치에 거의 근접한 것으로 더 크기를 늘리기 쉽지 않습니다. 따라서 블랙웰 B200은 두 개의 다이를 연결하는 방법으로 2080억 개의 트랜지스터를 집적했습니다. 이런 접근법은 최근 점점 일반적인 추세가 되고 있습니다. 공정 미세화의 한계에 부딪힌 반도체 제조사들은 하나의 큰 칩 대신 여러 개의 작은 칩인 칩렛을 연결해 거대한 크기의 프로세서를 만들고 있습니다. 인텔, AMD, 애플이 모두 이 방법을 사용했고 이번에는 엔비디아도 이 방식을 적용해 트랜지스터 집적도를 대폭 늘렸습니다. 블랙웰 B200은 AI 연산에서 전 세대인 H100과 비교해서 최대 5배인 20페타플롭스의 성능을 지니고 있습니다. 물론 칩을 두 개 붙인 점을 생각하면 실제 성능은 2.5배라고 할 수 있는데, 실은 FP 8 연산의 절반 정도의 자원을 소모하는 FP 4 연산에서 그렇다는 이야기로 FP 8 기준으로 보면 AI 연산 능력은 절반 수준인 10페타플롭스가 최대입니다. 결국 칩 하나의 성능은 사실 1.25배 정도로 트랜지스터 수 증가를 생각하면 딱 그 정도의 성능 증가인 셈입니다. 하지만 그렇다고 해서 블랙웰이 아무 의미 없는 꼼수에 지나지 않는 것은 아닙니다. FP 4 연산만 해도 충분한 경우 AI 연산 속도를 크게 높일 수 있고 심지어 FP 4와 FP 8 연산의 중간을 원하는 고객을 위해 FP 6까지 지원하는 기능을 갖춰 더 유연한 AI 연산이 가능합니다. 그보다 더 중요한 점은 AI 경쟁이 격화되면서 어떤 비용을 치르더라도 남들보다 앞서기를 원하는 고객을 위해 성능을 높일 수 있는 다양한 옵션을 제공하고 있다는 것입니다.예를 들어 블랙웰은 기반 GB 200은 그레이스 슈퍼칩 CPU 한 개와 두 개의 B200 GPU를 하나로 묶어 최대 40페타플롭스의 AI 연산 능력을 갖고 있습니다. 물론 그만큼 비싸고 전력 소모도 엄청나지만, AI 개발에 사활을 걸고 있는 기업이 많아 오히려 수요 대비 공급이 부족할 것으로 예상됩니다. 그리고 이 경우 HBM의 수요가 크게 늘어 우리나라 메모리 업계에도 호재가 될 것입니다. B200 GPU는 24GB HBM3e를 8개나 탑재해 192GB의 메모리 용량을 갖고 있고 GB200는 그 두 배인 384GB의 HBM3e 메모리를 지니고 있기 때문입니다. 여기서 화룡점정을 찍는 것 같은 소식은 비용에 상관없이 최강의 성능이 요구하는 고객을 위한 서버 랙 시스템인 GB 200 NVL 72 노드입니다. 하나의 서버 랙에 두 개의 GB 200을 탑재한 서버 트레이 18 유닛을 쌓아서 총 72개의 B200 GPU를 장착한 시스템으로 강력한 대규모 AI 연산을 위한 슈퍼컴퓨터라고 할 수 있습니다. 다만 이 경우 엄청난 전력을 소모하기 때문에 공랭 쿨러 대신 수랭 쿨러를 사용해야 시스템 발열을 처리할 수 있습니다.그런데 이렇게 많은 프로세서를 사용해 대규모 연산 시스템을 구축하는 경우 데이터를 공유하고 작업을 분산하는 과정이 새로운 문제로 떠오르게 됩니다. 이 과정에서 병목현상이 생기면 전체 시스템의 성능이 크게 저하되는 것입니다. 이를 해결하기 위해 엔비디아는 아예 NVLINK 스위치라는 새로운 네트워크 전용 프로세서를 만들었습니다. 그리고 NVLINK 스위치 프로세서를 서버 트레이 하나에 두 개씩 넣어서 총 14.4TB/s의 대역폭을 확보했습니다. 이런 트레이가 9개가 있기 때문에 GB 200 NVL 72 노드 한 개가 130TB/s에 달하는 거대한 프로세서 간 대역폭을 확보할 수 있습니다. 덕분에 갈수록 커지고 있는 대규모 AI 학습 데이터를 더 효과적으로 처리하고 학습을 빨리할 수 있게 됐습니다. 마지막으로 GB 200 NVL 72 노드를 여러 대 연결하면 엑사플롭스급 AI 슈퍼컴퓨터 구축이 가능합니다. 물론 비용도 에너지 소모량도 엄청나지만, 역시 수요는 충분할 것으로 예상됩니다. 블랙웰 GPU를 보면 AI 하드웨어가 본격적인 산업화 시대에 도달했다는 것을 알 수 있습니다. 과거 GPU는 게임용으로 많이 사용되었고 초기 AI 연산용 GPU도 이것과 크게 다르지 않았으나 최근 나오는 데이터 센터 GPU는 산업용 및 연구용으로 특화되어 관련 분야에 종사하는 사람이 아니라면 직접 한 번 보거나 다뤄보기 어려운 물건이 됐습니다. 블랙웰 GPU는 대규모 데이터 처리와 AI 연산에 적합한 데이터 센터 GPU로 AI 혁명을 한 단계 앞당길 제품이 될 것으로 보입니다.

2024-03-20 10:56 나우뉴스

엔비디아에 올라탄 SK하이닉스, 5세대 HBM 양산 앞서간다

SK하이닉스가 고대역폭 메모리(HBM) 5세대 신제품인 HBM3E D램을 세계 최초로 대규모 양산해 이달 말부터 제품 공급을 시작한다고 밝혔다. 미 반도체 기업인 엔비디아의 차세대 인공지능(AI)칩 ‘블랙웰’ 공개에 발맞춘 행보로 보인다. 19일 SK하이닉스는 초고성능 AI용 메모리 신제품인 HBM3E를 메모리 업체 중 가장 먼저 양산해 이달 말부터 납품을 시작한다고 밝혔다. 지난해 8월 HBM3E 개발을 알린 지 7개월 만이다. 고객사를 따로 밝히진 않았지만 세계 최대 반도체 회사인 엔비디아에 해당 제품을 공급할 전망이다.SK하이닉스에 따르면 HBM3E는 속도와 발열 제어 등 AI 메모리에 요구되는 모든 부문에서 세계 최고 성능을 갖췄다. 초당 최대 1.18테라바이트(TB)의 데이터를 처리하며 이는 풀고화질(FHD)급 영화(5GB) 230편 분량이 넘는 데이터를 1초 만에 처리하는 수준이다. SK하이닉스는 “HBM3에 이어 현존 D램 최고 성능이 구현된 HBM3E 역시 가장 먼저 고객에게 공급하게 됐다”면서 “HBM3E 양산도 성공적으로 진행해 AI 메모리 시장에서의 경쟁 우위를 이어 가겠다”고 강조했다. HBM은 D램 여러 개를 수직으로 연결해 데이터 처리 속도를 끌어올린 고성능 메모리다. 1세대(HBM)-2세대(HBM2)-3세대(HBM2E)-4세대(HBM3)-5세대(HBM3E) 순으로 개발되고 있으며 HBM3E는 HBM3의 확장 버전이다. 앞서 세계 D램 3위 업체인 마이크론 테크놀로지가 지난달 26일(현지시간) 올해 2분기 출시 예정인 엔비디아의 H200 그래픽처리장치(GPU)에 탑재될 HBM3E 양산을 시작했다고 발표했으나 실제 HBM3E 납품을 위한 대량 양산은 SK하이닉스가 처음인 것으로 알려졌다. 한편 HBM 시장은 현재까지 SK하이닉스와 삼성전자가 양분하고 있다. 대만 시장조사업체 트렌드포스에 따르면 지난해 HBM 시장 점유율은 SK하이닉스가 53%, 삼성전자 38%, 마이크론 9%로 추정된다. 올해 HBM3E 시장이 열리면서 경쟁이 치열해질 전망이다.

2024-03-20 00:57 서울신문

[기고] 반도체 산업 도약에 필수인 원자력

지난달 27일 산업통상자원부 제2차관 주재로 경기 용인 반도체 국가 첨단전략산업 특화단지 가동에 필요한 대규모 전력의 안정적 공급에 관한 TF가 발족됐다. 용인시 일대 3개 부지 총 약 13㎢의 광대한 면적에 조성될 반도체 특화단지에는 총 10GW(기가와트) 전력이 필요하다. 2036년까지 우선 필요한 3GW는 단지 내 LNG 발전소 신규 건설을 통해 공급하고 나머지 7GW는 2037년 이후 장거리 송전선로를 통해 공급할 계획이다. 반도체 산업은 고품질의 대전력이 필요한 대표적인 산업이다. 2021년 삼성전자가 사용한 전력은 184억㎾h로 이는 100만㎾, 즉 1GW 발전소 2.1기가 1년 내내 발전하는 전력량에 해당한다. 발전소 정비기간과 송전 손실 등을 고려하면 삼성전자만을 위해 3GW 정도의 발전 용량 즉 원전 3기 정도가 필요하다는 말이다. 나아가 정교한 반도체 제조 장비는 전력 주파수의 미세한 변동에도 오작동할 수 있으므로 고품질 전력이 필요하다. 전력의 품질은 주파수 변동 폭으로 결정되는데 우리나라 전력망은 허용 변동 폭인 ±0.2㎐보다 훨씬 작은 범위에서 안정적인 주파수를 유지해 왔다. 한국 반도체 산업이 세계적 수준으로 발전하는 데는 그동안 고품질 대전력을 저비용으로 공급했던 우리나라 전력 시스템 덕이 크다. 그 기저에 원자력이 있었음은 부정할 수 없는 사실이다. 인공지능(AI)이 급속도로 발전함에 따라 데이터센터의 메모리와 CPU, GPU 등 프로세서에 필요한 반도체 수요도 급증할 전망이다. 이를 위해서는 우수한 인력뿐만 아니라 고품질 전력의 확충이 필요하다. 2037년 이후 용인 반도체특화단지에 송전망을 통해 공급될 전력 7GW에는 호남 지방의 태양광과 해상풍력이 예정돼 있다. 이들 재생에너지 전력은 변동성이 크기에 안정화를 위해서는 대용량의 에너지저장장치(ESS) 설치가 필수적이다. 이런 저장장치의 운용비용은 발전비용보다 비쌀 수 있어 전력 비용이 커진다. 고비용 전력은 반도체 생산 단가의 상승을 초래해 경쟁력을 떨어뜨린다. 고품질 전력을 저비용으로 확충하려면 원자력 확대가 필수적이다. 2030년대 이후에는 탄소중립의 필요성과 AI의 본격적 활용에 따라 전력 수요가 현재 예상하는 수준보다 더 늘어날 수 있다. 이러한 전망은 안정적이고 저비용의 무탄소 대전력원인 원자력의 확대 필요성을 더욱 부각한다. 향후 원자력은 대형 원전뿐만 아니라 소형모듈원자로(SMR)를 통해 확대할 수가 있다. SMR은 수요지 인근에 설치할 수 있을 정도로 안전성이 높고, 모듈화를 통해 경제성을 확보할 수 있는 차세대 소형 원전이다. SMR을 적기에 활용하기 위해서는 현재 개발 중인 혁신형 SMR의 국내 실증을 조속히 추진해야 한다. 아울러 전력뿐만 아니라 공정열 공급 등 다양한 용도로 활용될 수 있고 조기 실물화가 가능한 다른 유형의 SMR 개발에도 적극적인 지원을 해야 한다. 주한규 한국원자력연구원 원장

2024-03-12 04:05 서울신문

[차상균의 혁신의 세계] 엔비디아는 어떻게 반도체 시장을 석권했나

생성형 인공지능(Gen AI)에 대한 글로벌 경쟁이 AI 반도체 수요 급증으로 이어지고 있다. 현재 AI 반도체 시장의 독보적인 리더는 미국의 반도체 회사 엔비디아다. 엔비디아 그래픽처리장치(GPU) 수요가 폭증하면서 엔비디아 시가총액은 2조 달러를 넘었다. 작년 6월 1조 달러를 넘어선 뒤 불과 9개월 만의 일이다. 엔비디아가 감당하지 못할 만큼 지구촌의 AI 반도체 수요가 폭증한 덕분이다. 최근 오픈AI가 텍스트로 동영상을 생성하는 소라 서비스를 예고했다. 현재의 챗GPT서비스에 비해 소라는 스케일이 다른 연산 수요를 일으키게 된다. 이 때문에 엔비디아 주가는 당분간 오를 수밖에 없다. 엔비디아 주가가 뛰면서 경쟁사 AMD의 주가도 따라 오르고 있다. 엔비디아 반도체가 많이 팔리면 중앙처리장치(CPU) 칩 수요도 올라가는데, 이 시장을 주도하는 기업이 인텔과 AMD인 것이다. 특히 AMD는 낙후된 자체의 반도체 생산 라인을 고집해 온 인텔과 달리 일찌감치 생산 파트를 매각하고 대만 반도체 위탁생산(파운드리) 기업 TSMC의 최신 공정을 사용해 왔다. 이 때문에 AMD의 가성비가 인텔에 비해 좋아 x86 기반의 CPU 시장 점유율을 높여 왔다. 엔비디아 수요가 증가하면 AMD 서버용 CPU 수요도 증가한다. 이에 더해 AMD가 엔비디아에 가장 근접한 GPU 제품을 출시하면서 시장 가치가 빠르게 오르고 있다. 사실 AI 반도체칩 설계 기술은 이제 대단한 기술은 아니다. AI 연산의 상당 부분을 차지하는 매트릭스 연산을 병렬적으로 처리하는 코어를 설계하고 이 코어 가까이에 처리할 데이터를 가능한 한 많이 올려놓을 고속 메모리를 배치하는 것이다. 모든 빅테크 회사들이 자체 AI 반도체를 이미 가지고 있다. 하지만 중요한 것은 다수의 이런 AI 반도체칩들 위에서 Gen AI 모델을 구동하는 소프트웨어다. 이 소프트웨어는 엔비디아가 2000년대부터 개발해 확산시킨 CUDA가 독보적이다. 이 CUDA 때문에 엔비디아가 독점에 가까운 95%의 시장 점유율을 가지는 것이다. 엔비디아 의존도가 큰 마이크로소프트와 메타 같은 회사들은 AMD 소프트웨어가 CUDA와 근접한 성능을 내도록 도와 왔다. AMD 주가가 빠르게 오르는 것은 AMD가 엔비디아에 근접한 성능을 낼 때가 가까워졌음을 의미한다. 한편 소프트뱅크가 90% 지분을 가진 ARM CPU는 인텔이나 AMD의 x86 CPU보다 같은 일을 할 때 전력이 적게 든다. 빅테크 클라우드 회사에는 x86에 비해 매력적인 솔루션이다. 엔비디아가 한때 인수하려 한 ARM의 주가가 오르는 이유이고, ARM 주식의 상당 부분을 보유한 소프트뱅크 주식이 오르는 이유다. 엔비디아, AMD, ARM CPU 대부분을 TSMC가 생산한다. 이 회사들의 칩 수요가 늘면 TSMC 주가도 오른다. TSMC는 시가총액 7000억 달러로 반도체 업계 2위가 됐다. TSMC의 수요가 늘면 반도체 장비 회사들의 수요도 늘어난다. ASML이 3823억 달러의 시가총액으로 반도체 업체 4위가 됐다. 그다음이 시가총액 3683억 달러의 삼성전자다. 그 뒤를 AMD가 3314억 달러의 시가총액으로 빠르게 올라오고 있다. SK하이닉스는 880억 달러로 17위다. 엔비디아는 20여년 전만 해도 게임용 GPU를 공급하는 회사에 불과했다. 그런 기업이 삼성전자 시총의 5배에 이르는 1위 반도체 회사가 된 것은 첫째는 생산을 해 주는 TSMC가 있었기 때문이고, 둘째는 소프트웨어의 중요성을 일찌감치 깨달아 게임 외에 CUDA를 개발해 퍼트린 것이다. 그다음은 Gen AI 시대가 올 것을 예상하고 과감한 기술 투자와 우수한 인재를 확보한 것이다. 모두 엔비디아 최고경영자(CEO) 젠슨 황의 리더십 없이는 불가능한 일이다. 차상균 서울대 데이터사이언스대학원 초대원장

2024-03-11 00:50 서울신문

HBM 돌풍에도 건재한 GDDR 메모리…GDDR7 메모리가 온다 [고든 정의 TECH+]

GDDR은 이름처럼 그래픽 카드를 위해 만들어진 고속 메모리입니다. 초기 그래픽 카드는 일반 SDR, DDR 메모리를 사용했지만, 처리해야 하는 그래픽 데이터의 양이 갈수록 커지면서 PC용 메모리로는 감당하기 힘들어지자, GDDR이라는 새로운 규격을 만든 것입니다. GDDR 메모리가 본격 사용된 것은 2004년에 나온 엔비디아의 지포스(GeForce) FX 5700 울트라 그래픽 카드였습니다. 이 그래픽 카드는 GDDR2 메모리를 탑재한 시험작이었습니다. 그 다음 지포스 6800 울트라에 GDDR3가 사용되면서 본격적인 GDDR 메모리 시대가 열렸습니다. GDDR 메모리는 본래 DDR2, DDR3 메모리에 기반한 고속 메모리로 데이터가 지날 수 있는 통로를 여러 개 만들고 각각의 통로의 속도를 더 빠르게 만든 것이 특징입니다. 다만 그렇기 때문에 DDR 메모리보다 가격이 비싸고 전력 소모가 큰 단점도 지니고 있습니다. 일반 컴퓨터에서 DDR 계열 메모리 대신 GDDR 메모리를 사용하지 않는 이유입니다. 시스템 메모리는 속도 못지않게 용량도 중요하고 전력 소모와 발열이 너무 커서도 안 되기 때문에 DDR 계열 메모리 정도면 적당합니다. 하지만 GPU의 경우 발전 속도가 워낙 빠르다 보니 GDDR 계열 메모리로도 충분하지 않다는 지적이 나왔습니다. 이를 대체하기 위해 개발된 메모리가 바로 HBM입니다. HBM는 여러 층으로 메모리를 쌓고 더 극단적으로 많은 통로를 만들어 속도와 용량 두 마리 토끼를 잡은 차세대 메모리입니다. 따라서 GDDR 메모리의 한계를 극복하고 차세대 그래픽 메모리가 되리라는 기대가 상당했습니다. 하지만 가격은 잡지 못했다는 게 문제였습니다.HBM을 최초로 적용한 그래픽 카드는 사실 AMD의 라데온 R9 퓨리 X입니다. 피지 GPU에 1세대 HBM 메모리 4GB를 달고 당시로는 상당히 빠른 512GB/s의 대역폭을 확보했습니다. 하지만 당시 기준으로 너무 비싼 649달러의 가격이 발목을 잡았습니다. 값비싼 HBM를 탑재하고도 성능은 경쟁사인 엔비디아의 지포스를 능가하지 못했기 때문에 한동안 HBM 메모리는 널리 쓰이지 못했습니다. HBM이 본격적으로 빛을 보게 된 것은 AI 붐과 함께 데이터 센터용 GPU에 대규모로 공급된 이후입니다. 2022년 19억 달러 수준에 불과했던 HBM 시장 규모는 2023년에는 40억 달러로 급증했고 2027년에는 330억 달러로 폭증할 것이라는 예측이 나오고 있습니다. 이렇게 시장 규모가 커지고 규모의 경제를 달성할 수 있게 되면 HBM이 가격 경쟁력을 지니게 되면서 서버용 GPU나 CPU를 넘어 GDDR 메모리의 주요 소비처인 콘솔 게임기나 일반 소비자용 그래픽 카드에 다시 탑재될 수 있는 가능성이 열리게 됩니다. 하지만 GDDR 메모리 역시 진화를 거듭하면서 성능이 높아지고 있어 당장 큰 변화가 없을 가능성이 높습니다. 현재 사용되는 GDDR 메모리의 최신 버전은 GDDR6X입니다. 하지만 삼성전자는 이미 작년에 GDDR7 개발을 완료했습니다. 그리고 메모리 표준을 정하는 JEDEC은 최근 GDDR7 규격을 확정했습니다. GDDR7 메모리의 최대 속도는 48Gbps로 GDDR6X의 두 배입니다. 덕분에 메모리 하나의 대역폭도 192GB/s로 두 배 높아졌습니다. 256비트 메모리 인터페이스라면 총 1.5TB/s, 384비트 메모리 인터페이스에서는 2.3TB/s의 대역폭을 확보할 수 있습니다. H100 같은 서버용 GPU보다는 낮지만, 게임이나 AI 연산용의 일반 고성능 그래픽 카드에는 충분한 대역폭을 확보할 수 있습니다. 다만 초기 등장할 GDDR7 메모리는 이전과 마찬가지로 규격에서 허용하는 최대 속도보다 다소 느릴 것입니다. 작년 삼성전자가 개발한 GDDR7 역시 32Gbps의 스펙을 지니고 있습니다. 하지만 이는 RTX 3080에 사용된 19Gbps의 GDDR6X 메모리나 RTX 4080 Super에 사용된 23Gbps GDDR6X 메모리보다 훨씬 빠른 것입니다. 여러 층으로 메모리를 쌓아 올리고 이를 관통하는 TSV라는 통로를 여러 개 뚫은 후 인터포저라는 별도의 통로를 통해 GPU나 CPU에 연결해야 하는 HBM는 속도와 용량에서 GDDR 메모리를 몇 배 앞설 순 있지만 여전히 가격도 몇 배 앞서게 됩니다. 기존 DDR 계열 메모리처럼 생산하고 정착할 수 있는 GDDR 메모리는 HBM의 가격이 지금보다 현저하게 떨어지지 않는 이상 시장에서 살아남게 될 것입니다. 다만 일부에서 예측하는 것처럼 HBM 시장 규모가 급격히 커지고 규모의 경제에 의해 가격이 내려가면 상황이 바뀔 수도 있습니다. 지금처럼 메모리 대역폭과 가격에 따라 DDR – GDDR - HBM의 3층 구조가 앞으로도 이어질지 아니면 HBM이 메모리의 대세가 될지 미래가 주목됩니다.

2024-03-07 12:53 나우뉴스

삼성전자, 저장용량 12단까지 쌓았다… 5세대 HBM 빅매치 돌입

업계 최대 용량 36GB 구현 성공8단 쌓은 ‘선두’ SK하이닉스 추격D램 점유율 46%… 7년 만에 최고마이크론, 엔비디아용 HBM 양산새달 삼성과 ‘36GB 용량’ 맞붙어 인공지능(AI) 반도체에 탑재되는 고대역폭 메모리(HBM)를 놓고 메모리 반도체 업체간 경쟁이 본격화됐다. 선두 SK하이닉스를 추격 중인 삼성전자는 업계 최초로 D램 칩을 12단으로 쌓은 ‘5세대 HBM(HBM3E) 개발에 성공하면서 반전 계기를 맞았다. 미국 마이크론도 엔비디아용 5세대 HBM 양산을 시작하고 HBM 시장을 사실상 양분하고 있는 국내 업체에 도전장을 냈다. 27일 업계에 따르면 삼성전자가 이번에 개발한 36기가바이트(GB) 5세대 HBM은 업계 최대 용량이다. 3GB 용량인 24기가비트(Gb) D램을 12단으로 쌓아 올려 8단까지 쌓은 경쟁업체 제품(24GB)과 차별화를 한 것이다. 수천개의 미세 구멍을 뚫은 D램을 수직으로 쌓아 적층된 칩 사이를 전극으로 연결하는 기술(TSV·실리콘 관통 전극)을 활용했다고 한다. HBM은 D램 여러 개를 수직으로 연결해 데이터 처리 속도를 끌어올린 고성능 메모리다. 삼성전자가 고용량 HBM 시장을 주목한 건 AI 서비스 고도화로 데이터 처리량이 급증하고 있기 때문이다. 회사 측은 “성능과 용량이 이전 제품인 4세대 HBM(HBM3 8단) 대비 50% 이상 개선됐다”면서 “이 제품을 사용하면 그래픽처리장치(GPU) 사용량이 줄어 기업들이 비용을 절감할 수 있다”고 했다. 삼성전자는 6세대 HBM도 2026년 양산을 목표로 준비 중이다. 6세대에서는 16단까지 용량이 커질 것으로 보고, 칩과 칩 사이의 ‘갭’을 완전히 없애는 신공정도 개발하고 있다. 삼성전자의 HBM 매출이 늘면서 지난해 4분기 D램 점유율은 45.7%(옴디아 기준)를 기록했다. 2016년 3분기(48.2%) 이후 가장 높은 수준이다. 다만 HBM 시장만 놓고 보면 SK하이닉스가 앞서가고 있다는 평가를 받는다. SK하이닉스는 AI 반도체의 핵심인 GPU 시장의 80% 이상을 장악한 엔비디아에 HBM3를 사실상 독점 공급하고 있다. 지난달 8단으로 쌓은 5세대 HBM도 초기 양산을 시작했다. 내부 인증을 마친 HBM 제품을 고객사에 보냈고, 고객사 인증 절차가 마무리되는 대로 본격 양산에 돌입할 계획이다. 12단 제품도 국제 표준 규격(JEDEC)에 맞춰 개발 중이다. 국내 업체에 비해 HBM 시장 점유율이 상대적으로 미미한 마이크론도 반격에 나섰다. 마이크론은 26일(현지시간) 2분기 출시 예정인 엔비디아의 ‘H200’ GPU에 탑재될 5세대 HBM(24GB 8단) 양산을 시작한다고 공식 발표했다. H200은 엔비디아의 주력 제품인 ‘H100’을 대체할 차세대 제품이다. 마이크론도 다음달 36GB 12단 5세대 HBM의 샘플 제품을 내놓고 고용량 시장에서 삼성전자와 맞붙는다. HBM 생산 능력과 함께 얼마나 효율적으로 생산할 수 있느냐에 따라 HBM 시장의 판도도 바뀔 것으로 보인다.

2024-02-27 18:42 서울신문

‘AI 대장주’ 호실적에 美증시 열광…SK하이닉스도 엔비디아 효과 덕보나

인공지능(AI) 대장주로 불리는 미국 반도체 기업 엔비디아가 시장 전망치를 웃도는 깜짝 실적을 발표하면서 미 증시가 뜨거워지고 있다. 엔비디아에 고대역폭메모리(HBM)를 공급하는 SK하이닉스에 대한 기대도 커지고 있다. 엔비디아 주가는 22일(현지시간) 뉴욕 증시에서 전날보다 16.4% 폭등한 785.38달러(약 104만원)에 마감했다. 시가총액도 전날 1조 6670억 달러에서 1조 9390억 달러로 크게 오르며 하루 만에 2720억 달러(약 361조원) 증가했다. 이달 초 페이스북 모회사 메타플랫폼의 하루 증가분(1970억 달러)을 넘어서는 수치다. 시총 2조 달러를 눈 앞에 두고 있는 엔비디아는 아마존(1조 8130억 달러), 구글 모회사 알파벳(1조 7970억 달러)를 제치고 시총 순위 3위 자리도 탈환했다.엔비디아는 전날 시장 예상치를 뛰어넘는 2023년 회계연도 4분기(11~1월) 실적을 발표했다. 매출은 전년 같은 기간 대비 265% 늘었고 총이익은 769% 급증했다. 전세계 AI 반도체 시장의 80%를 차지하는 엔비디아의 호실적에 미 증시도 강한 랠리를 펼쳤다. 다우존스30 산업평균지수는 사상 처음으로 3만 9000선을 돌파했고, 스탠더드앤드푸어스(S&P) 500 지수는 지난해 1월 이후 가장 큰 폭의 상승률을 기록했다. 엔비디아발 열풍에 AMD(10.69%), 브로드컴(6.31%), 마블 테크널러지(6.64%), ASML(4.81%), 어플라이드 머티어리얼즈(4.94%), 마이크론(5.42%) 등 다른 반도체 관련주도 크게 올랐다. 엔비디아와 AI 반도체 협력 관계를 맺고 있는 SK하이닉스도 덩달아 수혜를 입고 있다. SK하이닉스 주가(15만 6500원, 22일 종가 기준)는 전날 5.03% 급등하며 시총이 114조원에 달했다. 23일 장 초반 16만원을 넘어서며 시총이 한때 118조원을 넘었다. 3년 내 200조원 시총을 목표로 하는 SK하이닉스로서는 ‘엔비디아 효과’ 덕을 톡톡히 보고 있는 셈이다. SK하이닉스는 AI 칩에 들어가는 HBM 시장에서 엔비디아와 협력 관계를 이어가고 있다. SK하이닉스의 5세대 HBM인 ‘HBM3E’도 엔비디아의 차세대 AI용 그래픽처리장치(GPU)에 탑재될 것이란 관측이 제기되면서 추가 협력 전망도 밝은 편이다. 지난해 4분기 흑자전환을 하면서 빠르게 적자 터널을 벗어난 SK하이닉스는 올해 10조원이 넘는 영업이익을 낼 것으로 증권가에선 보고 있다.

2024-02-23 10:24 서울신문

아마존 제친 엔비디아, 구글도 넘었다…美 시총 3위 등극

인공지능(AI) 반도체 시장을 선점한 엔비디아가 아마존을 제치고 미국 증시 시가 총액 4위에 오른 지 불과 하루 만에 구글의 알파벳까지 넘어 시총 3위 자리에 올랐다. 오는 21일 실적 발표를 앞두고 월가의 금융투자회사들이 엔비디아의 목표주가를 잇달아 올린 것이 영향을 준 것으로 풀이된다. 이 같은 주가 상승세가 계속된다면 엔비디아가 조만간 ‘시총 2조 달러 클럽’에 입성하는 날도 멀지 않을 것으로 전망된다. 14일(현지시간) 미 뉴욕증시에서 엔비디아 주가는 전장보다 2.46% 오른 739.0달러에 마감했다. 엔비디아 시총은 이날 종가 기준 1조 8253억 달러(약 2438조원)로 미 상장기업 중 마이크로소프트(MS)와 애플에 이어 세 번째로 가치가 큰 기업이 됐다. 엔비디아 주가는 올해 들어서만 49% 올랐고 지난 1년간의 상승 폭은 무려 221%에 달한다. 블룸버그 통신은 엔비디아의 주가 상승세가 전문가의 예측보다 더 가파른 탓에 월가 애널리스트들이 목표주가를 조정하는 데 애를 먹을 정도라고 전했다. 1993년 설립된 엔비디아는 게임용 PC에 들어가는 그래픽처리장치(GPU)를 만드는 회사였다. 하지만 최근 AI 모델 학습과 추론에 특화된 반도체 패키지인 ‘AI 가속기’를 만드는 회사로 변신한 뒤 챗GPT의 등장과 함께 생성형 AI 시장이 본격화되면서 기업 가치가 급성장했다. 엔비디아는 AI 반도체 시장에서 점유율 80%를 기록할 정도로 독점적인 위치를 차지하고 있어 미래 실적에 대한 기대치도 높아지는 분위기다. 애널리스트들은 엔비디아의 연간 매출 증가율이 118%에 달할 것으로 예상하면서 최근 목표주가를 30~50%씩 올렸다. 만약 엔비디아의 주가가 810달러 수준에 이르면 시총이 2조 달러를 넘어서게 된다. 그렇게 되면 엔비디아 시총은 메모리반도체 1위 기업이자 파운드리(반도체 위탁생산), 시스템반도체 사업에 뛰어든 삼성전자 시총(448조 9276억원, 13일 종가 기준)의 다섯 배가 넘는다.

2024-02-15 09:32 서울신문

아마존 제친 엔비디아… 기술 혁신 위력 보였다

인공지능(AI) 반도체 시장을 선점한 엔비디아가 미국 증시에서 아마존을 제치고 시가총액 4위에 올랐다. 시총 2조 달러를 바라보는 엔비디아의 거침없는 진격은 기술주의 위력이 얼마나 강력한지를 보여 준다. 우리 정부도 저평가된 국내 기업 주가를 끌어올리기 위한 정책을 이달 안에 내놓기로 했지만 엔비디아와 같은 ‘신데렐라’가 나오려면 기술 혁신을 할 수 있는 토양을 만들어 줘야 한다는 지적이 나온다. 엔비디아 시총은 13일(현지시간) 종가 기준 1조 7816억 달러(약 2381조원)로 아마존(1조 7517억 달러)을 따돌리고 미 상장기업 4위에 올라섰다. 엔비디아가 아마존을 넘어선 것은 2002년 이후 22년 만으로 샘 올트먼 오픈AI 최고경영자(CEO)가 2~3개월 전부터 공개적으로 탈엔비디아를 언급했음에도 주가가 상승세를 달리고 있다. 엔비디아는 AI 모델 학습과 추론에 특화된 반도체 패키지인 ‘AI 가속기’를 만드는 회사로 챗GPT의 등장과 함께 생성형 AI 시장이 본격 열리면서 기업 가치가 크게 올랐다. 그래픽처리장치(GPU) 제조업체인 엔비디아가 AI 시대 최대 수혜주로 떠오른 비결은 끊임없는 기술 혁신으로 경쟁력을 끌어올렸기 때문이다. 그 결과 엔비디아 시총은 메모리반도체 1위 기업이자 파운드리(반도체 위탁생산), 시스템반도체 사업에도 뛰어든 삼성전자 시총(448조 9276억원, 13일 종가 기준)의 다섯 배가 넘는다. 엔비디아에 고대역폭메모리(HBM)를 공급하는 SK하이닉스 시총은 109조 2004억원으로 국내 시총 2위에 해당하지만 미 대형 기술주 7인방(일명 ‘매그니피센트 7’)과는 비교가 안 된다. 코리아디스카운트(한국 증시 저평가)를 해소하기 위해 정부가 준비 중인 밸류업 프로그램이 주가 부양에 일정 부분 도움이 될 수 있지만 주가 상승의 원동력은 언제나 실적이며 이를 위해서는 기술 혁신과 산업구조 재편이 필요하다는 게 전문가들 설명이다. 김양팽 산업연구원 전문연구원은 “미국은 전통적인 팹리스(반도체 설계 전문) 강국으로 우리가 한 번에 따라가기는 어렵다”면서 “향후 10년 안에 반도체 시장이 지금의 두 배 수준까지 커질 수 있는 만큼 우리가 강점을 갖는 메모리반도체 산업을 활성화해야 한다”고 했다. 장영욱 대외경제정책연구원 부연구위원은 “공매도 등 제도 정비도 중요하지만 코리아디스카운트를 근본적으로 해소하려면 규범에 입각한 경쟁 기반을 만들면서 연구개발(R&D) 지원 규모를 늘려야 한다”고 말했다.

2024-02-15 00:24 서울신문

올트먼, 삼성·SK와 AI반도체 시장 흔든다

생성형 인공지능(AI) 챗GPT를 세상에 내놓은 오픈AI가 AI 반도체 독자 개발을 추진하면서 글로벌 반도체 시장에도 적지 않은 변화가 예상된다. 지난주 샘 올트먼 오픈AI 최고경영자(CEO)가 한국을 찾았을 때 삼성전자와 SK하이닉스 최고경영진이 총출동한 것도 향후 오픈AI가 반도체 시장의 ‘큰손’으로 떠오를 수 있다는 기대감 때문으로 풀이된다. 28일 업계에 따르면 AI 반도체 시장은 2025년 711억 달러 규모(약 95조원)로 커질 것으로 전망된다. AI 반도체 시장이 커질수록 필수 부품인 고대역폭 메모리(HBM) 수요는 더 늘어날 수밖에 없다.SK하이닉스는 최근 실적 발표 콘퍼런스 콜에서 HBM 수요가 연평균 60% 수준으로 성장할 것으로 예상했다. HBM은 그래픽처리장치(GPU)와 함께 AI 가속기에 탑재돼 대용량 데이터 처리를 돕는다. HBM을 원활하게 공급받는 게 중요한데 이 시장을 삼성전자와 SK하이닉스가 장악하고 있다. AI 칩을 직접 생산하려는 오픈AI 측과 HBM 시장 강자인 삼성전자·SK하이닉스가 손을 잡는다는 건 단순한 기업 간 협업을 넘어 기존 반도체 시장을 재편할 수 있다는 점에서 파급력이 클 수밖에 없다. 오픈AI가 엔비디아의 독주를 견제하면 HBM의 수익성도 당분간 일반 D램보다 높은 수준에서 유지될 수 있고 엔비디아와의 협상에서도 주도권을 잃지 않을 수 있다. 현재 HBM의 개당 수익률이 D램의 5배가 넘는 것으로 알려진 만큼 삼성이나 SK 입장에서도 수익성을 끌어올릴 수 있다. 특히 올트먼 CEO가 삼성전자 평택 반도체 공장을 찾고 삼성 서초사옥에서 또다시 경영진과 면담한 것은 삼성전자가 갖고 있는 사업 포트폴리오가 오픈AI의 구상과도 잘 맞아떨어지기 때문이다. 삼성전자는 반도체 설계부터 파운드리(위탁 생산), 메모리 생산까지 모든 공정을 처리할 수 있어 AI 칩 개발부터 생산까지 하기 원하는 오픈AI 입장에선 최적의 파트너다. 실제 올트먼 CEO와의 면담에는 경계현 DS(반도체)부문장(사장)을 비롯해 최시영 파운드리사업부장, 이정배 메모리사업부장, 박용인 시스템LSI사업부장 등도 함께한 것으로 전해졌다. 앞서 한진만 삼성전자 DS부문 미주총괄 부사장은 지난 11일(현지시간) 기자들과 만나 “앞으로 메모리와 파운드리 의사결정자들이 한 테이블에 모여 같은 고객을 만나게 될 것”이라고 했는데 2주 만에 현실화한 것이다. 박재근 한양대 융합전자공학부 교수는 “오픈AI 입장에선 엔비디아의 기준이 아닌 자체 기준에 맞게 GPU를 설계하고 싶어 한다”면서 “삼성전자는 파운드리를 하고 있고 SK하이닉스와 함께 HBM도 생산하고 있으니 협업을 검토하기 위해 다녀간 것 같다”고 말했다.

2024-01-29 00:16 서울신문

배당락일도 거뜬… ‘8만전자’ 눈앞에 성큼

삼성전자가 배당락일에도 거뜬히 상승세를 이어가며 ‘8만전자’에 바짝 다가섰다. 삼성전자는 27일까지 6거래일 연속 상승하며 전날보다 1.83%오른 7만 8000원에 거래를 마쳤다. 이 종가는 52주 신고가이기도 하다. 지난 20일부터 5거래일 연속 52주 신고가. 이날 종가는 지난해 1월 12일 7만 8900원 이후 약 2년 만에 가장 높은 가격이다. 연일 이어진 외국인 매수세가 주가 상승을 견인했다. 외국인은 지난 20일부터 이날까지 8600억원어치 순매수했다. 기관은 전날까지 순매수세를 지속하다가 이날 매도 모드로 전환했고 개인 투자자는 지난 19일부터 6거래일 연속 매도 우위를 나타내고 있다. 26일(현지시간) 미국 뉴욕증시에서 인텔(5.2%), 마이크론(0.7%), AMD(2.7%) 등 반도체주가 강세를 보였고 최근 증권가가 내년 ‘온디바이스 AI’(기기 자체에 직접 인공지능 서비스를 탑재해 제공하는 기술) 관련 수요 증가와 반도체 업황 회복 기대감을 피력하면서 삼성전자에 대한 투자심리 개선에 기여하는 것으로 보인다. 또 중국산 반도체에 대한 미국 정부의 규제가 계속되고 있어 삼성전자가 반사이익을 얻을 수 있다는 관측도 여전하다. 조 바이든 미 행정부는 반도체 생산 장비의 중국 수출을 통제했으며 내년 1월부터는 미국 기업들에 중국산 반도체 사용 의존도를 조사할 예정이다. 여기에 내년 금리 인하 전망 속 북미 클라우드 업체들이 AI 서버 신규 투자를 늘리면서 AI용 그래픽 처리정치(GPU)와 단짝인 고대역폭메모리(HBM)가 없어서 못 팔 정도로 수요가 늘 수도 있다는 전망이 나온다. 이날 코스피는 배당락 충격 없이 개인과 외국인의 대량 매수에 힘입어 전날보다 10.91 포인트(0.42%)오른 2613.50으로 집계됐다. 전날보다 3.24포인트(0.12%) 내린 2599.35에 개장한 뒤 혼조세를 보이다가 오후 들어 강세로 완전히 돌아섰다. 통상 배당락일에는 전날까지 배당을 노리고 투자했던 투자자들의 매물이 빠지며 지수도 하락하는 경향이 있지만, 올해부터는 금융 당국의 배당 제도 선진화 방침에 따라 기업들의 배당락일이 내년 초까지로 분산돼 충격이 덜한 것으로 풀이된다. 코스닥지수는 전장보다 11.45포인트(1.35%) 오른 859.79로 거래를 마쳤다. 이날 하루 동안 유가증권시장과 코스닥시장의 거래대금은 각각 10조 2622억원, 10조 5126억원으로 집계됐다.

2023-12-27 17:32 서울신문

CPU는 아쉽고, GPU, AI는 기대 이상? 인텔 메테오 레이크 공개[고든 정의 TECH+]

인텔이 오랜 세월 준비해 온 야심작인 메테오 레이크가 세상에 모습을 드러냈습니다. 삼성 갤럭시 북4 시리즈의 두뇌로 탑재된 메테오 레이크는 한 개나 혹은 2-3개 정도의 반도체 칩으로 프로세서를 만드는 과거의 제조 방식을 버리고 각자 기능과 제조 공정이 다른 여러 개의 타일을 묶는 새로운 방식을 도입해 출시 전부터 주목을 끌었던 제품입니다. 인텔은 본래 14세대 코어 프로세서로 출시되었을 메테오 레이크에 인텔 코어 울트라(Core Ultra)라는 새로운 명칭을 도입하면서 자신감을 나타냈습니다. 현재 공개한 인텔 코어 울트라 프로세서는 28/45W TDP를 지닌 고성능 모델인 H 모델과 9/15W TDP를 지닌 저전력 주력 모델인 U 모델입니다. H 모델은 최대 6개의 고성능 코어 (P 코어)와 8개의 고효율 코어 (E 코어), 그리고 2개의 저전력 고효율 코어 (LP E 코어)를 합쳐 16개의 코어를 지니고 있습니다. 스레드 숫자는 22개입니다. U 모델은 고성능 P 코어 숫자만 2개로 줄여 최대 12개의 코어를 지니고 있습니다. 최대 24MB L3 캐시 메모리와 CPU 코어는 인텔 4 공정으로 제조한 CPU 타일에 들어 있습니다. 내장 GPU인 그래픽 타일은 최대 8개의 Xe 코어를 탑재하고 있습니다. 각각의 코어는 16개의 256비트 벡터 엔진, 레이 트레이싱 유닛을 탑재하고 있습니다. 전체적으로 연산 유닛 숫자도 30% 정도 증가하고 클럭도 높아졌기 때문에 그래픽 성능은 13세대 랩터 레이크보다 훨씬 좋아졌을 것으로 기대할 수 있습니다. 더구나 메모리도 DDR5 5600이나 LPDDR5x 7467처럼 더 빠른 메모리를 선택할 수 있어 제 성능을 발휘할 수 있습니다. 그래픽 타일은 TSMC의 5nm 공정으로 제조했습니다. 메테오 레이크의 또 다른 특징은 여러 가지 기능을 탑재한 SoC 타일이라는 독립된 타일에 있습니다. 역시 TSMC에 의해 생산된 SoC 타일에는 GPU에서 독립된 미디어 관련 기능과 LP E 코어, 그리고 AI 연산을 빠르게 할 수 있는 NPU가 탑재되어 있습니다. 덕분에 메테오 레이크는 기존의 인텔 프로세서는 물론 경쟁자인 라이젠보다도 더 빠른 AI 연산이 가능하다는 게 인텔의 주장입니다. 하지만 막상 뚜껑을 열어보니 CPU 성능은 기대에 미치지 못한다는 반응이 나오고 있습니다. 사실 이는 인텔이 공개한 벤치마크 결과에서도 볼 수 있습니다. 이에 따르면 경쟁자인 라이젠 모바일 7840U와 비교해서 코어 울트라 7 165H의 멀티스레드 성능은 11% 정도 높고 싱글스레드 성능은 12% 정도 높습니다. 그런데 스레드 숫자를 비교하면 라이젠 7840U는 16개, 코어 i7-1370P는 20개, 코어 울트라 7 165는 22개로 늘어난 코어 숫자를 생각하면 그다지 큰 변화는 없는 셈입니다. 심지어 싱글스레드 성능은 코어 i7-1370P보다 낮습니다. 일부 벤치마크 결과에서도 비슷한 결과가 얻어지면서 CPU에서는 괄목할 만한 성장이 없었다는 초기 반응이 나오고 있습니다.대신 GPU 성능은 연산 유닛을 대폭 추가하고 클럭까지 크게 높아졌기 때문에 상당한 성능 향상을 보여주고 있습니다. 인텔이 공개한 슬라이드에서도 최대 2배까지 성능 향상을 주장하고 있는데, 3D 마크 타임 스파이 같은 일부 벤치마크 결과에서도 이런 주장을 확인할 수 있습니다. 지난 몇 년간 와신상담 성능을 갈아온 인텔 아크 그래픽이 이제 빛을 보는 것 같은 느낌입니다. 앞으로 라데온 내장 그래픽과 선의의 경쟁을 통해 내장 그래픽 성능을 대폭 끌어올릴 것으로 기대됩니다.아직 사용처가 많지 않은 인텔 AI 부스트 NPU는 결국 얼마나 많은 어플리케이션이 이를 지원하고 적극적으로 활용하는지가 승패를 가를 것으로 생각됩니다. 인텔이 공개한 벤치마크를 보면 성능 면에서 경쟁자인 라이젠 AI를 쉽게 넘어서는 것 같지만, 진짜 적은 AMD 라이젠이 아니라는 게 문제입니다. 현재 AI 하드웨어 시장의 절대 강자는 엔비디아이기 때문에 엔비디아의 아성에 도전하는 것이 인텔, AMD 두 회사의 큰 과제입니다. 메테오 레이크는 타일처럼 칩을 붙여 더 복잡한 프로세서를 만드는 새로운 제조 방식을 본격적으로 시험한 무대였습니다. 첫술부터 배부를 순 없겠지만, 앞으로 최적의 제조 공정과 아키텍처를 자유롭게 결합해 더 강력한 프로세서가 나올 수 있을 것으로 기대합니다. 내년에 등장할 애로우 레이크와 루나 레이크는 인텔 3 공정을 건너 뛰고 20A 공정으로 바로 진행합니다. 아키텍처도 대대적으로 개선하고 노트북 시장뿐 아니라 데스크톱 시장에도 타일 구조를 도입합니다. 이미 인텔은 애로우 레이크의 웨이퍼를 공개하면서 자신감을 내비쳤습니다. 메테오 레이크에서 아쉬웠던 부분을 여기서 만회할 수 있을지 궁금합니다.

2023-12-16 11:44 나우뉴스

세계적 수준 ‘국가 인공지능 데이터센터’ 15일 서비스 개시

세계적 수준의 국가인공지능(AI)데이터센터가 본격 서비스를 시작한다. 광주시는 첨단3지구 인공지능중심산업융합집적단지(이하 AI집적단지) 내 핵심시설인 세계적 수준의 국가인공지능 데이터센터 서비스를 15일 개시한다고 밝혔다. 인공지능데이터센터는 초거대 인공지능 모델을 개발할 수 있는 고성능 컴퓨팅 자원 등의 서비스를 지원한다. 인공지능 모델은 점점 더 복잡해지고 개발에 필요한 데이터량이 커지고 있는 상황에서, 메모리 용량과 데이터 처리 속도를 높인 초고성능 컴퓨팅 자원의 필요성이 커지고 있다. 광주시는 엔비디아의 최신 성능 가속기 ‘H100’ 등 고성능 컴퓨팅 자원을 활용, 짧은 시간 내 방대한 데이터 학습과 분석이 가능하도록 인공지능 연구개발에 최적화된 인프라를 제공한다. 이로 인해 창업 초기기업(스타트업)들도 복잡한 인공지능 서비스 개발·연구가 가능해져 인공지능 산업융합 생태계가 활성화될 것으로 기대된다. 국가인공지능 데이터센터는 20페타플롭스(PF) 규모의 고성능컴퓨팅(HPC)과 68.5페타플롭스(PF) 규모의 GPU 클라우드 혼용 방식으로 구축됐다. 전체적으로 88.5페타플롭스(PF) 연산자원과 107페타바이트(PB) 저장공간을 갖춘 세계적 수준의 규모다. 데이터센터는 연면적 3144㎡의 2층 구조로, 인공지능 개발을 위한 260랙 규모의 전산실에 6메가와트(MW)의 전력이 소요된다. 사용자가 통신 회선 사업자를 자유롭게 선택해 사용할 수 있는 망중립 데이터센터이며, 수도권과 동일한 네트워크 품질 신뢰성과 접근성을 제공한다. 광주시는 지난 10월23일 전체 구축량의 50%인 연산자원 44.3페타플롭스(PF), 저장공간 53.5페타플롭스(PF) 규모의 자원구축과 성능테스트를 마쳤다. 12월엔 추가로 가속기 24페타플롭스(PF) 그리고 2024년 1분기에 20페타플롭스(PF) 규모의 고성능컴퓨팅(HPC)자원을 구축할 예정이다. 광주시는 이를 통해 1000여 개의 인공지능 관련 기업을 지원할 수 있을 것으로 보고 있다. 기업은 인공지능 모델이나 관련 제품을 개발하는데 반드시 필요한 고비용의 연산자원과 저장공간 및 개발환경을 무료로 제공받고 개발시간도 단축할 수 있게 된다. 이에 따라 광주에는 국내외 인공지능 기업이 모여 협업하고, 기술개발과 활용을 촉진하는 인공지능 산업생태계가 구축될 것으로 기대하고 있다. 광주시는 자원이용 기관 및 기업 선발을 위해 지난 10월 공모를 진행, 10월27일 263개 기업에 가속기 21페타플롭스(PF)와 스토리지 8페타바이트(PB) 자원을 할당했다. 1페타플롭스(PF)는 초당 1000조번의 수학 연산처리를 의미하며, 1페타바이트(PB)는 6기가바이트(GB) 영화 17만4000편의 영화를 보관할 수 있는 용량이다. 정부가 추진하는 초고속·저전력 국산 인공지능 반도체 개발과 데이터센터 적용을 통해 국내 클라우드 경쟁력을 강화하기 위한 ‘K-클라우드 프로젝트’ 일환으로 데이터센터 내에 11페타플롭스(PF) 규모의 인공지능(AI)반도체(NPU)팜 실증·구축도 병행한다. 광주시는 1단계 인프라의 고도화와 도시규모의 실증을 목표로 인공지능 2단계 사업을 순차적으로 진행하기 위해 예비타당성 용역을 준비 중이다. 김용승 인공지능산업실장은 “광주시는 인공지능 관련 인프라와 도시규모의 실증환경을 조성해 기업에 제공하고, 기업은 이를 활용해 인공지능 서비스를 만들어가게 될 것”이라며 “이를 통해 대한민국의 인공지능 대표도시 광주가 명실상부한 한국의 실리콘밸리로 성장할 수 있을 것으로 기대한다”고 말했다.

2023-11-14 16:55 서울신문

[차상균의 혁신의 세계] 대형 글로벌 벤처자본 목마르다/서울대 데이터사이언스대학원 초대원장

지난주 약관 28세에 3억 5000만 달러 가치를 인정받은 실리콘밸리의 스텔스 벤처를 창업한 젊은이를 만났다. 스탠퍼드대 박사과정에서 대규모언어모델(LLM) 학습 연구를 했으며 구글 브레인에서 인공지능(AI)으로 데이터센터 최적화 문제를 연구했다고 한다. 지난 6월 말 모자이크 ML이라는 2년밖에 안 된 생성형 AI 벤처 기업을 13억 달러에 인수해 화제가 됐던 비상장 벤처기업 데이터브릭스의 공동창업자 마테이 자하리아가 그의 지도교수다. 이 젊은 창업자는 스파크라는 분산 인메모리 플랫폼 소프트웨어를 만들어 창업한 지도교수의 영향을 받아 생성형 AI에 대해 폭넓게 실전 경험을 쌓았다. AI 학습과 서비스에 소요되는 엄청난 수요 때문에 돈이 있어도 엔비디아의 그래픽처리장치(GPU)를 구할 수 없게 되자 실리콘밸리의 대표 벤처캐피털인 세쿼이아 캐피털과 라이트 스피드 벤처 파트너가 앞장서 그의 스텔스 모드 벤처에 투자했다. 생성형 AI에 최적화된 데이터센터 운영 소프트웨어를 만드는 것이 이 벤처의 미션이다. 아마존, 구글 등 GPU 클라우드를 운영하는 빅테크 기업들도 이 벤처의 실험을 지원하기로 했다. 실험이 성공하게 되면 클라우드 서비스 빅테크 기업에서 GPU를 할당받아 여러 고객들의 LLM 연산 서비스를 경제적으로 해주는 벤처 기업들은 존재 이유가 없어진다. 이 스텔스 회사 이외에도 올해 들어서만 실리콘밸리 벤처캐피털들과 성공한 창업가들의 통 큰 생성형 AI 투자가 줄을 잇고 있다. 마이크로소프트, 구글, 아마존 등 AI 사업을 주도하려고 하는 빅테크 대기업들도 예외는 아니다. 지난 6월 말 인플렉션 AI는 ‘모두를 위한 개인용 AI’ 챗봇 비전을 내걸었다. 구글 딥마인드 공동 창업자였던 무스타파 술레이먼이 설립한 이 회사는 40억 달러 가치로 지금까지 모두 15억 달러의 투자를 끌어냈다. 소셜미디어나 메신저를 통해 대화로 개인의 일상 문제를 풀어 주는 ‘Pi’라는 이름의 챗봇이 대표작이다. 오픈 AI와 경쟁하는 앤트로픽은 올해에만 벤처캐피털과 아마존, 구글 등에서 수십억 달러의 투자를 받았다. 지난 9월 아마존은 즉시 12억 5000만 달러를 투자하고 추가로 양사 합의에 따라 27억 5000만 달러를 추가로 투자하기로 했다. 구글은 4월에 3억 달러를 이 회사에 투자한 후 10월에 5억 달러를 더 투자했다. 서로 합의하면 15억 달러를 추가 투자할 수 있는 여지도 열어 놓았다. 미국이 주도하는 생성형 AI의 투자에 대응하기 위해 유럽에서도 통 큰 투자가 시작됐다. 지난 6월에는 설립한 지 4주밖에 안 된 프랑스의 미스트랄 AI에 1억 1300만 달러의 파격적인 종잣돈 투자가 이루어졌다. 구글 딥마인드와 메타에 소속됐던 유럽의 젊은 연구원들이 창업한 회사다. 세 창업자의 빅테크 연구개발 경력과 유럽이 민감하게 생각하는 AI 규약 준수를 위한 LLM 개발 전략만으로 뭉칫돈을 끌어낸 것이다. 이 회사의 개발전략 설명서는 7쪽에 불과했다. 실리콘밸리의 라이트 스피드가 투자를 주도했지만 유럽의 많은 기관들도 투자 대열에 합류했다. 수십조 단위의 대규모 혁신 자본을 확보한 글로벌 벤처캐피털이 구글, 아마존, 마이크로소프트 같은 빅테크 대기업과 손을 잡고 현장의 중요한 문제를 빠르게 인지하고 문제를 풀 수 있는 인재를 구해 치고 나가는 것이 생성형 AI 시대의 새로운 모습이다. 정부가 국가의 연구개발비를 나누어 주는 체계로는 이 새로운 시대를 쫓아가기도 힘든 것이 현실이다. 산업화 시대에 만들어진 국가의 공적 산업자본을 하나로 모아 싱가포르 테마섹 같은 국부펀드를 만들어 글로벌 시장에서 혁신을 선도할 수 있는 자본을 우리도 만들어야 한다.

2023-11-09 00:08 서울신문

노트북 시장의 무한도전…퀄컴 스냅드래곤 X 엘리트 성공할까? [고든 정의 TECH+]

현재 소비자용 CPU 시장은 노트북, 데스크톱, 서버 등 고성능 제품은 x86 아키텍처가 주류고 스마트폰, 태블릿 등 휴대용 기기는 ARM 아키텍처가 대세입니다. 물론 지난 10여 년 간 영역 파괴를 위한 노력이 진행되어 경계가 일부 무너지긴 했으나 그래도 여전히 대세는 그렇다고 말할 수 있을 것입니다. 이런 시장 구도를 깨려는 회사 가운데 하나가 바로 퀄컴입니다. 스마트폰 AP의 강자인 퀄컴은 그 기세를 몰아 태블릿은 물론 노트북 시장에도 도전장을 던졌습니다. 절대 성능에서는 x86 CPU와 독립 GPU의 조합을 이기기 어렵지만, 배터리 사용 시간과 휴대성이 중요한 노트북 시장에서라면 승산이 있다고 생각한 것입니다. 여기에 LTE/5G 통신 기능까지 합치면 더 경쟁력이 있을 것으로 생각됐습니다. 그렇게 해서 내놓은 스냅드래곤 8CX는 ARM 계열인 카이로(Kyro) 모바일 CPU와 자체 모바일 GPU인 아드레노(Adreno)을 사용해 사실 모바일 스냅드래곤 8 계열 AP와 큰 차이가 없었습니다. 하지만 2017년 당시 이 제품을 내놓았을 때 퀄컴에게는 든든한 우군이 있었습니다. 바로 마이크로소프트입니다. 스마트폰 시장에서 아이폰과 안드로이드폰에 밀린 마이크로소프트는 아이패드를 내세운 애플의 세력 확장에 위기를 느끼고 서피스 태블릿을 내놓았습니다. 하지만 기존의 x86 CPU로는 아이패드 만큼 얇고 가벼우면서 배터리 사용시간이 긴 태블릿을 만들기 힘들었습니다. 그래서 내놓은 것이 ARM CPU에서도 사용할 수 있는 윈도우 RT였습니다. 그러나 윈도우 RT는 기존의 x86용 윈도우 프그램을 사용할 수 없어 무늬만 윈도우라는 이야기를 들었고 결국 소비자의 외면 속 시장에서 사라졌습니다. 따라서 아이패드를 견제하고 x86을 넘어 ARM까지 생태계를 확장하려는 마이크로소프트와 주로 스마트폰 AP 시장에만 국한된 스냅드래곤의 영역을 확장하려는 퀄컴이 손을 잡은 것은 의외의 일은 아니었습니다. 이렇게 든든한 우군 덕에 삼성이나 레노버, HP 등 여러 제조사들이 스냅드래곤 8CX와 ARM 윈도우(Windows on ARM)를 사용한 노트북을 선보였습니다. 새로 내놓은 ARM 윈도우가 윈도우 RT와 가장 다른 점은 에뮬레이션을 통해 x86 윈도우용 어플리케이션도 사용할 수 있다는 것입니다. 이는 ARM에서 돌아가는 윈도우 운영체제의 가장 큰 약점을 극복한 것으로 평가받았습니다. 하지만 시장에서의 반응은 좋지 못했습니다. 스냅드래곤 8 CX에 사용된 카이로 CPU는 기본적으로 스마트폰에 들어가는 모바일 CPU이기 때문에 전력 소모는 적지만, 절대 성능에서 x86 CPU를 넘어선다고 보기는 어려웠습니다. 그런 상황에서 에뮬레이션까지 돌리면 속도는 훨씬 느려지게 됩니다. 윈도우 어플리케이션의 절대 다수를 차지하는 x86 어플리케이션에서 실행 속도나 안전성, 호환성을 따지면 스냅드래곤 8CX와 ARM 윈도우를 탑재한 노트북은 합격점을 주기 어려웠습니다. 그런데 그런 와중에 애플은 동일 전력 소모에서 x86 CPU의 성능을 뛰어넘는다는 평가를 받는 M 시리즈 프로세서를 출시했습니다. 호환성이나 생태계 문제는 애플이 맥OS 시장을 장악하고 있다 보니 큰 문제가 되지 않았습니다. 애플이 전환하면 소비자는 무조건 따라갈 수밖에 없는 폐쇄된 생태계이기 때문입니다. M 시리즈 프로세서는 다양한 맥북 및 맥 제품에 탑재되는 것은 물론 아이패드에도 사용되어 안드로이드 태블릿에 큰 위협이 되고 있습니다. M 시리즈 프로세서만 탑재하면 보급형 아이패드도 고성능 안드로이드 태블릿의 성능을 쉽게 넘어설 수 있습니다. 퀄컴 입장에서는 노트북 시장을 넘보지도 못하고 태블릿 시장만 잃게 될 상황에 놓인 것입니다. 새로 공개한 스냅드래곤 X 엘리트는 이런 위기 상황을 타개할 회심의 대작으로 보입니다. 우선 모바일 CPU인 카이로 대신 완전히 새로운 고성능 CPU인 오라이온 (Oryon) 코어를 12개나 탑재했습니다. 클럭도 3.8GHz까지 높이면서 코어 두 개는 4.3GHz의 터보 클럭 기능을 갖춰 성능을 더 높였습니다. 물론 정확한 성능은 제품이 나와봐야 평가할 수 있겠지만, 퀄컴에 따르면 비슷한 급의 인텔 CPU와 비교해서 동일 전력 소모에서 멀티스레드 성능이 2배 높고 GPU 성능도 내장 GPU를 기준으로 최대 2배에 달합니다.물론 TSMC의 4nm 공정을 사용하고 카이로를 기반으로 성능을 높이고 클럭도 높아졌다는 점을 생각하면 최소한 기존의 스냅드래곤 8CX보다 CPU 성능이 뛰어날 것임은 분명합니다. 다만 캐시 메모리 용량이나 동일 조건에서 스냅드래곤 8CX 기반 CPU와의 비교 등 상세한 정보가 빠져 있어 아직은 추측만 할 뿐입니다. 스냅드래곤 X 엘리트에 쓰인 GPU의 성능은 4.6TFLPOS입니다. 구체적인 클럭이나 코어 구성 등 상세한 정보는 빠져 있지만, 만약 FP32 기준이라면 적어도 단순 연산 능력으로는 인텔 내장 그래픽보다 빠를 가능성을 시사합니다. 여기에 NPU인 헥사곤은 INT4 기준 46 TOPS의 인공지능 연산 능력을 지니고 있습니다. 그리고 이런 빠른 연산 능력을 뒷받침하기 위해 128비트 LPDDR5x-8533 메모리를 사용해 136GB/s의 대역폭을 확보했습니다. 다만 트랜지스터 집적도와 다이 면적 같은 정보는 공개하지 않았습니다. 일단 스펙상으로는 스냅드래곤 8과 굳이 구분할 필요가 있는지 의구심이 들 정도였던 스냅드래곤 8CX보다 훨씬 강력해진 것으로 보입니다. 전반적인 구성을 보면 스냅드래곤 X 엘리트는 애플의 M 시리즈 프로세서와 인텔 CPU를 의식해 충분히 경쟁력을 지닌 고성능 프로세서로 재탄생한 것으로 보입니다.하지만 이번에도 역시 x86 중심의 윈도우 생태계가 발목을 잡을 가능성이 높습니다. 여전히 x86 어플리케이션은 직접 구동하기 어려워 에뮬레이팅이 필요하고 이 과정에서 속도가 느려질 가능성이 높습니다. 여기에 애플도 M3 시리즈의 출시를 눈앞에 두고 있고 인텔 역시 오랜 세월 준비한 메테오 레이크를 출시할 예정이라 스냅드래곤 X 엘리트의 성능상의 우위는 생각보다 크지 않을 수 있습니다. 이런 우려를 불식시키고 스냅드래곤 X 엘리트가 강력한 성능으로 시장에서 성공을 거둘 수 있을지 결과가 주목됩니다. 　

2023-10-27 11:07 나우뉴스

AI CPU 시장에 도전장 내민 일본…반도체 왕국 재건할까? [고든 정의 TECH+]

한때 일본 반도체 업계는 메모리는 물론 시스템 반도체 부분에서 세계 시장을 주름잡았습니다. 하지만 후발 주자인 한국에 메모리 반도체 시장의 주도권을 완전히 내주고 말았고 프로세서 부분에서는 인텔 같은 미국의 거대 IT 기업에 밀려 결국 반도체 산업의 변방으로 밀려나게 됐습니다. 한국이 메모리 반도체, 대만이 파운드리 생산 분야에서 절대적인 위상을 차지한 이후 일본 반도체 업계는 정부의 지원과 함께 권토중래를 꿈꾸고 있습니다. 이 가운데 후지쯔는 일본에서 고성능 CPU 개발 및 제조 기술을 지닌 몇 안 되는 회사 중 하나입니다. 후지쯔는 과거 썬 마이크로시스템스(나중에 오라클에 합병)가 개발한 SPARC 아키텍처 CPU 제조 및 개발에 뛰어들어 서버 및 워크스테이션 시스템을 만들기도 했습니다. 하지만 서버 및 워크스테이션 시장이 x86 CPU로 기울고 모바일에서는 ARM 아키텍처 천하가 되면서 후지쯔는 ARM 아키텍처 기반 고성능 CPU로 방향을 바꾸게 됩니다. ARM은 x86과 달리 라이선스를 얻어 누구나 개발하고 제조할 수 있기 때문입니다. 그렇게 해서 2020년 선보인 후지쯔의 후카쿠 슈퍼컴퓨터는 415 페타플롭스의 연산 능력으로 미국의 서밋 슈퍼컴퓨터를 누르고 세계 1위를 달성했습니다. 일본 이화학연구소(RIKEN)과 공동으로 개발한 후카쿠의 두뇌인 A64FX는 48개의 연산 코어와 4개의 보조 코어로 구성된 52코어 ARM CPU로 2.7 테라플롭스의 연산 능력을 자랑합니다. TSMC의 7nm 공정에서 제조된 A64FX CPU는 88억 개의 트랜지스터를 집적해 지금 기준으로는 다소 작은 프로세서입니다. 대신 CPU 한 개의 4개의 HBM2 메모리 (각 8GB)와 붙여 사용하기 때문에 크기가 작아 수많은 CPU를 하나의 시스템에 집적할 수 있습니다. 후카쿠는 총 729.9만 개의 코어를 이용해 GPU 없이도 415 페타플롭스의 연산 속도를 달성했습니다. 하지만 그후 미국의 인텔, AMD, 엔비디아가 엑사스케일 슈퍼컴퓨터를 선보였기 때문에 후카쿠는 1위 자리에서 곧 물러나게 됐습니다. 물론 일본 정부는 슈퍼컴퓨터 경쟁에서 뒤지지 않기 위해 차세대 슈퍼컴퓨터를 계획하고 있습니다. 후지쯔는 차세대 슈퍼컴퓨터를 포함해서 데이터 센터 및 AI 시장을 노리고 새로운 CPU를 개발하고 있습니다. 2027년까지 출시를 목표로 한 차세대 고성능 CPU인 모나카 (Monaka)가 그것입니다. 모나카는 2nm 공정으로 제조되며 최신 ARM 아키텍처인 Armv9-A이 적용된 150개의 코어를 탑재할 예정입니다. 정확한 벡터 크기가 공개되지 않은 SVE2 (scalable vector extensions 2) 명령어를 사용하는데, 전작인 A64FX가 512bit SVE를 사용한 것을 감안하면 그보다 더 커질 것으로 예상됩니다. 메모리는 DDR5, 인터페이스는 PCIe 6.0 및 CXL 3.0을 지원합니다. 모나카는 여전히 베일에 가린 채 개발 중으로 정확한 목표 성능이나 이를 이용한 슈퍼컴퓨터 시스템의 성능에 대해서는 아직 알려진 바가 없습니다. 다만 코어 숫자가 3배로 늘어나고 최신 아키텍처를 적용하는 데다 개발 공백이 7년 정도나 되는 만큼 후카쿠보다 훨씬 빠른 엑사스케일 슈퍼컴퓨터가 등장할 것으로 예상됩니다. 또 모나카를 통해 데이터 센터와 AI 시장도 진입한다는 계획입니다. 후지쯔는 출시 시점에서 모나카가 다른 경쟁자보다 전력 대비 성능이 2배 정도 우수할 것으로 자신하고 있습니다. 후지쯔는 CPU 분야에서 오랜 기술력을 바탕으로 자신만의 길을 걷고 있지만, 솔직히 말해 인공지능이나 고성능 컴퓨터 분야에서는 시간이 지날수록 미국을 따라잡기가 어려워지는 것이 사실입니다. 자체 아키텍처 슈퍼컴퓨터 자체가 없는 우리나라보단 당연히 앞선 기술력을 지니고 있지만, 그래도 미국의 거대 기술 기업인 인텔이나 AMD, 엔비디아 등과 격차가 자꾸 벌어지는 것입니다. 이것은 시장 점유율과 밀접한 연관이 있습니다. 미국 IT 기업들의 서버 CPU와 GPU는 이미 세계 시장을 장악한 상태입니다. 서버 CPU 부분에서 인텔과 AMD를 넘볼 회사는 현재 거의 없다고 해도 무방한 수준이며 GPU 및 인공지능 시장에서는 엔비디아가 시장을 독점하고 있어 인텔이나 AMD도 끼어들기가 힘든 상황입니다. 이들은 자신들이 장악한 시장에서 막대한 돈을 벌고 이를 다시 연구비로 쏟아부어 차세대 제품 개발을 꾸준히 이어 나갈 뿐 아니라 해당 산업 생태계 자체를 자신들에게 유리하게 만들어 가고 있습니다. 그에 반해 잠시나마 1위를 했던 후카쿠에 사용된 A64FX도 결국 서버 및 고성능 컴퓨팅 시장에 진입하는 데는 실패했다고 봐도 무방합니다. 후카쿠 말고는 쓰이는 곳이 거의 없기 때문입니다. 결국 시장에서 돈을 벌어 차세대 프로세서를 개발하고 다시 이를 통해 시장에서 돈을 벌어들이는 선순환 구조가 어렵다 보니 차세대 제품 개발에 시간이 오래 걸리는 것으로 해석할 수 있습니다. 이런 점을 감안하면 일본 반도체 신화의 재건은 쉬워 보이지 않지만, 결과물이 나오기 전까지 속단은 금물일 수 있습니다. 모나카가 누구도 예상 못했던 깜짝 반전의 드라마를 쓰게 될지 아니면 일본식 갈라파고스화의 또 다른 상징이 될지 결과가 주목됩니다.

2023-10-14 18:05 나우뉴스

모든 것을 바꿨다…인텔 메테오 레이크에서 보여준 타일 아키텍처의 혁신[고든 정의 TECH+]

최근 인텔은 14세대 코어 프로세서인 메테오 레이크의 세부 내용을 공개했습니다. 메테오 레이크는 CPU 코어가 모여 있는 CPU 타일, GPU가 있는 GPU 타일, 기타 기능이 집약된 SoC 타일, 입출력 기능을 담당하는 I/O 타일 네 가지가 베이스 타일 위에 올려진 독특한 구조로 인텔이 10세대 레이크필드에서 시험한 포베로스 (Foveros) 기술을 주력 CPU까지 확장한 첫 번째 제품입니다. 타일 방식의 장점은 각각의 다이의 크기를 줄여 생산 비용을 절감하고 최신 미세 공정이 필요하지 않은 경우에는 좀 더 저렴한 공정을 적용해 비용은 절감하고 성능은 높이는 데 있습니다. 그리고 생산에서도 상당한 유연성을 발휘할 수 있습니다. 만약 메테오 레이크 전체를 최신 미세 공정인 인텔 4 공정으로 제조한다면 상당한 비용이 들어가는 것은 물론 충분한 수량을 공급하기 어렵습니다. 인텔은 빠르게 인텔 3, 20A, 18A 같은 다음 세대 미세 공정으로 진입할 계획이기 때문에 인텔 4 공정 팹을 대규모로 늘릴 수도 없습니다. 그런 상황에서 CPU 타일만 인텔 4 공정으로 제조하고 나머지는 TSMC에서 외주를 주는 방식으로 선회한 것입니다. 물론 TSMC 5nm, 6nm도 상당히 미세 공정이지만, 4nm, 3nm 같은 더 최신 미세 공정이 아니기 때문에 상대적으로 수급이 쉽고 가격 협상에서도 유리합니다. 이런 내용은 이전부터 알려진 것이지만, 최근 인텔은 지금까지 공개하지 않았던 놀라운 이야기를 공개했습니다. 바로 미스터리한 SoC 타일의 정체입니다. TSMC의 6nm 공정이 적용한 SoC 타일은 면적이 오히려 CPU나 GPU 타일보다 커서 상당한 양의 트랜지스터가 집적된 것으로 보이지만, 도대체 뭐가 들어 있는지는 잘 몰랐습니다. 인텔에 의하면 이 안에는 저전력 (LP) 고효율 (E) 코어와 인공지능 연산을 담당하는 NPU, 그리고 GPU에서 독립한 미디어 엔진과 디스플레이 엔진이 숨어 있었습니다. 1. CPU밖의 CPU, LP E코어 컴퓨터의 두뇌는 CPU입니다. 최근에는 프로세서가 복잡해지면서 CPU 이외의 많은 메모리, GPU, 기타 입출력 담당 회로 등 여러 가지가 포함되어 있기는 하지만, CPU는 컴퓨터 메인보드의 가운데 보다 약간 위에 있는 상석을 차지하고 있는 게 일반적입니다. 오디오 칩이나 다른 기능을 관리하는 칩셋은 메인보드 여기저기에 흩어져 있습니다. 하지만 메테오 레이크는 CPU를 CPU 타일 밖에 배치하는 독특한 구성을 선택했습니다. 인텔 CPU 가운데서 첫 번째 시도일 뿐 아니라 사실 지금까지 발표된 CPU 가운데서 비슷한 사례를 찾을 수 없는 독특한 구성입니다. 이 구성의 장점은 빠른 속도로 움직일 필요가 없는 저전력 코어에 비싼 최신 미세 공정을 적용하지 않아도 된다는 것입니다. 메테오 레이크는 고성능 코어 (P 코어)인 레드우드 코브와 고효율 코어 (E 코어)인 크레스트몬트 코어로 되어 있습니다. 여기에 SoC 타일에 있는 저전력 (LP) E 코어까지 합쳐 세 가지 형태의 코어를 지닌 최초의 x86 CPU입니다. 덕분에 노트북에서 초저전력 모드, 저전력 모드, 고성능 모드 등 상황에 맞춰 더 유연한 전력 및 성능 관리할 수 있습니다. 2. 인공지능 가속기를 탑재한 첫 CPU SoC 타일에 들어 있는 두 번째 깜짝 선물은 바로 NPU입니다. 컴퓨터용 CPU에 인공지능 가속기를 탑재한 것은 애플이 최초입니다. 애플의 M 시리즈 칩셋에는 A 시리즈에서 사용한 뉴럴 엔진이 포함되어 각종 인공지능 연산을 더 빠르게 수행할 수 있습니다. 메테오 레이크에 처음 탑재되는 NPU는 CPU 단독으로 사용했을 때보다 8배나 빠르게 인공지능 연산을 수행할 수 있으며 CPU, GPU와 독립적으로 시행되기 때문에 부하를 덜어줄 수 있습니다. 다만 NPU가 윈도우 환경에서 어떤 도움이 될지는 아직 미지수입니다. 우선 생각할 수 있는 건 인공지능을 통해 게임 성능 향상인데, 인텔의 XeSS는 엔비디아의 DLSS보다 적용되는 게임도 적고 기술적으로도 아직 미숙한 상태입니다. 인텔은 윈도우 스튜디오 등 몇몇 애플리케이션에서 이를 응용할 수 있다고 이야기하고 있으나 실제 소비자들이 체감할 수 있는 부분이 얼마나 될지는 두고 봐야 알 수 있을 것 같습니다. 3. GPU와 독립한 Xe 디스플레이, Xe 미디어 엔진 SoC의 타일의 큰 면적 중 일부는 본래 GPU에 포함되었던 Xe 디스플레이, Xe 미디어 엔진에 할당됐습니다. Xe 디스플레이 엔진은 최대 8K, 60프레임 출력과 HDMI 2.1 디스플레이포트 2.1등의 규격을 담당합니다. 만약 4K 모니터라면 최대 4개까지 지원이 가능합니다. Xe 미디어 엔진은 8K 60프레임/10비트 HDR 영상 인코딩, 디코딩 지원, VP9, AVC, HEVC, AV1 같은 최신 코덱을 지원합니다. 하지만 사실 이것만으로는 소비자가 체감할 변화가 있다고 보기는 어렵습니다. 진짜 중요한 변화는 사실 5nm 공정으로 만든 GPU 타일에 있습니다. GPU에서 빠르게 움직일 필요가 없는 인공지능 가속기와 디스플레이 출력, 동영상 처리 기능을 빼서 SoC 타일에 넣었기 때문에 GPU 성능이 한층 강화됐습니다. 메테오 레이크의 내장 GPU인 Xe-LPG는 모두 8개의 Xe 코어를 탑재하고 있으며 각각의 코어는 16개의 256비트 벡터 엔진을 탑재해 전 세대보다 33%가 늘어났습니다. 별도의 GPU 타일을 이용하고 최신 미세 공정을 적용한 만큼 성능 향상은 33% 이상일 가능성이 높습니다. 종합하면 메테오 레이크는 인텔의 CPU 설계 사상이 완전히 달라졌다는 사실을 보여주고 있습니다. CPU, GPU, NPU, 칩셋 등 여러 가지 구성 요소를 기능에 따라 묶은 것이 아니라 성능과 클럭에 따라 묶어서 최적의 성능을 내면서 비용은 절감하는 방식을 선택한 것입니다. 타일 아키텍처를 선택하면서 제조 방식만 바꾼 게 아니라 설계 사상과 구조도 거기에 맞게 뜯어고친 셈입니다. 다만 소비자 입장에서는 설계 사상이 무엇이고 어떤 타일을 사용했는가 보다는 성능과 가격이 더 큰 관심사일 수밖에 없습니다. 메테오 레이크는 올해 말 출시 예정으로 이를 탑재한 노트북이 연말과 연초에 대거 출시될 것으로 보입니다. 그때가 되면 구체적으로 뭐가 좋아졌는지 확실하게 알게 될 것입니다.

2023-09-23 13:22 나우뉴스

‘6만 전자’ 복귀에 개미들 한탄…증권가는 “매수 기회”

반도체 대장주 삼성전자 주가가 연이틀 60만원대로 주저앉았다. 20일 한국거래소에 따르면 코스피시장에서 삼성전자는 전 거래일 대비 0.29% 떨어진 6만 9600원에 장을 마쳤다. 전날 6만 9800원으로 7만원 선이 무너진 뒤 이틀 연속 ‘6만 전자’에 머물렀다. 삼성전자 주가가 6만원대를 기록한 것은 지난달 31일(6만 6900원) 이후 약 3주일 만이다. 세계 최대 반도체 파운드리(위탁생산) 업체 TSMC가 최근 주요 반도체 장비 업체에 제품 납품을 늦춰 달라고 통보한 사실이 알려지며 반도체 경기에 대한 우려가 확산했기 때문이다. 이 회사의 3분기 실적 부진 전망 역시 삼성전자 주가를 끌어 내렸다. 이승우 유진투자증권 연구원은 “삼성전자 3분기 영업이익은 1조 6000억원으로 시장 예상치인 3조원을 밑돌 전망”이라고 했다. 고점에 물린 뒤 주가 회복을 노리던 개미(개인투자자) 사이에서는 곡소리가 났다. 삼성전자 종목 토론방 한 투자자는 “이제 6만 전자 굳히기에 들어간 것이냐”는 글을 남겼다. 또 다른 투자자는 “‘5만 전자’만은 면해야 하는 게 아닌가”라고 한탄했다. 이달 초만 하더라도 삼성전자 주가는 미국 인공지능(AI) 반도체 기업 엔비디아발(發) 훈풍 속에 상승세를 나타냈다. 시장에서는 ‘9만 전자’ 기대감이 부풀어 올랐다. AI용 그래픽처리장치(GPU) 반도체에 쓰이는 고대역폭메모리(HBM3)를 이르면 다음 달부터 엔비디아에 공급한다는 호재가 주가를 강하게 밀어 올렸다. HBM은 기존 D램보다 데이터 처리 속도를 혁신적으로 끌어올린 제품으로 AI의 데이터 학습에 활용된다. 1세대(HBM)·2세대(HBM2)·3세대(HBM2E)·4세대(HBM3)·5세대(HBM3E) 순으로 개발되고 있다. 그러나 증권가는 여전히 삼성전자 주가 흐름에 낙관적이다. 3분기 실적 부진이 오히려 저점 매수 기회라는 분석이다. 박유악 키움증권 연구원은 “3분기 실적이 예상보다 부진하지만 대부분은 대규모 감산에 따른 비용 부담 때문”이라며 “오히려 현재 시점부터는 HBM 판매 확대와 메모리 가격 반등 등 사업 펀더멘털(기초 체력) 개선이 삼성전자의 주가 상승을 뒷받침하기 시작할 것”이라고 했다.

2023-09-20 18:29 서울신문

반등 기대감 솔솔… 반도체·조선·방산업 주목하세요[양은희 PB의 생활 속 재테크]

최근 글로벌 증시는 지지부진한 흐름을 나타냈다. 지난달 미국 연방공개시장위원회(FOMC) 위원들이 추가 금리 인상이 필요할 수 있다는 의견을 제시한 7월 의사록이 공개되며 금리 인상 우려가 재부각됐다. 지난 한 달 동안 스탠더드앤드푸어스(S&P)500지수와 나스닥지수는 각각 1.76%, 1.33% 하락했다. 중화권 증시는 중국 경기침체 우려에 부동산 개발 업체 디폴트(채무불이행) 위기까지 겹쳐 크게 휘청였다. 같은 기간 홍콩항셍지수는 8.14%, 중국상하이종합지수는 5.20% 급락했다. 국제 유가 상승에 따른 인플레이션 리스크도 글로벌 증시에 악재로 작용했다. 국내 증시도 덩달아 하방 압력을 받았다. 올 초부터 상승장을 주도해 온 이차전지와 중국발(發) 리오프닝 수혜로 급등했던 소비재를 중심으로 차익 실현 매물이 쏟아진 탓에 코스피와 코스닥지수가 각각 4.15%, 1.20% 떨어졌다. 그러나 국내 증시 흐름이 하락 추세로 돌아서지는 않을 것으로 전망된다. 단기적으로는 중국발 악재에 따른 하방 압력이 존재하지만 중국 정부가 시장에 강한 통제력을 행사하고 은행권 부동산 익스포저(위험 노출액) 역시 하락하고 있으며 부동산 관련 파생상품도 적다는 점을 고려할 때 현재의 부동산 침체가 전반적인 시스템 리스크로 번질 가능성은 낮다는 판단이다. 미국 인공지능(AI) 반도체 기업 엔비디아발 호재도 잇따르며 국내 증시에 훈풍을 불어넣고 있다. 지난달 엔비디아가 발표한 2분기 매출은 135억 1000만 달러로 전년 같은 기간보다 2배 늘었다. 뒤이어 국내 반도체 업체들의 실적 개선 기대가 부각됐고, 코스피시장 ‘대들보’ 역할을 하는 삼성전자가 AI용 그래픽처리장치(GPU) 반도체에 쓰이는 고대역폭메모리(HBM3)를 이르면 다음달부터 엔비디아에 공급한다는 소식이 전해지며 주가를 밀어 올렸다. 다만 글로벌 증시 불확실성이 커진 만큼 리스크 관리는 필요하다. 금융시장 변동성 확대를 경계하며 현금 비중을 늘리는 동시에 미국 국고채 금리가 하향 안정된 이후 반등이 기대되는 성장주를 중심으로 투자 포트폴리오를 다변화하는 전략을 권한다. 특히 하반기 실적 개선이 기대되는 반도체, 조선, 방산 등의 종목에 분산 투자하는 방안을 추천한다. 국내 조선업종은 국제해사기구(IMO) 등 유엔 산하 전문기구의 탄소배출 저감 규제 강화 움직임에 힘입어 친환경 연료 추진 선박 수요 증가의 수혜를 입을 전망이다. 우크라이나와 러시아 간 전쟁으로 에너지 시장이 불안해지며 액화천연가스(LNG) 확보도 중요해진 터라 해양플랜트 발주 확대는 국내 조선주 상승을 이끌 것으로 보인다. 한국투자증권 송파PB센터 영업팀장

2023-09-06 23:56 서울신문

엔비디아發 훈풍 올라탄 삼성전자… ‘9만전자’ 시대 다시 올까요

삼성전자가 미국 인공지능(AI) 반도체 기업 엔비디아발(發) 훈풍을 타고 주가가 거침없이 상승하면서 다시 한번 ‘9만전자’ 기대감이 높아지고 있다. 4일 한국거래소에 따르면 이날 삼성전자 주가는 전 거래일보다 0.28% 오른 7만 1200원에 장을 마감했다. 전 거래일인 지난 1일에는 6.13% 급등한 7만 1000원에 거래를 마쳤다. 삼성전자 주가가 7만원대로 올라선 것은 지난달 1일(7만 1100원) 이후 약 한 달 만이다. AI용 그래픽처리장치(GPU) 반도체에 쓰이는 고대역폭메모리(HBM3)를 이르면 다음달부터 엔비디아에 공급한다는 호재가 주가를 강하게 밀어올렸다. HBM은 여러 개의 D램을 수직으로 연결해 기존 D램보다 데이터 처리 속도를 혁신적으로 끌어올린 제품이다. GPU에 탑재되며 AI가 대규모 데이터를 학습하기 위해 활용된다. 1세대(HBM)·2세대(HBM2)·3세대(HBM2E)·4세대(HBM3)·5세대(HBM3E) 순으로 개발되고 있다. 올해 들어 이날까지 삼성전자 주가는 30% 가깝게 올랐지만 경쟁사와 비교하면 상승폭이 기대에 미치지 못한다. SK하이닉스는 연초 대비 57.4% 상승했고, 국내 반도체 종목을 묶은 ‘KRX 반도체’ 지수마저 59.4% 뛰었다. 같은 기간 개미(개인투자자)들이 삼성전자 주식을 10조 4540억원어치 순매도한 반면 외국인 투자자는 13조 6510억원어치 순매수했다. 증권가는 삼성전자 주가가 HBM 호재를 타고 2021년 1월 11일 기록한 9만 1000원 전고점을 넘어설지 주목하고 있다. HBM 수요 급증이 삼성전자 주가 회복 시기를 앞당길 것이란 기대다. 당초 업계는 하반기 정보통신기술(ICT) 산업 침체로 인해 하반기 삼성전자 실적이 지지부진한 흐름을 보일 것으로 내다봤다. 김동원 KB증권 연구원은 “삼성전자는 올해 엔비디아, AMD를 HBM 신규 고객사로 확보하는 동시에 내년 HBM 고객사가 최대 10개까지 확대될 것으로 예상돼 4분기부터 주가가 HBM 프리미엄 구간에 진입할 것”이라고 말했다. 이어 “향후 삼성전자 주가는 HBM 점유율 확대와 파운드리 실적 개선 전망 등을 동시에 고려할 때 직전 고점인 9만 1000원을 돌파할 가능성이 클 것”이라고 예측했다.

2023-09-05 02:08 서울신문