서울신문 검색

찾아보고 싶은 뉴스가 있다면,

검색

최근검색어

GPU 메모리

2026-06-19

검색기록 지우기
소외

2026-06-19

검색기록 지우기
미성년

2026-06-19

검색기록 지우기
예방

2026-06-19

검색기록 지우기
명목

2026-06-19

검색기록 지우기

저장된 검색어가 없습니다.

검색어 저장 기능이 꺼져 있습니다.

검색어 저장 끄기

전체삭제

기자명

총 299 건

검색 필터 목록

[고든 정의 TECH+] 바다에 넣는 것도 부족? 끓는 액체에 서버 넣어버린 마이크로소프트

전 세계적으로 인터넷 서비스에 대한 수요가 폭증하면서 IT 기업들은 막대한 데이터를 실시간으로 처리할 수 있는 데이터 센터 구축에 열을 올리고 있습니다. 하지만 이 과정에서 뜨거워진 서버를 식히는 일이 새로운 과제로 떠오르고 있습니다. 최첨단 기술이 집약된 CPU, GPU, 메모리, SSD, HDD 등 각종 서버 부품들은 많은 전력을 소모하고 이를 열에너지의 형태로 배출하기 때문입니다. 수많은 서버가 밀집한 대형 데이터 센터는 필연적으로 엄청난 열기를 내뿜게 되어 있습니다. 하지만 반도체를 포함해서 대부분의 전자 제품은 높은 열에 취약합니다. 결국 정상적인 작동을 보장하기 위해서는 열을 빠르게 식혀줘야 합니다. 서버를 가동할 때는 물론이고 서버를 냉각하는 과정에서도 막대한 양의 전력이 소모됩니다. 데이터 센터에 들어가는 전력은 운용하는 기업 입장에서는 모두 비용입니다. 그리고 아직 전기 생산의 상당 부분이 화석 연료에 의존하고 있기 때문에 환경에도 좋지 않습니다. 하지만 그렇다고 서버에 들어가는 전력을 줄일 순 없습니다. 결국 냉각에 들어가는 에너지를 줄여야 한다는 결론이 나옵니다. 이를 위해 IT 기업들은 여러 가지 신기술을 개발하고 있습니다. 그 중 하나로 마이크로소프트는 차가운 바다에 서버를 담그는 프로젝트 나틱 (Natick)을 진행하고 있습니다. 강철 실린더 내부에 서버를 탑재한 후 바다에 넣으면 차가운 물에 의해 서버를 쉽게 식힐 수 있다는 아이디어입니다. 그러나 높은 수압과 부식을 견딜 수 있는 특수 컨테이너를 제작해야 하는 데다 수리가 까다롭다는 문제점이 있습니다. 바닷속에 서버를 넣는 것 자체는 기술적으로 가능하겠지만, 과연 비용을 절감도 가능할지는 의문입니다. 그런데 마이크로소프트는 여기서 한술 더 떠서 아예 끓는 액체에 서버를 담그는 프로젝트를 진행하고 있습니다. 서버를 끓는 점이 섭씨 50도인 특수 용액에 담가 그 온도 이상으로 오르지 않게 냉각하는 것입니다. 액체는 기체보다 열을 전달하는 능력이 우수하고 CPU나 GPU처럼 특정 부품이 아니라 서버 전체를 골고루 냉각할 수 있다는 점에서 일반적인 공랭식 냉각 시스템보다 더 우수한 효과를 기대할 수 있습니다. (사진) 이 방법은 상당히 혁신적이고 새로운 기술처럼 보이지만, 사실은 생각보다 오래전부터 사용된 기술입니다. 전자제품을 절연성 액체에 넣어 냉각시키는 기술을 침지 냉각 (immersion cooling) 혹은 액침 냉각 (liquid immersion cooling)이라고 부르는데, 이미 고성능 컴퓨터 냉각에 오래전부터 사용되고 있었습니다. 다만 일반적인 냉각 시스템에 비해 관리가 쉽지 않고 가격이 비싸 널리 상용화되지 않았을 뿐입니다. 그런데 최근 데이터 센터에서 열관리가 새로운 과제로 떠오르자 액침 냉각 기술이 다시 주목받고 있습니다. 이미 3M은 불소 소재를 이용한 절연성 냉각액인 노벡 엔지니어드 플루이드를 출시한 바 있습니다. 이 제품은 기가바이트나 후지쯔에서 개발한 액침 냉각 서버에 일부 사용됐지만, 아직 대규모 클라우드 서비스 기업에서 사용된 적은 없었습니다.마이크로소프트가 공개한 테스트 서버 역시 3M 제품을 사용합니다. 만약 마이크로소프트가 본격 도입된다면 주요 클라우드 서비스 기업 가운데 첫 번째로 액침 냉각 서버를 사용한 사례가 될 것입니다. 좀 더 기술적으로 깊이 들어가면 마이크로소프트의 액침 냉각 서버는 2상 액침 냉각 (two-phase liquid immersion cooling) 방식을 사용합니다. 서버가 작동하면 주요 부품의 온도가 섭씨 50도는 쉽게 넘기기 때문에 냉각액은 바로 펄펄 끓으면서 기체가 됩니다. 기화된 냉각액은 밀폐된 서버 상부의 냉각 코일에서 다시 액체로 변해 아래로 떨어지게 됩니다. 서버 안에서 기화와 응결의 두 과정(2상)을 거치는 것입니다. 이 방식을 통해 에너지를 5-15% 정도 절감하고 서버를 더 효과적으로 냉각해 안정적인 작동을 보장하는 것입니다. 참고로 3M 냉각액은 전자 제품에 손상을 주지 않으며 서버 역시 액체에 넣는 것을 고려해 제작되었기 때문에 장기간 작동을 보장합니다. 다만 이 방법은 기존의 냉각 방식보다 가격이 비싸고 상대적으로 관리가 까다롭습니다. 따라서 추가 비용보다 절감할 수 있는 에너지 비용이 많다는 점과 장애 없는 안정적인 서버 유지가 가능하다는 점을 입증해야 합니다. 이 과정은 몇 년 정도 걸릴 것입니다. 계속해서 서버를 액체 속에 담그는 마이크로소프트의 시도가 어떤 결실을 맺게 될지 궁금합니다. 고든 정 칼럼니스트 jjy0501@naver.com

2021-04-14 09:45 나우뉴스
‘脫인텔’ 애플, 자체 개발 칩세트 심어… 결과는 ‘OK’

애플의 노트북 신제품인 ‘M1 맥북프로 13인치’ 모델은 인텔에 있어 씁쓸함을 안겨 준 제품이다. 2005년부터 15년간 협력 관계를 유지하면서 인텔의 중앙처리장치(CPU)를 사용해 온 애플이 지난해 11월 ‘결별 선언’을 하고 곧장 자체 개발 칩세트 M1을 심은 것이 맥북프로 13인치다. 인텔 입장에선 ‘얼마나 잘 만들었나 한번 보자’는 마음도 있었겠지만 애플은 M1 맥북프로를 통해 결별 선언이 ‘이유 있는 자신감’에서 비롯된 것임을 드러냈다. 일주일가량 사용해 본 M1 맥북프로는 빠르면서 배터리 효율도 뛰어난 제품이란 인상을 받았다. 그럴 수 있었던 것은 애플이 설계한 칩세트인 M1의 성능이 좋은 데다가 맥북프로에 최적화돼 있는 덕분이다. M1은 PC의 두뇌라고 할 수 있는 CPU뿐 아니라 그래픽처리장치(GPU), 메모리 등이 한곳에 모여 있어 전작에 비해 처리 효율성이 크게 향상됐다. 맥북프로의 프로그램과 인터넷창을 한꺼번에 30여개 열어 봤는데도 딱히 구동이 느려지는 것을 느낄 수 없었다. 기존 제품보다 배터리 수명이 2배 늘어났다는 설명답게 일반적인 작업은 충전 없이 10시간을 훌쩍 넘겨도 문제가 없었다. 사용자들이 가장 걱정하던 프로그램 호환성 문제도 나름의 해결책을 내놨다. 인텔의 CPU와 애플의 M1은 각자 명령을 해석하는 방식이 달라서 일종의 번역이 필요하다. 그렇기에 인텔 CPU를 위해 만들어진 프로그램을 M1 맥북프로에서 사용하려면 ‘로제타2’라는 애플리케이션(앱)으로 번역을 거쳐야 했다. 대다수의 프로그램들은 문제 없이 실행이 되는 편이었는데 일부는 실행 도중 오류가 났다. 지난해 12월 공인인증서 제도가 폐지된 것도 맥북 사용자에겐 반가운 소식이다. 그동안 맥북에서 사용하기 쉽지 않았던 공인인증서 대신에 카카오톡, 패스(PASS) 등 민간인증서를 활용하니 국세청 ‘홈택스’를 통한 연말정산도 큰 문제 없이 마무리 지을 수 있었다. M1 맥북프로는 애플의 스마트폰이나 태블릿PC 제품과도 호환성이 좋았다. 애플의 스마트폰 신제품인 ‘아이폰12 프로’로 사진을 찍은 뒤 곧바로 맥북프로에서 확인이 가능했다. 아이폰이나 아이패드용 앱도 맥북용 앱장터에서 그대로 내려받을 수 있었다. 기존에 유료로 구매했던 앱들을 계속 사용할 수 있다는 것은 장점이다. 하지만 일부 개발사는 맥북에서는 앱 사용이 불가능하게 막아 놓거나, 아예 앱장터에 안 올려 놓기도 해서 아이폰을 사용할 때와 완전히 같은 사용환경은 아니었다. 무게는 1.4㎏으로 아주 무겁지는 않지만 다른 노트북과 비교한다면 휴대성이 좋지는 않았다. 본체 왼쪽에 USB-C 포트가 두 개 있기는 한데 국내에서 많이 쓰는 USB-A를 사용하려면 USB 허브를 별도로 사야 한다는 점도 아쉬웠다. 글 사진 한재희 기자 jh@seoul.co.kr

서울신문
[리뷰]‘M1 맥북프로’ 써보니 “인텔 칩 없이도 이게 되는구나”

애플의 노트북 신제품인 ‘M1 맥북프로 13인치‘ 모델은 인텔에 있어 씁쓸함을 안겨 준 제품이다. 2005년부터 15년간 협력 관계를 유지하면서 인텔의 중앙처리장치(CPU)를 사용해 온 애플이 지난해 11월 ‘결별 선언’을 하고 곧장 자체 개발 칩세트 M1을 심은 것이 맥북프로 13인치다. 인텔 입장에선 ‘얼마나 잘 만들었나 한번 보자’는 마음도 있었겠지만 애플은 M1 맥북프로를 통해 결별 선언이 ‘이유 있는 자신감’에서 비롯된 것임을 드러냈다. 일주일가량 사용해 본 M1 맥북프로는 빠르면서 배터리 효율도 뛰어난 제품이란 인상을 받았다. 그럴 수 있었던 것은 애플이 설계한 칩세트인 M1의 성능이 좋은 데다가 맥북프로에 최적화돼 있는 덕분이다. M1은 PC의 두뇌라고 할 수 있는 CPU뿐 아니라 그래픽처리장치(GPU), 메모리 등이 한곳에 모여 있어 전작에 비해 처리 효율성이 크게 향상됐다. 맥북프로의 프로그램과 인터넷창을 한꺼번에 30여개 열어 봤는데도 딱히 구동이 느려지는 것을 느낄 수 없었다. 고해상도 동영상 편집 작업 중에도 끊김과 발열이 거의 느껴지지 않았다. 노트북을 덮었다가 다시 펼 때 거의 지연 없이 곧바로 화면이 등장했다. 기존 제품보다 배터리 수명이 2배 늘어났다는 설명답게 일반적인 작업은 충전 없이 10시간을 훌쩍 넘겨도 문제가 없었다.사용자들이 가장 걱정하던 프로그램 호환성 문제도 나름의 해결책을 내놨다. 인텔의 CPU와 애플의 M1은 각자 명령을 해석하는 방식이 달라서 일종의 번역이 필요하다. 그렇기에 인텔 CPU를 위해 만들어진 프로그램을 M1 맥북프로에서 사용하려면 ‘로제타2’라는 애플리케이션(앱)으로 번역을 거쳐야 했다. 대다수의 프로그램들은 문제 없이 실행이 되는 편이었는데 일부는 실행 도중 오류가 났다. 지난해 12월 공인인증서 제도가 폐지된 것도 맥북 사용자에겐 반가운 소식이다. 그동안 맥북에서 사용하기 쉽지 않았던 공인인증서 대신에 카카오톡, 패스(PASS) 등 민간인증서를 활용하니 국세청 ‘홈택스’를 통한 연말정산도 큰 문제 없이 마무리 지을 수 있었다.M1 맥북프로는 애플의 스마트폰이나 태블릿PC 제품과도 호환성이 좋았다. 애플의 스마트폰 신제품인 ‘아이폰12 프로’로 사진을 찍은 뒤 곧바로 맥북프로에서 확인이 가능했다. 아이폰이나 아이패드용 앱도 맥북용 앱장터에서 그대로 내려받을 수 있었다. 기존에 유료로 구매했던 앱들을 계속 사용할 수 있다는 것은 장점이다. 하지만 일부 개발사는 맥북에서는 앱 사용이 불가능하게 막아 놓거나, 아예 앱장터에 안 올려 놓기도 해서 아이폰을 사용할 때와 완전히 같은 사용환경은 아니었다. 무게는 1.4㎏으로 아주 무겁지는 않지만 다른 노트북과 비교한다면 휴대성이 좋지는 않았다. 본체 왼쪽에 USB-C 포트가 두 개 있기는 한데 국내에서 많이 쓰는 USB-A를 사용하려면 USB 허브를 별도로 사야 한다는 점도 아쉬웠다. 한재희 기자 jh@seoul.co.kr

2021-01-31 16:17 서울신문
[고든 정의 TECH+] 러시아의 CPU 자력갱생은 과연 성공할 수 있을까?

냉전 시절 구소련은 미국을 중심으로 한 서방 세력에 맞서기 위해 과학기술 개발에 온 힘을 쏟았습니다. 하지만 이런 노력에도 IT 분야에서는 서방측을 따라잡기는커녕 자꾸만 격차가 벌어졌습니다. 중앙집권적 관료들의 지배를 받는 구소련의 IT 기구들은 자유로운 연구와 창업이 보장된 서방의 IT 혁신을 따라잡을 수 없었습니다. 이런 상황에서 구소련이 선택할 수 있는 가장 합리적인 해결책은 서방의 기술을 복제해 CPU를 만드는 것입니다. 구소련의 과학자들은 역설계 기술을 통해 인텔, IBM 등 서방 제조사의 CPU를 복제한 해적판 CPU를 만들었습니다. 물론 소프트웨어라고 해서 예외는 아니었습니다. 그러나 구소련이 붕괴되고 라이선스 없이 마음대로 서방측 기술을 사용할 수 없게 되자 새로운 대안이 필요했습니다. 1992년 모스크바 물리기술 대학의 스핀 오프 기업으로 설립된 MCST(Moscow Center of SPARC Technologies)는 이름처럼 미국 IT 기업인 Sun(나중에 오라클에 인수)이 개발한 SPARC 계열 CPU를 연구하고 개발하기 위해 설립됐습니다. 하지만 이 회사는 또 다른 서방측 프로세서 기술에도 주목했습니다. 바로 VLIW(Very long instruction word) 기반 아키텍처입니다. VLIW는 동시에 여러 명령어를 처리할 수 있는 기술로 주목받았으나 사실 주류에 해당하는 x86이나 ARM 아키텍처에 밀려 큰 힘을 쓰지는 못하고 있습니다. 현재는 특수 목적의 임베디드 프로세서나 일부 GPU에 사용되고 있을 뿐입니다. 그런 VLIW 아키텍처가 러시아에서 부흥한 이유는 서방측의 제재에 맞서 러시아산 x86 호환 프로세서가 필요했기 때문입니다. MCST가 개발한 엘브루스(Elbrus) CPU는 내부적으로는 VLIW로 돌아가지만 x86 명령어를 번역하는 방법으로 x86 기반 윈도우나 리눅스 운영체제를 구동할 수 있습니다. 이는 일종의 VLIW 방식 CPU였던 인텔 아이테니엄(Itanium)이나 지금은 사라진 저전력 x86 호환 프로세서인 트랜스메타의 크루소(Crusoe)와 같은 방식입니다. 엘브루스 CPU의 최신 버전은 2018년 말 생산을 시작한 엘브루스-8SV(Elbrus-8SV)로 대만 TSMC의 28nm 공정으로 제조한 8코어 CPU입니다. 27.8억개의 트랜지스터를 집적한 나름 큰 프로세서로 4채널 DDR4 2400 메모리와 16MB L3 캐시 메모리, 1.5GHz 클럭을 지니고 있습니다. 이론적 연산 능력은 단정밀도에서 576GFLOPS이지만, x86 명령어를 처리하는 경우 성능이 하락한다는 점을 감안해야 합니다. 실제적인 성능은 서방측 최신 x86 CPU는 물론 ARM 기반 고성능 프로세서에 크게 못 미치는 것으로 알려져 있습니다. 하지만 러시아 입장에서는 서방의 제재에도 x86 호환 CPU를 자체 공급할 수 있다는 사실이 더 중요할 것입니다. 최근 러시아 연방 산업 통상부는 32코어 고성능 엘브루스 CPU를 개발하기 위해 75억 루블(1092억원)을 투자하겠다고 발표했습니다. 러시아 입장에서는 상당한 거금을 들여 신형 CPU를 개발하는 것으로 2025년까지 현재 서방측 서버 CPU를 넘볼 수 있는 프로세서를 개발하는 것이 목표입니다. 32코어 엘브루스 CPU는 7nm 미세 공정을 사용하며 DDR5 및 PCIe 5.0 같은 최신 기술을 적용할 예정입니다. 계획대로만 된다면 엘브루스 CPU는 미국 이외의 국가에서 제조하는 x86 호환 CPU 가운데 가장 강력한 성능을 지닌 CPU가 될 것입니다. 하지만 러시아가 서방측 제재를 뚫고 순조롭게 차세대 CPU를 개발할 수 있을지는 아직 미지수입니다. 가장 큰 문제는 러시아는 자체 반도체 제조 시설이 매우 낙후되어 있다는 것입니다. 엘브루스의 경우 90nm 공정을 사용한 엘브루스 2S 시리즈까지는 어떻게든 러시아 자체 팹을 사용했으나 그 이하 미세 공정을 러시아 내에서 확보할 방법이 없어 결국 TSMC에 위탁 생산을 하는 수밖에 없었습니다. 7nm 미세 공정은 현재 러시아 사정을 생각할 때 5년이 아니라 10년 후에도 가능할지 의문스러운 수준으로 결국 TSMC 같은 외국 제조사의 힘을 빌려야 합니다. 미국 등 서방측이 이 부분까지 제재할 경우 러시아의 CPU 자력갱생은 상당한 어려움에 처할 것입니다. 물론 DDR5 같은 최신 메모리 역시 한국 등 다른 나라에서 전량 수입해야 하는 처지입니다. 하지만 러시아 입장에서는 하나라도 더 자체 생산하는 편이 안전하기 때문에 32코어 엘브루스 프로세서 개발 계획을 철회하지는 않을 것으로 생각됩니다. 러시아 역시 서방측이 CPU에 백도어를 숨겨두지 않았을까 걱정하고 있기 때문에 설령 위탁생산을 하더라도 군용 및 정부용 컴퓨터에는 자체 설계 CPU를 사용할 수밖에 없는 것입니다. 사실 경제 논리로 생각하면 러시아도 다른 나라처럼 인텔이나 AMD CPU를 사용하는 것이 가장 합리적입니다. 좁은 러시아 내수 시장을 위해 소량 생산되는 만큼 성능이 낮다고 가격을 낮출 수도 없습니다. 가성비가 낮은 만큼 엘브루스 CPU는 미국제 CPU를 사용할 수 없는 피치 못할 사정이 있고 혹시 러시아가 심었을지도 모르는 백도어가 걱정되지 않는 국가가 아니라면 도입할 가능성도 희박합니다. 수출로 활로를 뚫어 경제성을 확보할 가능성이 거의 없다는 것이죠. 그러나 경제 논리를 대신할 러시아의 정치적 사정이 있는 만큼 세상에서 가장 기이한 x86 호환 CPU인 엘브루스의 진화는 당분간 계속될 것입니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-12-03 09:39 나우뉴스
AI 반도체 시장 뛰어든 SKT…‘인텔, 엔비디아에 도전장’

SK텔레콤이 이번에는 인공지능(AI) 반도체 산업에 진출한다. SK텔레콤은 메모리 반도체에서 강세를 보이는 SK하이닉스를 자회사로 보유하고 있긴 하지만 직접 반도체를 개발해서 이것의 ‘세일즈’에 팔을 걷어붙이고 나서는 것은 이번이 처음이다. SK텔레콤은 25일 경기 고양시 킨텍스에서 열린 ‘한국판 뉴딜, 대한민국 인공지능을 만나다’ 행사를 통해 인공지능(AI) 반도체인 ‘사피온 X220’을 공개했다. 2017년부터 반도체 개발에 뛰어들어 그동안 자체 수급용으로 칩을 만들었으나 이번 제품은 고객사에도 판매할 계획이다. 온라인쇼핑, 모빌리티, 온라인동영상서비스(OTT), 음악감상서비스, 앱장터 등에 뛰어든 SK텔레콤이 ‘탈통신’ 사업 진출에 박차를 가하는 모양새다. SK텔레콤은 “국내 최초의 데이터센터용 AI 반도체”라면서 “이번 출시를 통해 SK텔레콤은 엔비디아, 인텔, 구글 등 글로벌 빅테크 기업 중심의 미래 반도체 시장에 출사표를 던졌다”고 밝혔다. AI반도체 산업는 ‘제2의 D램’이라 불릴 정도로 미래 전망이 밝다. 사람 뇌의 신경망을 모방해 한꺼번에 수십~수천개의 연산을 동시에 실행하는 AI 반도체는 입력 순서에 따라 데이터를 순차 처리하는 기존 반도체의 한계를 극복했다. 전력소모도 낮다. 자율주행차나 스마트폰 등이 고도화될수록 AI반도체의 쓰임이 더 많아질 것으로 전망된다. 시장조사기관 가트너에 따르면 글로벌 AI 반도체 시장은 2018년 약 7조 8000억원에서 2024년 약 50조원으로 연평균 36%의 가파른 성장이 예상된다.SK텔레콤 관계자는 “‘사피온 X220’은 기존 그래픽처리장치(GPU) 대비 성능이 우수하고 가격이 저렴하다”면서 “‘사피온 X220’은 GPU 대비 딥러닝 연산 속도가 1.5배 빠르기 때문에 데이터센터에 적용시 데이터 처리 용량이 1.5배 증가한다”고 밝혔다. 이어 “가격은 GPU의 절반 수준이고 전력 사용량도 80%에 불과하다”고 덧붙였다. ‘사피온 X220’이 적용되면 SK텔레콤의 AI비서인 ‘누구’의 음성인식 능력이 향상되고, ‘T뷰’의 영상 관제 기능이 개선될 것으로 보인다. SK텔레콤은 올해부터 자사 서비스에 ‘사피온 X220’을 적용할 예정이다. 내년부터는 고객사를 확보해 위탁생산(파운드리)을 통한 양산에 돌입할 예정이다. SK텔레콤은 현재 개발중인 후속 제품도 2022년 양산하는 것을 목표로 잡고 있다. SK텔레콤 관계자는 “SK하이닉스는 메모리 분야에서 잘하고 있다. 데이터센터용 AI 반도체 부문은 사업 영역이 겹치지 않을 것”이라고 말했다. 또한 SK텔레콤은 이날 자사의 AI 반도체 브랜드인 ‘사피온’도 함께 공개했다. ‘사피온’은 인류를 뜻하는 ‘사피엔스’와 영겁의 시간을 뜻하는 ‘이온’의 합성어다. 인류에게 AI 반도체 기반 인공지능 혁신의 혜택을 지속 제공하겠다는 의지를 담았다고 회사 측은 설명했다. 한재희 기자 jh@seoul.co.kr

2020-11-25 13:58 서울신문
[고든 정의 TECH+] 애플 M1 프로세서 탑재 맥 시리즈 공개…애플의 노림수는?

지난 10여 년 간 애플의 가장 큰 수익원은 아이폰이나 아이패드 같은 iOS 기기였습니다. 사람들의 관심 역시 모바일 기기에 집중되면서 맥(Mac)에 대한 관심은 상대적으로 적어졌습니다. 하지만 올해는 다른 모습입니다. 애플이 2006년부터 사용했던 인텔 CPU를 자체 개발한 ARM 기반 칩으로 교체한다는 폭탄 선언을 했기 때문입니다. 사실 루머로는 몇 년 전부터 나왔던 이야기인데, 막상 현실이 되니 세간의 관심이 집중된 것입니다. 애플 매킨토시는 1984년 첫 출시 때부터 10년 동안 모토로라 68000 계열 CPU를 사용했습니다. 그러다가 1994년부터 IBM 파워PC(PowerPC) 계열로 갈아탔습니다. 당시만 해도 애플은 파워PC의 성능이 인텔 CPU보다 우수하다고 주장했습니다. 그러나 애플은 2006년에 돌연 맥 CPU를 인텔 프로세서로 변경합니다. 여기에는 그럴 만한 이유가 있었습니다. IBM의 파워PC의 성능은 강력하긴 했지만, 기본적으로 고성능 PC와 서버를 목표로 개발되어 저전력 성능이 중요한 노트북에는 적합하지 않았습니다. 반면 당시 인텔은 전력 대 성능비를 획기적으로 개선한 코어 듀오(Core Duo) 프로세서를 출시했습니다. 인텔 프로세서의 개선 방향은 스티브 잡스가 생각한 맥의 미래와 일치했습니다. 저전력 성능을 크게 강화한 인텔 프로세서 덕분에 애플은 맥북 에어처럼 획기적으로 얇고 가벼운 노트북을 개발할 수 있었습니다. 하지만 몇 년 전부터 애플이 인텔 프로세서 대신 자체 프로세서를 사용할 것이라는 루머가 꾸준히 제기되었습니다. 이유는 간단합니다. 인텔 프로세서는 몇 년째 14nm 공정과 오래된 아키텍처에서 벗어나지 못하고 있지만, 애플의 A 시리즈 프로세서는 미세 공정과 아키텍처를 꾸준히 개량해 x86 CPU를 넘볼 수준까지 성능이 올라갔기 때문입니다. 애플 자체 칩과 인텔 칩의 성능 차이가 별로 없다면 애플 입장에서는 굳이 x86과 ARM으로 생태계를 분리할 이유가 없습니다. 맥에 자체 프로세서를 탑재할 경우 비용 절감 효과는 물론이고 애플 생태계에 최적화된 커스텀 프로세서를 장착할 수 있습니다. 결국 애플은 맥 제품군에 자체 프로세서를 탑재한다고 발표했고 그 결과물을 이제 공개했습니다. 애플 M1은 아이폰 12에 사용된 애플 A14 바이오닉 칩의 업그레이드 버전으로 고성능 파이어스톰 코어 4개와 고효율 아이스스톰 코어 4개로 구성된 8코어 프로세서입니다. A14와 비교하면 파이어스톰 코어 숫자가 2개에서 4개로 늘어났고 L2 캐쉬도 12MB로 50% 늘어났습니다. 더 많은 발열량을 허용할 수 있는 맥북과 맥 미니에 탑재하는 만큼 클럭도 더 높을 것으로 예상됩니다. GPU 역시 두 배 늘어난 8코어 GPU를 탑재해 스마트폰 가운데 최고 수준인 아이폰 12보다 성능이 훨씬 우수할 것으로 예상됩니다. 뉴럴 엔진은 16코어로 A14 바이오닉과 동일한데, 이 정도면 내장형 인공지능 가속기로 최상위급이기 때문에 굳이 더 늘릴 필요가 없었을 것입니다. M1의 트랜지스터 집적도는 A14 바이오닉보다 42억 개 늘어난 160억 개에 달하지만, TSMC의 최신 5nm 공정을 사용해 다이 면적은 10nm 공정 인텔 아이스레이크 CPU보다 크게 늘어나지 않았을 것으로 보입니다. 여기에 LPDDR4X 메모리 두 개를 옆에 붙여 놓은 통합 메모리 아키텍처 구조로 크기를 더 줄여 시스템을 매우 작고 가볍게 만들 수 있게 됐습니다. 애플은 새로운 메모리 장착 방식이 전통적인 메모리 모듈보다 더 우수한 성능을 보인다고 주장했습니다. 다만 M1 칩을 탑재한 신형 맥북 에어가 인텔 CPU를 탑재한 전 세대 모델보다 CPU 성능은 3.5배, GPU 성능은 5배 뛰어나다는 주장은 좀 더 엄밀한 검증이 필요합니다. 맥북 에어에 사용된 코어 i7-1060NG7 프로세서(1.2-3.8GHz 쿼드코어 CPU + 아이리스 프로 그래픽)의 성능 역시 만만치 않기 때문입니다. 코어 i7-1060NG7의 CPU 성능은 패스마크 (PassMark) 기준 6,234점으로 이보다 3배 이상 빠른 CPU는 노트북에서는 라이젠 7 4800H (8코어, 2.9-4.2GHz) 정도만 있을 뿐입니다. 솔직히 라이젠 7 4800H도 패스마크 기준 19,206점으로 3.5배가 안 됩니다. 인텔 CPU의 3.5배에 달하는 놀라운 성능의 비밀은 작은 숫자로 표시된 각주에 있습니다. 애플 공식 사이트에는 '배포 전 단계의 Final Cut Pro 10.5에서 4096x2160 해상도 및 초당 59.94 프레임의 4K Apple ProRes RAW 미디어로 구성된 55초 분량의 영상을 Apple ProRes 422로 인코딩 변환하여 테스트'한 결과라고 되어 있습니다. 쉽게 말해 CPU의 전반적인 성능이 아니라 M1에서 특별히 빠른 어플리케이션에서의 성능 비교입니다. 물론 GPU 역시 파이널 컷 프로에서의 비교 수치로 게임에서 평균 5배 빠르다는 의미는 아닙니다. 하지만 그렇다고 M1의 성능이 인텔 CPU보다 낮다는 것은 아닙니다. IT 전문 사이트인 아난드텍에서는 A14 바이오닉 CPU의 싱글 코어 성능이 SPEC2006 종합 비교 결과 인텔 i9-10900K와 AMD 라이젠 9 5950X의 중간 정도라고 평가했습니다. 파이어스톰 코어의 성능이 최신 x86 코어와도 겨룰 수 있는 수준이라는 것입니다. 출시 후 정확한 비교 벤치마크 결과를 봐야 알겠지만, 노트북용으로 성능을 높인 M1의 종합 성능은 적어도 A14보다 우수할 것입니다. 하지만 성능보다 더 중요한 강점은 저전력입니다.애플은 A 시리즈 프로세서에서 저전력 기술을 갈고 닦았습니다. M1은 애플이 오랜 세월 연마한 전력 관리 기술과 TSMC의 최신 5nm 공정 덕분에 전력 대 성능비가 인텔 칩보다 훨씬 높을 것으로 예상됩니다. 애플은 10W 전력 소모에서 M1의 성능이 인텔 칩보다 2배 뛰어나거나 혹은 최고 성능에서 전력 소모량이 1/4에 불과하다고 주장했습니다. 덕분에 신형 맥북 에어는 성능을 높이면서도 조용한 팬리스 디자인으로 돌아왔습니다. 배터리 용량 증가 없이도 배터리 사용 시간이 18시간까지 늘어난 것 역시 전기를 적게 먹는 M1 덕분입니다. 노트북에서 저소음, 저발열, 배터리 사용 시간이 중요한 점을 생각하면 저전력이 M1의 가장 큰 혁신이라고 할 수 있습니다. M1을 탑재한 1세대 모델은 이전 모델과 외형상 차이가 없지만, 결국은 더 얇고 가벼운 맥 제품군이 나올 수 있음을 시사하는 부분이기도 합니다. M1의 또 다른 장점은 애플 생태계의 통합입니다. 현재 애플 기기의 대부분은 자체 ARM 프로세서와 iOS 기반의 OS에서 돌아가고 있습니다. 맥만 x86 기반인데, 이것까지 자체 프로세서로 통합하면 애플 생태계의 마지막 퍼즐을 완성하는 셈입니다. 개발자들이 모든 애플 기기에서 돌아갈 수 있는 어플리케이션을 만들기 쉬워지고 프로세서 역시 애플 운영체제와 자주 쓰는 어플리케이션에 최적화해 성능을 최대한 활용할 수 있게 됩니다. 여러 하드웨어와 OS에서 돌아가야 하는 x86 프로세서에서는 누릴 수 없는 이점입니다. 애플은 앞으로 2년간 하나씩 맥 제품군 전체를 ARM 기반 자체 프로세서로 변경할 계획입니다. 따라서 맥 프로 같은 고성능 PC를 위한 자체 프로세서 역시 준비 중일 것입니다. 어쩌면 아마존처럼 서버용으로 쓸 수 있는 고성능 ARM 프로세서를 선보일지도 모릅니다. 이렇게 ARM 기반 자체 프로세서를 사용하면 클라우드와 다른 인터넷 서비스까지 애플 맞춤형 하드웨어가 가능하고 비용도 절감할 수 있다는 장점이 있습니다. 인텔 미세공정에 의존할 필요 없이 TSMC든 삼성이든 최신 미세공정을 입맛 대로 고를 수 있다는 것도 큰 장점입니다. 그런데 앞으로 애플의 사업 모델을 따라 하는 기업이 늘어나게 되면 인텔 입장에서는 큰 부담이 아닐 수 없습니다. 애플이 행보와 함께 고객을 잃게 된 인텔의 대응에도 눈길이 가는 이유입니다. 결국 인텔이 이 위기를 극복하려면 더 고성능 프로세서를 개발할 수밖에 없습니다. 몇 년 후 인텔이 ARM 경쟁자를 따돌릴 수 있는 신제품을 들고나올지 아니면 시장에서 입지가 축소될지도 궁금해집니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-11-12 14:20 나우뉴스
[고든 정의 TECH+] 21년 만에 독립 그래픽 카드 시장에 복귀한 인텔

1998년 인텔은 독립 그래픽 카드인 i740을 시장에 출시했습니다. 코드 네임 오번(Auburn)으로 알려진 이 그래픽 칩은 350nm 공정으로 제조된 AGP 인터페이스 그래픽 카드로 당시 기준으로도 다소 부족한 2-8MB 메모리를 탑재했으며 성능 역시 이 시기 인기를 끌었던 부두 2 같은 3D 가속기보다 낮았습니다. 다만 34.5달러의 낮은 가격 덕분에 그럭저럭 저가형 그래픽 카드 시장에서 살아남을 수 있었습니다. 그러나 당시 그래픽 카드 시장은 빠르게 발전하고 있었습니다. i740의 후속작인 i752와 i754는 가격을 낮춰도 통하기 어려울 정도로 성능이 낮아 인텔은 일찌감치 독립 그래픽 카드로 판매하는 계획을 철회합니다. 대신 이 그래픽 칩은 인텔 810 및 815 칩셋에 포함되어 판매됩니다. 한 마디로 내장 그래픽이 된 것입니다.인텔 내장 그래픽은 저렴하다는 것 이외에는 특별한 장점이 없었으나 바로 그 장점 때문에 지금도 가장 널리 사용되는 그래픽 프로세서가 되었습니다. 그래픽 감속기라는 오명을 뒤집어쓰긴 했지만, 굳이 게임을 하지 않는 사용자에게 낮은 그래픽 성능은 큰 문제가 아니었습니다. 다만 경쟁사인 AMD가 내장 그래픽 성능을 강화하자 여기에 맞서기 위해 인텔 역시 내장 그래픽 성능을 강화할 필요가 생겼습니다. 인텔은 내장 그래픽을 강화하는 것은 물론 독립 그래픽 카드 시장까지 진출하기 위해 AMD에서 라데온 GPU 개발을 이끈 라자 코두리를 영입하는 초강수를 둡니다. GPU가 인공지능에 널리 사용되면서 그 중요성이 날로 커지고 있었고 독자적으로 개발하던 인텔 그래픽 프로세서의 성능이 기대 이하였기 때문에 GPU 분야 최고 권위자 중 한 명을 스카우트한 것입니다. 그리고 라자 코두리를 영입한 지 3년 만에 등장한 첫 독립 그래픽 카드가 바로 아이리스 Xe 맥스(iris Xe MAX)입니다. 1999년 독립 그래픽 카드 시장에서 퇴장한 인텔이 21년 만에 다시 복귀한 것입니다. 아이리스 Xe 맥스는 같은 체급에서 가장 중요한 경쟁자를 넘어서는 성능을 지니고 있습니다. 바로 엔비디아의 노트북용 보급형 그래픽 카드인 MX350입니다. 인텔은 주요 게임에서 아이리스 Xe 맥스의 성능이 MX350보다 빠르다고 주장했습니다. 최소한 엔비디아의 보급형 그래픽 카드는 견제할 수 있는 셈입니다. 엔비디아나 AMD의 최신 그래픽 카드보다 훨씬 뛰어난 성능은 아니지만, 22년 전 i740이 그랬던 것처럼 최소한 보급형 시장에서 성공할 수 있는 기반은 마련했습니다. 아쉬운 점은 최신 인텔 내장 그래픽과 대동소이한 성능입니다. 아이리스 Xe 맥스에 사용된 DG1 GPU는 사실 인텔 11세대 코어 프로세서인 타이거 레이크(Tiger Lake) 내장 iGPU와 같은 스펙을 지니고 있습니다. 둘 다 Xe-LP 아키텍처 기반이고 96개의 실행 유닛(EU)을 지녔으며 인텔 10nm 슈퍼핀 제조 공정을 사용합니다. 차이점은 아이리스 Xe 맥스의 클럭이 1650MHz로 타이거 레이크 내장보다 300MHz 더 높고 4GB LPDDR4X-4266 독립 메모리를 탑재했다는 것입니다. 성능도 엇비슷해 FP32 기준 연산 능력은 아이리스 Xe 맥스는 2.46TFLOPs, 96EU급 타이거 레이크 iGPU는 2.1TFLOPs입니다. 솔직히 이 정도면 사용자 입장에서 큰 차이를 느끼기 어렵습니다. 이 점은 인텔이 공개한 성능 차트에서도 나타납니다. 심지어 도타 2 같은 일부 게임은 내장 그래픽 쪽이 성능이 더 나올 수도 있는데, 이는 CPU와 바로 붙어 있는 내장 그래픽의 장점이 약간 더 높은 클럭을 상쇄한 결과로 보입니다. 따라서 i7-1185G7 같은 고성능 CPU를 쓰는 경우 상황에 따라 내장 그래픽으로 게임을 구동할 수 있습니다. 다만 EU 숫자가 적은 i5, i3 CPU의 경우 아이리스 Xe 맥스의 성능이 항상 우수할 것입니다.아무튼 그렇다면 i7-1185G7 탑재한 노트북에 굳이 성능이 비슷한 아이리스 Xe 맥스를 탑재할 필요가 있는지 의문이 생길 수밖에 없습니다. 과거 AMD에서 선보인 내외장 통합 멀티 GPU 기술인 하이브리드 크로스파이어처럼 내장 GPU와 독립 GPU를 동시에 사용해 게임 성능을 높일 수도 없다면 추가 비용과 전력 소모, 무게 증가를 감수하고 별도의 그래픽 카드를 탑재할 이유가 있을까요? 인텔이 제시한 답변은 인공지능 및 동영상 편집입니다. 두 GPU에 있는 그래픽 유닛 동시에 사용해 게임 성능은 높일 수 없지만, 인텔 딥 링크(Deep Link) 기술을 사용하면 AI 연산을 동시에 수행해 인공지능 성능을 높일 수 있습니다. 또 내년 상반기에 지원할 하이퍼 인코딩(hyper encoding) 기술을 이용하면 두 GPU에 있는 인코더를 동시에 사용해 인코딩 속도도 두 배 빨라집니다. 동영상 편집 작업을 많이 하는 사용자에게는 분명한 이점이 있는 것입니다. GPU로 게임만 하는 게 아니라는 점을 감안하면 나름 현명한 전략일 수 있습니다. 아이리스 Xe 맥스는 이제 겨우 보급형 시장에 비집고 들어갈 수 있는 정도의 성능이지만, 나름의 경쟁력과 독자적인 기술을 지녔음을 보여줬습니다. 이제 막 복귀를 위한 신고식을 마친 인텔 GPU가 앞으로 어떤 성과를 보여줄지 궁금합니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-11-04 10:39 나우뉴스
美, ARM 품고 화웨이 제재… 위기 속 기회 엿보는 삼성·SK

미국 엔비디아가 영국 반도체 설계 회사 ARM을 인수하고 중국 화웨이에 반도체 공급을 끊는 미국 제재가 발효되면서 글로벌 반도체 시장이 전환점을 맞고 있다. 굵직한 대외변수로 ‘악재´와 ‘기회´를 동시에 직면한 삼성전자, SK하이닉스 등 국내 기업들은 커지는 불확실성 속에서 거래 승인 요청, 대체 수요처 발굴 등 모든 경우의 수를 따져보며 돌파구 찾기에 나섰다. 일본 소프트뱅크그룹은 영국에 본사를 둔 자회사 ARM을 400억 달러(약 47조 4000억원)에 엔비디아로 매각한다고 14일 밝혔다. 반도체 업계 인수합병 가운데 역대 최대 규모다. PC 그래픽처리장치(GPU)의 최강자인 엔비디아와 스마트폰의 두뇌인 모바일 애플리케이션프로세서(AP) 시장 최강자인 ARM이 합병하면 강력한 시너지가 발생한다. GPU에 중앙처리장치(CPU)까지 아우르는 포트폴리오를 갖추며 인공지능(AI), 자율주행 등 4차 산업혁명의 강자로 떠오를 전망이다. 이에 경쟁사들은 파장을 예의주시하고 있다. 엔비디아와 경쟁관계인 삼성전자나 퀄컴, 애플 등에서는 기술 유출 우려로 ARM 설계를 쓰기 껄끄러울 수 있다. 엔비디아가 ARM의 설계 기술 사용료를 인상하거나 독점 사용할 거란 우려도 나온다. 이에 더해 삼성전자와 SK하이닉스는 당장 15일부터 미국 기술과 장비를 사용한 반도체는 미국 승인 없이 중국 화웨이에 공급하지 못하게 하는 미국의 제재가 발효되면서 화웨이에 반도체 공급을 못 하게 됐다. 디스플레이를 구동하는 칩도 제재 대상에 들어가며 삼성디스플레이와 LG디스플레이도 화웨이에 대한 패널 공급을 멈춘다. 세계에서 세 번째로 반도체를 많이 사는(지난해 구매액 208억 달러) ‘큰손´ 화웨이의 수주 물량을 잃게 되면서 국내 기업들의 실적 타격이 한동안 불가피하다. 화웨이는 삼성전자의 5대 고객사로 지난해 회사 매출에서 차지하는 비중이 3.2%(7조 3000억원)였다. SK하이닉스의 지난해 매출에서 화웨이의 비중은 11.4%(3조원)에 이른다. 삼성전자와 SK하이닉스, 삼성디스플레이는 미국 정부에 수출 승인을 요청한 상태이나 업계에서는 승인 가능성이 낮을 것으로 본다. 반도체 분야에서는 단기간은 매출 악화가 예상되지만 장기적으로는 영향이 제한적이라는 전망이 나온다. 박재근(한양대 융합전자공학부 교수) 반도체디스플레이기술학회장은 “화웨이가 최근 제재 막판까지 반도체를 사 모으면서 국내 반도체 기업들의 3분기 실적이 올라갈 것”이라며 “화웨이가 6개월~1년가량 쌓아 둔 반도체 재고를 소진하고 난 뒤에도 미중 무역 갈등 지속으로 스마트폰을 팔지 못한다 해도 수요는 사라지지 않고, 특히 화웨이가 수출을 많이 하는 유럽, 인도, 동남아시아 시장에서 타 제조사 제품으로 수요가 대체되면서 장기적으로 메모리 반도체 쪽 영향은 크지 않을 것”이라고 말했다. 삼성전자는 화웨이 부진에 따른 기회 요인도 있다는 낙관론도 제기된다. 스마트폰, 통신장비 시장에서 화웨이의 점유율을 가져오며 반사이익을 누릴 수 있다는 시각이다. 박강호 대신증권 연구원은 “화웨이 이슈가 장기화하면서 화웨이는 5G 시장으로의 전환 과정에서 글로벌 점유율 하락이 예상된다”며 “삼성전자는 선진 시장에서는 프리미엄 제품, 신흥 시장에서는 중저가폰인 갤럭시A 시리즈 중심으로 판매가 늘며 스마트폰 부문의 실적 호조가 내년까지 이어질 것으로 예상된다”고 내다봤다. 증권가에서는 삼성전자가 올 3분기 7분기 만에 영업이익 10조원대 벽을 뚫으며 ‘깜짝 실적´을 낼 거란 관측이 이어지고 있다. 유진투자증권은 미국의 제재로 8월 이후 화웨이의 긴급 주문이 증가하면서 3분기 반도체에서 영업이익 5조원을 기록하고 소비자가전(CE) 부문에서 TV 출하량 증가 등으로 역대 최고치 영업이익을 경신할 것(1조 2000억원)으로 추산했다. 화웨이 제재, 인도·중국 간 분쟁 등으로 3분기 삼성전자 IT·모바일(IM)부문 영업이익이 2016년 2분기 이후 최고치(4조 2000억원)를 찍을 거란 전망(대신증권)도 나온다. 이런 기대감이 반영되며 이날 삼성전자 주가는 전 거래일보다 2.37% 오른 6만 400원에 장을 마쳤다. 종가가 6만원대를 회복한 것은 지난 2월 20일 이후 7개월 만이다. 정서린 기자 rin@seoul.co.kr

서울신문
美 화웨이 제재에 엔비디아 ARM 인수..격랑의 반도체 시장 국내기업 득실은

14일 미국 엔비디아가 영국 반도체 설계 회사 ARM을 인수하고 15일부터는 중국 화웨이에 반도체 공급을 끊는 미국 제재가 발효되면서 글로벌 반도체 시장이 큰 전환점을 맞게 됐다. 반도체를 둘러싼 미중간 패권전쟁도 더 요동치게 됐다. 미국은 자국의 그래픽처리장치(GPU) 기업인 엔비디아가 전 세계 스마트폰에 들어가는 반도체 설계의 90% 이상을 공급하는 ARM을 품으면서 반도체 시장에서의 영향력을 더 확대하게 됐다. 중국은 미국의 제재로 대표 기업 화웨이의 손발이 묶이고 파운드리(반도체 위탁생산) 기업 SMIC까지 제재 리스트에 포함될 수 있어 ‘반도체 굴기‘(2025년까지 반도체 자급률을 70%로 끌어올린다는 목표)에 총체적 위기를 맞았다. 굵직한 대외변수로 ‘악재’와 ‘기회‘에 동시에 직면하게 된 삼성전자, SK하이닉스 등 국내 기업들은 커지는 불확실성 속에서 거래 승인 요청, 대체 수요처 발굴 등 모든 경우의 수를 따져보며 돌파구 찾기에 나섰다. 이날 일본 소프트뱅크그룹은 영국에 본사를 둔 자회사 ARM을 400억달러(47조 4000억원)에 엔비디아로 매각한다고 밝혔다. 반도체 업계 인수합병 가운데 역대 최대 규모다. 이번 합병이 성사되면 엔비디아는 GPU에 중앙처리장치(CPU)까지 아우르는 포트폴리오를 갖추며 인공지능(AI), 자율주행 등 4차 산업혁명의 강자로 떠오를 전망이다. 이에 경쟁사들은 파장을 예의주시하고 있다. 엔비디아와 경쟁관계인 삼성전자나 퀄컴, 애플 등에서는 기술 유출 우려로 ARM 설계를 쓰기 껄끄러울 수 있다. 엔비디아가 ARM의 설계 기술 사용료를 인상하거나 독점 사용할 거란 우려도 나온다. 삼성전자와 SK하이닉스는 당장 15일부터 미국 기술과 장비를 사용한 반도체는 미국 승인 없이 중국 화웨이에 공급하지 못하게 하는 미국의 제재가 발효되면서 화웨이에 반도체 공급을 못 하게 됐다. 디스플레이를 구동하는 칩도 제재 대상에 들어가며 삼성디스플레이와 LG디스플레이도 화웨이에 대한 패널 공급을 멈춘다. 세계에서 세 번째로 반도체를 많이 사는(지난해 구매액 208억 달러) ‘큰손’ 화웨이의 수주 물량을 잃게 되면서 국내 기업들의 실적 타격이 한동안 불가피해졌다. 화웨이는 삼성전자의 5대 고객사로 지난해 회사 매출에서 차지하는 비중이 3.2%(7조 3000억원)였다. SK하이닉스의 지난해 매출에서 화웨이의 비중은 11.4%(3조원)에 이른다. 삼성전자와 SK하이닉스, 삼성디스플레이는 미국 정부에 수출 승인을 요청한 상태이나 업계에서는 승인 가능성이 낮을 것으로 본다. 반도체 분야에서는 단기간은 매출 악화가 예상되지만 장기적으로는 영향이 제한적이라는 전망이 나온다. 박재근(한양대 융합전자공학부 교수) 반도체디스플레이기술학회장은 “화웨이가 최근 제재 막판까지 반도체를 사 모으면서 국내 반도체 기업들의 3분기 실적이 올라갈 것”이라며 “화웨이가 6개월~1년가량 쌓아 둔 반도체 재고를 소진하고 난 뒤에도 미중 무역 갈등 지속으로 스마트폰을 팔지 못한다 해도 수요는 사라지지 않고, 특히 화웨이가 수출을 많이 하는 유럽, 인도, 동남아시아 시장에서 타 제조사 제품으로 수요가 대체되면서 장기적으로 메모리 반도체 쪽 영향은 크지 않을 것”이라고 말했다. 삼성전자는 화웨이 부진에 따른 기회 요인도 있다는 낙관론도 제기된다. 스마트폰, 통신장비 시장에서 화웨이의 점유율을 가져오며 반사이익을 누릴 수 있다는 시각이다. 박강호 대신증권 연구원은 “화웨이 이슈가 장기화하면서 화웨이는 5G 시장으로의 전환 과정에서 글로벌 점유율 하락이 예상된다”며 “삼성전자는 선진 시장에서는 프리미엄 제품, 신흥 시장에서는 중저가폰인 갤럭시A 시리즈 중심으로 판매가 늘며 스마트폰 부문의 실적 호조가 내년까지 이어질 것으로 예상된다”고 내다봤다. 증권가에서는 삼성전자가 올 3분기 7분기 만에 영업이익 10조원대 벽을 뚫으며 ‘깜짝 실적‘을 낼 거란 관측이 이어지고 있다. 유진투자증권은 미국의 제재로 8월 이후 화웨이의 긴급 주문이 증가하면서 3분기 반도체에서 영업이익 5조원을 기록하고 소비자가전(CE) 부문에서 TV 출하량 증가 등으로 역대 최고치 영업이익을 경신할 것(1조 2000억원)으로 추산했다. 화웨이 제재, 인도·중국 간 분쟁 등으로 3분기 삼성전자 IT·모바일(IM)부문 영업이익이 2016년 2분기 이후 최고치(4조 2000억원)를 찍을 거란 전망(대신증권)도 나온다. 이런 기대감이 반영되며 이날 삼성전자 주가는 전 거래일보다 2.37% 오른 6만 400원에 장을 마쳤다. 종가가 6만원대를 회복한 것은 지난 2월 20일 이후 7개월 만이다. 정서린 기자 rin@seoul.co.kr

2020-09-14 19:53 서울신문
[고든 정의 TECH+] 22년 만에 내장 그래픽 성능 1위 차지한 인텔

지난 몇 년간 이빨과 발톱을 갈았던 인텔이 마침내 숙적 AMD의 내장 그래픽 성능을 뛰어넘었습니다. 인텔은 11세대 코어 프로세서인 타이거 레이크(Tiger Lake) 공개 행사에서 인텔 코어 i7 - 1185G7의 게임 성능이 경쟁 제품인 AMD 라이젠 4800U보다 최대 1.8배 높다고 밝혔습니다.(배틀필드 V, 배틀 그라운드 등 인기 게임 10종 비교) 그리고 더 나아가 보급형 노트북 그래픽 카드인 엔비디아 MX350과의 성능 차이 역시 별로 크지 않다고 강조했습니다. 가볍게 게임을 즐기는 일반적인 노트북 사용자라면 굳이 경쟁사 제품이나 보급형 그래픽 카드 대신 타이거 레이크에 탑재된 아이리스 Xe 내장 그래픽만으로도 충분하다는 이야기입니다. 이 결과를 내기까지 인텔은 22년간 그래픽 프로세서에 투자했습니다. 인텔 최초의 그래픽 카드는 1998년 공개한 i740입니다. 지금은 사라진 AGP 인터페이스를 사용한 초기 보급형 그래픽 카드로 간단한 3D 게임 정도만 구동할 수 있었습니다. 그런데 당시 그래픽 카드 시장은 엔비디아, 3Dfx, ATI(나중에 AMD에 흡수된 라데온 그래픽 부분) 등 여러 그래픽 칩 제조사들의 경쟁 구도가 끝나고 엔비디아와 ATI의 양강 구도로 정리되고 있었습니다. 본래 성능이 높은 편이 아니었던 인텔 그래픽 칩은 결국 메인보드에 통합된 내장 그래픽으로 명맥을 이어 나가게 됩니다. 독립 그래픽 카드 대신 값싼 그래픽 내장 메인보드를 사용하면 비용을 절감하고 전기 요금도 아낄 수 있었습니다. 따라서 인텔 내장 그래픽은 사무용 컴퓨터나 게임 목적이 아닌 가정용 PC에 널리 탑재되었습니다. 사실 2000년을 전후로 랜 카드, 사운드 카드, 그래픽 카드가 모두 메인보드에 내장되어 컴퓨터 제조 단가도 저렴해지고 크기도 작아졌습니다. 메인보드 내장 그래픽을 사용하는 사람들이 원하는 것은 모니터 출력이 가능한 저렴한 컴퓨터였습니다. 따라서 인텔 역시 내장 그래픽 성능을 높이기 위해 많은 투자를 하지 않았습니다. 물론 기술이 발전함에 따라 인텔 내장 그래픽 성능 역시 향상되기는 했지만, 그래픽 감속기라는 별명이 붙을 정도로 비슷한 시기의 지포스나 라데온보다 성능이 낮았습니다. 하지만 가격이 저렴하고 사용 목적에 충실한 만큼 특별히 문제될 것도 없었습니다. 문제가 된 것은 2006년 ATI를 합병한 AMD가 내장 그래픽 성능을 대폭 높인 이후입니다. AMD는 2011년에는 라데온 내장 그래픽을 CPU에 통합한 APU라는 개념의 하이브리드 CPU를 선보였는데, 저렴한 가격에 그래픽 성능이 우수해 시장에서 좋은 반응을 얻었습니다. 독립 그래픽 카드를 사기에는 주머니 사정이 넉넉하지 않지만, 게임은 하고 싶은 소비자에게 AMD APU가 좋은 대안이 된 것입니다. 당연히 인텔 역시 내장 그래픽 성능을 높여 이에 대응했습니다. 2011년에는 역시 GPU를 CPU와 통합한 샌디브릿지를 선보였고 이후 매년 내장 그래픽 성능을 높여 AMD를 추격했습니다. 그리고 2013년에는 별도의 임베디드 메모리(eDRAM)를 지닌 아이리스 프로 (Iris Pro) 그래픽을 선보이며 AMD 내장 그래픽은 물론 보급형 그래픽 카드와 견줄 만한 성능을 지닌 인텔 내장 그래픽을 선보이기도 했습니다. 하지만 아이리스 프로는 가격이 비싸 한정된 제품에만 사용됐습니다. 솔직히 그 가격이면 차라리 독립 그래픽 카드를 탑재하는 편이 더 나은 선택이었습니다. 이런 예외를 제외하고 인텔 내장 그래픽의 성능은 늘 AMD에 뒤처졌습니다. 영원히 2인자 자리를 놓치지 않았을 것 같았던 인텔에 변화가 생긴 건 2017년 라데온 그래픽 부분을 이끈 라자 코두리를 영입한 이후입니다. 라자 코두리는 Xe라는 새로운 그래픽 아키텍처를 통해 인텔 그래픽 부분을 대대적으로 개편했습니다. 단지 내장 그래픽 부분에서 AMD를 견제하기 위해서가 아니라 인공지능 및 고성능 컴퓨팅 부분에서 경쟁력을 확보하기 위해 자체 GPU가 필요했기 때문입니다. 이렇게 해서 나온 첫 작품이 바로 타이거 레이크에 탑재된 아이리스 Xe 그래픽입니다.타이거 레이크는 작은 네 개의 CPU 코어와 거대한 GPU 블록을 지니고 있습니다. GPU 블록 안에는 최대 96개의 실행유닛 (EU)이 있는데, 이는 전 세대의 64개보다 1.5배 증가한 것입니다. 여기에 클럭까지 증가해 전체 성능은 1.8배 이상 증가했습니다. 반면 경쟁자인 AMD 라이젠 4000 시리즈는 전 세대 대비 그래픽 성능 향상폭이 크지 않았습니다. 라데온 3000 시리즈에서 그래픽 유닛을 늘리는 대신 CPU 코어를 두 배 늘렸기 때문입니다. 덕분에 8코어 노트북 CPU의 대중화는 이끌 수 있었으나 경쟁자에 내장 그래픽 성능 역전을 허용했습니다. 다만 그렇다고 해서 AMD가 일방적으로 밀리는 싸움이 시작된 건 아닙니다. 인텔이 비교 대상으로 든 라이젠 4800U는 사실 8코어 CPU로 4코어인 i7 - 1185G7보다 멀티 쓰레드 성능이 월등이 뛰어납니다. 그리고 현재까지 발표된 것은 모두 인텔 측 보도자료입니다. 동등한 조건에서 공정하게 벤치마크를 진행할 경우 내장 그래픽 역시 인텔이 주장한 만큼 성능 차이가 크지 않을 수 있습니다. 그리고 AMD 역시 차세대 CPU와 GPU 공개가 임박한 상황으로 얼마든지 반격이 가능합니다. 이번에 인텔에게 내장 그래픽 부분에서 우위를 내준 만큼 내년에는 AMD가 훨씬 강화된 그래픽 성능을 지닌 5000번대 제품을 내놓을 가능성이 커졌습니다. 동시에 Zen 3 아키텍처 기반의 차세대 CPU 역시 전 세대 대비 10-20% 수준의 성능 향상을 예고하고 있습니다. 이런 경쟁을 통해 소비자들은 더 좋은 노트북을 같은 가격에 구매할 수 있을 것입니다. CPU 전쟁의 진짜 승자는 인텔이나 AMD가 아니라 결국 소비자가 될 것입니다. 고든 정 칼럼니스트 jjy0501@naver.com　

2020-09-04 09:21 나우뉴스
TSMC와 파운드리 전쟁 삼성… ‘큰손·기술·투자’에 승패 달렸다

삼성전자는 요즘 TSMC와 ‘파운드리(반도체 위탁생산) 전쟁’을 벌이고 있다. 지난해 4월 이재용 삼성전자 부회장이 2030년까지 시스템 반도체 1위 달성을 목표로 내걸면서 경쟁이 격화됐다. 시스템 반도체에서 1위가 되려면 파운드리에서 점유율을 끌어올려야 한다. 생산시설이 없는 ‘펩리스 업체’가 시스템 반도체를 설계해 오면 파운드리 업체가 이를 생산해 내는 구조인데 삼성은 아직 도전자 입장이다. 파운드리 시장에서 삼성전자는 10% 후반대 점유율로 2위에 머문 반면 대만의 TSMC가 약 50%의 점유율로 압도적 1위다. 메모리 반도체보다 시장 규모가 2배나 큰 시스템 반도체는 삼성으로선 놓칠 수 없는 시장이다. TSMC와의 좁혀지지 않는 ‘30%의 벽’을 깨기 위해 이 부회장이 향후 10년 동안 해결해야 할 과제 세 가지를 3일 꼽아 봤다. ①고객사와의 경쟁 금지 삼성전자 파운드리 사업의 아킬레스건은 ‘큰손’을 놓치고 있다는 점이다. 펩리스 업체 ‘톱5’가 모두 TSMC의 단골이다. 펩리스 업체 입장에서는 반도체의 설계부터 생산까지 모두 하는 종합반도체기업(IDM)에 위탁을 맡기는 것은 적에게 기술력을 낱낱이 공개하는 꼴이라고 여길 수 있다. 더군다나 애플 같은 기업은 스마트폰 시장에서 삼성전자와 치열하게 싸우고 있는데 경쟁사에 모바일용 애플리케이션 프로세서(AP)의 생산을 선뜻 맡기기가 어려운 상황이다. 반면 파운드리 사업만 하고 있는 TSMC는 ‘고객과 경쟁하지 않는다’를 슬로건으로 내걸고 30여년간 신뢰 관계를 쌓았다. 삼성의 파운드리 사업부가 별도 법인으로 나와야 TSMC를 뛰어넘을 수 있단 지적이 꾸준한 것도 이 때문이다. ②파운드리 기술 초격차 삼성전자가 ‘TSMC 단골’의 마음을 돌리려면 압도적 기술력으로 승부하는 것이 정공법이다. 삼성전자는 최첨단 공정에서 TSMC를 많이 따라잡은 상태다. 현재 7나노미터 이하 반도체 제품을 만들 수 있는 업체는 삼성전자와 TSMC뿐이다. 나노 수가 작을수록 반도체 크기가 줄어들고 성능과 전력 효율은 향상된다. 이런 기술력을 앞세워 삼성전자는 엔디비아의 차세대 그래픽처리장치(GPU)인 ‘지포스 RTX30’와 IBM의 차세대 서버용 중앙처리장치(CPU)인 ‘파워10’을 수주했다. 지난 2월에는 퀄컴의 차세대 이동통신 모뎀칩인 ‘X60’의 생산 계약을 따내기도 했다. 하지만 TSMC는 최근 2나노 공정을 기반으로 공장의 건설 계획을 밝히며 한 발짝 다시 앞서갔다. 삼성전자는 2나노에 대해선 아직 밝힌 적이 없다. 파운드리에서도 기술 초격차를 일궈야지만 역전의 기회가 생길 것이란 지적이 나온다. ③머니게임에서 승리 TSMC는 삼성전자와의 격차를 벌리기 위해 대규모 투자금을 쏟아붓고 있다. 최근 이사회를 열고 약 6조원 규모의 투자를 승인했다. 올해 투자 지출 목표는 총 20조원이다. 지난 5월에는 미국 애리조나에 5나노 파운드리 공장을 짓는다고 밝혔다. 또한 임직원이 5만 1000여명인 TSMC는 올해 안에 8000명을 채용할 계획이다. 삼성전자도 막대한 자금을 반도체에 투입하지만 메모리 쪽 비중이 더 큰 게 현실이다. 황철성 서울대 재료공학부 교수는 “삼성이 시스템 반도체에 10년간 133조원을 투자하기로 했는데 이것은 연간 13조원으로 TSMC보다 적은 편”이라고 지적했다. 업계 관계자는 “삼성전자가 TSMC를 따라잡으려면 대규모 투자로 생산성을 높여야 하는데 이런 결정은 총수인 이 부회장만 가능하다”면서 “사법 리스크로 결정이 늦어지면 경쟁사만 이득을 볼 것”이라고 말했다. 한재희 기자 jh@seoul.co.kr

서울신문
TSMC와 ‘파운드리 전쟁중’인 삼성 앞에 놓인 세가지 과제

삼성전자는 요즘 TSMC와 ‘파운드리(반도체 위탁생산) 전쟁’을 벌이고 있다. 지난해 4월 이재용 삼성전자 부회장이 2030년까지 시스템 반도체 1위 달성을 목표로 내걸면서 경쟁이 격화됐다. 시스템 반도체에서 1위가 되려면 파운드리에서 점유율을 끌어올려야 한다. 생산시설이 없는 ‘펩리스 업체’가 시스템 반도체를 설계해 오면 파운드리 업체가 이를 생산해 내는 구조인데 삼성은 아직 도전자 입장이다. 파운드리 시장에서 삼성전자는 10% 후반대 점유율로 2위에 머문 반면 대만의 TSMC가 약 50%의 점유율로 압도적 1위다. 메모리 반도체보다 시장 규모가 2배나 큰 시스템 반도체는 삼성으로선 놓칠 수 없는 시장이다. TSMC와의 좁혀지지 않는 ‘30%의 벽’을 깨기 위해 이 부회장이 향후 10년 동안 해결해야 할 과제 세 가지를 3일 꼽아 봤다. 고객사와의 경쟁 금지 삼성전자 파운드리 사업의 아킬레스건은 ‘큰손’을 놓치고 있다는 점이다. 펩리스 업체 ‘톱5’가 모두 TSMC의 단골이다. 펩리스 업체 입장에서는 반도체의 설계부터 생산까지 모두 하는 종합반도체기업(IDM)에 위탁을 맡기는 것은 적에게 기술력을 낱낱이 공개하는 꼴이라고 여길 수 있다. 더군다나 애플 같은 기업은 스마트폰 시장에서 삼성전자와 치열하게 싸우고 있는데 경쟁사에 모바일용 애플리케이션 프로세서(AP)의 생산을 선뜻 맡기기가 어려운 상황이다. 반면 파운드리 사업만 하고 있는 TSMC는 ‘고객과 경쟁하지 않는다’를 슬로건으로 내걸고 30여년간 신뢰 관계를 쌓았다. 삼성의 파운드리 사업부가 별도 법인으로 나와야 TSMC를 뛰어넘을 수 있단 지적이 꾸준한 것도 이 때문이다.파운드리 기술 초격차 삼성전자가 ‘TSMC 단골’의 마음을 돌리려면 압도적 기술력으로 승부하는 것이 정공법이다. 삼성전자는 최첨단 공정에서 TSMC를 많이 따라잡은 상태다. 현재 7나노미터 이하 반도체 제품을 만들 수 있는 업체는 삼성전자와 TSMC뿐이다. 나노 수가 작을수록 반도체 크기가 줄어들고 성능과 전력 효율은 향상된다. 이런 기술력을 앞세워 삼성전자는 엔디비아의 차세대 그래픽처리장치(GPU)인 ‘지포스 RTX30’와 IBM의 차세대 서버용 중앙처리장치(CPU)인 ‘파워10’을 수주했다. 지난 2월에는 퀄컴의 차세대 이동통신 모뎀칩인 ‘X60’의 생산 계약을 따내기도 했다. 하지만 TSMC는 최근 2나노 공정을 기반으로 공장의 건설 계획을 밝히며 한 발짝 다시 앞서갔다. 삼성전자는 2나노에 대해선 아직 밝힌 적이 없다. 파운드리에서도 기술 초격차를 일궈야지만 역전의 기회가 생길 것이란 지적이 나온다. 머니게임에서 승리 TSMC는 삼성전자와의 격차를 벌리기 위해 대규모 투자금을 쏟아붓고 있다. 최근 이사회를 열고 약 6조원 규모의 투자를 승인했다. 올해 투자 지출 목표는 총 20조원이다. 지난 5월에는 미국 애리조나에 5나노 파운드리 공장을 짓는다고 밝혔다. 또한 임직원이 5만 1000여명인 TSMC는 올해 안에 8000명을 채용할 계획이다. 삼성전자도 막대한 자금을 반도체에 투입하지만 메모리 쪽 비중이 더 큰 게 현실이다. 황철성 서울대 재료공학부 교수는 “삼성이 시스템 반도체에 10년간 133조원을 투자하기로 했는데 이것은 연간 13조원으로 TSMC보다 적은 편”이라고 지적했다. 업계 관계자는 “삼성전자가 TSMC를 따라잡으려면 대규모 투자로 생산성을 높여야 하는데 이런 결정은 총수인 이 부회장만 가능하다”면서 “사법 리스크로 결정이 늦어지면 경쟁사만 이득을 볼 것”이라고 말했다. 한재희 기자 jh@seoul.co.kr

2020-09-03 18:49 서울신문
[고든 정의 TECH+] 엔비디아 RTX 3000 시리즈 공개에 더 주목받는 삼성 파운드리

엔비디아가 튜링 아키텍처 기반의 RTX 2000 시리즈를 공개한 지 2년 만에 암페어(Ampere) 아키텍처 기반의 RTX 3000 시리즈를 공개했습니다. RTX 3000 시리즈는 진짜 물체처럼 빛을 반사하는 실시간 레이 트레이싱(Ray tracing) 기술을 강조한 RTX 시리즈의 두 번째 GPU로 전 세대보다 성능을 두 배 정도 끌어올렸습니다. 좀 더 구체적으로 말하면 RTX 3000 시리즈 최상위 그래픽 카드인 RTX 3090은 35.7테라플롭스(TFLOPs, 단정밀도 기준) 연산 능력을 지니고 있는데, 이는 전 세대 최상위 그래픽 카드인 RTX 2080 Ti의 13.4테라플롭스의 2.7배에 달합니다. 인공지능 관련 성능 척도인 텐서(Tensor) 연산 능력도 114테라플롭스에서 285테라플롭스로 역시 2.5배 정도 증가했습니다. 이런 성능 향상이 가능한 비결은 연산 유닛인 쿠다(CUDA) 코어 숫자를 두 배가 넘는 1만496개로 늘리고 동작 클럭도 높인데 있습니다. 흥미로운 부분은 트랜지스터 집적도는 186억 개에서 280억 개로 두 배 증가하지 않았다는 것입니다. 암페어 아키텍처에서 튜링 아키텍처보다 작고 효율적인 연산 유닛을 적용하고 클럭을 높였다는 해석이 가능합니다. 하지만 최상위 모델인 RTX 3090의 경우 성능만큼이나 가격도 범접하기 어려운 수준으로 올라갔습니다. RTX 2080 Ti의 출시 권장소비자가격(MSRP)은 999달러였으나 RTX 3090은 1499달러로 1.5배 정도 더 비싼 편입니다. 게임 용도로는 사실 선뜻 지불하기 어려운 가격입니다. 하지만 인공지능 연산 등 특수 목적에 사용할 때는 오히려 가성비가 우수한 제품으로 극소수의 하이엔드 게이머나 전문 작업용으로 수요가 있을 것으로 예상됩니다. RTX 3090보다 더 현실적인 게임용 그래픽 카드는 RTX 3080입니다. 699달러의 가격 역시 절대 저렴한 건 아니지만, RTX 3090과 같은 GA102 GPU를 사용하면서도 가격은 절반 이하 수준입니다. 상대적으로 저렴한 가격의 비결은 GPU 일부를 잘라낸 컷 칩을 사용해 가격을 낮췄을 뿐 아니라 그래픽 메모리를 24GB에서 10GB로 줄였기 때문입니다. 하지만 아무리 컷 칩을 사용하고 메모리를 줄여도 제조 비용에서 가장 큰 비중을 차지하는 GPU 자체의 가격을 낮추지 못하면 전체 비용을 낮추기 어렵습니다. 바로 이 대목에서 삼성의 8N 공정이 해결책으로 등장했습니다. 2년 전 엔비디아는 RTX 2000 시리즈에 TSMC의 12nm (FFN) 공정을 채택했습니다. 당시 10nm 이하의 미세 공정을 채택하지 않은 이유는 비용 문제 때문이었습니다. 반도체 웨이퍼 제조 단가는 미세 공정일수록 급격히 높아집니다. 만약 186억 개의 트랜지스터를 지닌 거대 GPU를 10nm 이하 미세 공정으로 제조했다면 제조 단가가 비싸 많은 이윤을 남기기 어렵습니다. 따라서 엔비디아는 경쟁사인 AMD가 7nm 공정을 채택할 때도 꿋꿋이 12nm 공정으로 2년을 버틴 것입니다. 물론 그래도 성능으로 밀리지 않고 앞서 나갔기에 가능한 일이었습니다. 삼성의 8nm(8N) 공정은 10nm 공정의 개량형으로 알려져 있습니다. 따라서 삼성 파운드리나 TSMC의 최신 7nm 공정에 비해 성능은 낮지만, 제조 비용은 저렴합니다. 엔비디아가 542억 개의 트랜지스터를 집적한 고성능 인공지능 가속기인 A100 GPU에는 TSMC의 7nm (7N) 공정을 사용한 반면 RTX 3000 시리즈에는 삼성 8N 공정을 사용한 것은 게임용 그래픽 카드가 A100처럼 엄청나게 비싼 가격에도 판매할 수 있는 제품이 아니기 때문입니다. 280억 개의 트랜지스터를 집적해도 현실적인 가격에 판매할 수 있으려면 그만큼 타협이 필요합니다. 물론 비용만 낮추면 되는 것이 아니라 적어도 1-2년 정도 그래픽 카드 시장을 석권할 수 있는 강력한 제품도 만들 수 있어야 합니다. 엔비디아는 고심 끝에 삼성 파운드리가 최적의 조건이란 결론을 내렸을 것입니다. 삼성 파운드리가 적어도 600㎟가 넘는 대형 GPU 시장에 본격 진입했다는 것은 적지 않은 의미를 지닙니다. 이 분야에서 TSMC의 독점 구조가 깨진 것이기 때문입니다. 삼성은 GA102 칩 이외에도 RTX 3070에 사용된 좀 더 작은 GPU의 위탁 생산도 맡고 있습니다. 앞으로 등장할 RTX 3060/3050 같은 보급형 GPU 역시 삼성 8N 공정을 사용할 가능성이 큰 셈입니다. 역사적으로 엔비디아는 대부분의 물량을 TSMC에 의존해 왔지만, 이번에는 다른 선택도 가능하다는 것을 보여줬습니다. 당연히 TSMC에 생산을 의뢰했던 AMD 같은 다른 제조사나 인텔처럼 외부 파운드리를 고민하는 제조사의 선택에도 큰 영향을 줄 것으로 예상됩니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-09-03 09:39 나우뉴스
[고든 정의 TECH+] 두 마리 토끼 잡는다?…인텔 차세대 하이브리드 CPU 앨더 레이크

최근에 열린 인텔 아키텍처 데이 2020 행사의 주인공은 공개가 임박한 11세대 코어 프로세서인 타이거 레이크와 Xe GPU였지만, 그에 못지않게 흥미를 끄는 제품이 인텔의 2세대 하이브리드 CPU인 앨더 레이크(Alder Lake)였습니다. 스마트폰에 사용되는 모바일 프로세서는 고성능이지만 전기를 많이 먹는 코어와 저전력이지만 성능이 낮은 코어를 함께 탑재해 고성능과 저전력의 두 마리 토기를 잡는 빅리틀 (big.LITTLE) 기술이 표준화된 상태입니다. 그런데 모바일 프로세서의 성능이 좋아지면서 인텔 CPU의 자리를 넘보기 시작하자 인텔 역시 이에 대응할 방법이 필요했습니다. 결론은 인텔 역시 고성능 코어와 저전력 코어를 지닌 하이브리드 CPU를 만들어 상황에 따라 고성능과 저전력 두 가지 모드로 유연하게 작동할 수 있게 만드는 것입니다. 인텔의 하이브리드 CPU 기술은 ‘Intel Core processor with Intel Hybrid Technology’로 명명되었으며 올해 출시된 레이크필드(Lakefield) CPU에서 처음 선보였습니다. 레이크필드 CPU는 고성능 서니 코브 코어 한 개와 저전력 트레몬트 코어 4개를 사용했는데, 삼성 갤럭시 북 S에 탑재되어 세간의 주목을 받았습니다. 레이크필드의 성능은 기존의 인텔 10세대 코어 프로세서보다 낮지만, 전력 소모를 줄여 얇고 가벼우면서도 배터리 지속 시간이 긴 노트북을 만들 수 있습니다. 그러나 레이크필드는 몇 종류의 노트북에만 사용된 다소 실험적인 제품입니다. 현재 인텔이 일반 소비자 시장에서 주력으로 삼고 있는 노트북 및 데스크톱 CPU는 스마트폰과 태블릿에 사용되는 모바일 프로세서만큼 전력 소모와 발열량을 줄일 필요가 없습니다. 컴퓨터가 성능을 희생하면서까지 손으로 휴대하는 기기만큼 전력을 줄일 이유가 없는 것이죠. 따라서 인텔 하이브리드 기술은 일부 저전력 모바일 CPU에서만 적용될 것으로 보였으나 인텔은 예상을 뒤집고 타이거 레이크 후속 제품인 앨더 레이크에 하이브리드 CPU 기술을 넣겠다고 발표했습니다. 내년에 12세대 코어 프로세서로 출시될 앨더 레이크는 골드 코브(Golden Cove) 고성능 코어와 그레이스몬트(Gracemont) 저전력 코어로 구성됩니다. 고성능 코어가 하나 밖에 들어가지 않아 성능에서 아쉬움이 많았던 레이크필드와 달리 앨더 레이크는 고성능, 저전력 코어를 최대 8개씩 넣을 것으로 알려져 있습니다. 앨더 레이크는 데스크톱, 노트북 CPU 모두를 포함하며 향상된 슈퍼핀(enhanced SuperFIN) 10nm 공정으로 제조됩니다. 초고속 인터페이스인 PCIe 5.0 및 차세대 PC 메모리인 DDR5를 지원하는 첫 인텔 CPU가 될 예정이기도 합니다. 모바일 버전의 경우 5G 네트워크도 지원합니다. AMD에서 인텔로 이적한 뒤 인텔 수석 아키텍트 겸 수석 부사장이 된 라자 코두리는 성능에 초점을 맞춰 하이브리드 아키텍처를 개발하고 있다고 설명했습니다. 그는 앨더 레이크가 성능 자체로도 훌륭하지만, 와트 당 성능비로도 가장 뛰어난 인텔 프로세서가 될 것이라고 언급했는데, 사실 그것보다 더 궁금한 건 2021-2022년 사이 등장할 AMD 차세대 라이젠에 맞설 수 있는지 입니다. AMD는 올해 말에 차기 아키텍처인 Zen 3 기반의 CPU를 출시하고 내년에는 5nm 공정의 Zen 4 기반 CPU를 출시할 예정입니다. 결국 5nm 공정 라이젠과 10nm 공정 인텔 코어 프로세서의 경쟁인데, 아키텍처를 개선했다고 해도 미세 공정의 차이를 극복할 수 있을지 우려되는 부분이 있습니다. AMD는 저전력 코어 없이도 미세 공정의 힘을 빌려 전력 대 성능비를 쉽게 개선할 수 있습니다. 앨더 레이크의 구성은 흥미롭지만, 향상된 10nm 슈퍼핀 미세 공정이 이름만큼 성능을 내주지 못하면 참신한 하이브리드 구조도 빛을 보기 어려울 것입니다. 인텔의 새로운 시도가 저전력과 고성능이라는 두 마리 토끼를 잡으면서 시장에서 성공할지 아니면 AMD의 거센 공세 앞에 빛이 바랠지 궁금합니다. 고든 정 칼럼니스트 jjy0501@naver.com　

2020-08-20 09:29 나우뉴스
[고든 정의 TECH+] 노트북에서 이제는 슈퍼컴퓨터까지…x86 권좌 흔드는 ARM CPU

최근 일본은 슈퍼컴퓨터 경쟁에서 다시 1위를 차지했습니다. 2011년 세계 1위 슈퍼컴퓨터로 이름을 올린 K 컴퓨터(K는 10의 16승인 경(京)의 일본식 발음)의 후계자인 후카쿠(富岳·후지산의 다른 이름)는 415페타플롭스의 성능을 달성해 미국의 서밋(Summit)을 가볍게 제치고 세계 1위를 달성했습니다. 후카쿠는 선배인 K 컴퓨터와 마찬가지로 고베에 있는 일본 이화학연구소(RIKEN)의 컴퓨터 과학 센터(R-CCS)에 건설 중인데, 사실 아직 건설이 다 끝나지 않은 상태입니다. 후카쿠가 모두 설치되면 K 컴퓨터보다 100배 빠른 엑사플롭스급 연산 능력을 지니게 될 것입니다. 하지만 후카쿠가 눈길을 끄는 또 다른 이유는 ARM 계열 CPU로 세계 1위 슈퍼컴퓨터가 된 첫 번째 사례라는 것입니다. 과거에도 ARM 기반 슈퍼컴퓨터를 만들려는 시도는 몇 차례 있었지만, 그다지 인상적인 성공 사례는 없었습니다. 사실 슈퍼컴퓨터 TOP500 명단에 이름을 올린 첫 번째 페타플롭스급 ARM 슈퍼컴퓨터는 2018년에 204위를 한 아스트라(Astra) 정도였습니다. 그런데 갑자기 후지쯔가 ARM 기반 슈퍼컴퓨터로 1위를 한 것입니다. 그러나 후카쿠는 절대 갑자기 튀어나온 물건이 아닙니다. 후지쯔는 2016년 국제 슈퍼컴퓨팅 컨퍼런스에서 차세대 슈퍼컴퓨터는 ARMv8 기반의 엑사스케일(Exascale) 슈퍼컴퓨터가 될 것이라고 발표했었습니다. 후카쿠라는 이름은 2019년에 정했지만, 사실 개발은 2014년부터였습니다. 본래 후지쯔는 지금은 오라클에 합병된 썬 마이크로시스템스와 협력해 스팍(SPARC) 계열 서버 프로세서를 개발했기 때문에 K 컴퓨터 역시 스팍 계열인 SPARC64 VIIIfx 8를 사용했습니다. 하지만 서버 시장에서 인텔의 독주 체제가 굳어지면서 스팍 프로세서의 입지는 줄어들었습니다. 결국 후지쯔는 빠른 속도로 성능을 높인 ARM 계열에 눈을 돌리게 됩니다. 이렇게 해서 만든 후지쯔의 A64FX CPU는 48개의 연산 코어와 4개의 보조 코어로 된 52코어 CPU라는 매우 독특한 구조를 지니고 있습니다. A64FX는 ARMv8.2-A 스케일러블 벡터 확장 Scalable Vector Extension(SVE)을 지원하는 첫 번째 ARM CPU로 매우 강력한 연산 능력을 지니고 있습니다. 별도의 GPU 없이 CPU만으로도 2.7TFLOPS 연산이 가능한 수준입니다. A64FX의 또 다른 장점은 크기가 매우 작다는 것입니다. A64FX는 서버용 DDR4 메모리 대신 1TB/s의 대역폭을 지닌 4개의 8GB HBM2 메모리 사용합니다. HBM2 메모리는 CPU 옆에 타일처럼 붙어 있어 전체 시스템의 크기가 매우 작습니다. 참고로 HBM2 메모리는 어느 회사 제품인지는 밝히지 않았지만, 제조사가 삼성과 SK 하이닉스 외에는 없으므로 한국산 HBM2 메모리를 사용했을 것으로 추정됩니다. 아무튼 카드 형식의 작은 A64FX CPU 노드를 만들 수 있어 하나의 서버랙에 많은 시스템을 넣을 수 있습니다. (사진) 덕분에 7,299,072개의 코어를 이용해 2,414,592개의 코어를 사용한 미국의 서밋을 누르고 세계 최고 슈퍼컴퓨터가 될 수 있었던 것입니다. 흥미로운 사실은 다른 나라에서도 ARM 슈퍼컴퓨터 프로젝트를 추진하고 있다는 것입니다. 프랑스의 ARM 프로세서 개발사인 SiPearl은 유럽 연합의 유럽 프로세서 계획(European Processor Initiative project)에서 자금을 지원받아 고성능 서버칩을 개발하고 있습니다. 현재 계획으로는 2022-2023년 사이 독자 엑사스케일 시스템을 개발할 예정입니다. 미국의 산디아 국립 연구소 역시 고성능 ARM 슈퍼컴퓨터 개발을 진행 중입니다. 이들이 구체적인 결과를 내놓으면 ARM 슈퍼컴퓨터는 신기한 물건이 아니라 통상적인 형태의 슈퍼컴퓨터로 자리잡을 것입니다. ARM 계열 CPU가 최근 몇 년 사이 서버 및 슈퍼컴퓨터 시장에서 급부상한 이유는 기본적으로 CPU 성능이 좋아졌기 때문이지만, 라이선스 비용만 내면 누구나 고성능 프로세서를 개발할 수 있는 ARM의 정책 덕분이기도 합니다. TSMC나 삼성 같은 파운드리 회사가 경쟁적으로 최신 미세공정을 제공하기 때문에 돈만 있으면 누구나 인텔, AMD 부럽지 않은 고성능 프로세서를 제조할 수 있습니다. 이는 독자 CPU 아키텍처와 반도체 생산 시설을 갖추지 못한 기업과 국가도 슈퍼컴퓨터를 개발할 수 있다는 뜻입니다. ARM 계열 슈퍼컴퓨터가 단발성으로 끝나지 않을 것임을 시사하는 대목입니다. 물론 그렇다고 해서 오랜 세월 쌓아 올린 x86의 아성의 쉽게 무너지지는 않을 것입니다. 하지만 IT 업계의 변화는 매우 빠르며 1등 기업도 순식간에 변화에 도태되어 몰락할 수 있습니다. 최근 거세지는 ARM 진영의 도전에 인텔과 AMD가 어떤 대응책을 내놓을지 주목됩니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-06-26 15:45 나우뉴스
[고든 정의 TECH+] 맥까지 자체 ARM 칩 탑재…자신 만의 생태계 구축하는 애플

애플의 개인용 컴퓨터인 맥(mac)은 지금까지 세 가지 형태의 CPU를 탑재했습니다. 1984년 등장한 오리지널 매킨토시는 모토로라 68000을 사용했습니다. 이후 1994년 IBM의 파워 PC(PowerPC)로 CPU를 변경하는데, 초기에는 강력한 성능으로 시장에서 호평을 받았습니다. 하지만 스티브 잡스는 2006년 파워 PC에서 인텔 CPU로 갈아타기로 결정합니다. IBM 파워 PC의 강력한 경쟁 상대였던 인텔 x86 CPU의 성능이 크게 향상되었고 파워 PC에서 약점으로 생각되던 노트북용 CPU에서 더 나은 대안을 제시했기 때문입니다. 사실 파워 PC용으로 개발되었던 맥OS와 소프트웨어를 모두 x86으로 변경한다는 것은 쉽지 않은 결정이었습니다. 하지만 당시 IBM의 개발 방향은 서버 및 고성능 컴퓨팅에 초점이 맞춰져 있었고 인텔만큼 노트북에 집중할 가능성은 희박했습니다. 따라서 장기적으로 봤을 때 인텔 CPU와 플랫폼이 맥의 미래를 위해 나은 결정이었습니다. 파워 PC에서 인텔 CPU로 갈아탄 일은 지금도 잡스의 탁월한 선택으로 평가받고 있습니다. 하지만 모토로라와 IBM과 마찬가지로 애플과 인텔의 밀월 관계 역시 영원할 순 없습니다. 이미 업계에서는 몇 년 전부터 애플이 ARM 기반 자체 프로세서를 맥에 탑재할 것이라는 루머가 끊이지 않았습니다. 인텔 CPU의 발전이 정체된 사이 애플 A 시리즈 같은 모바일 AP는 성능이 급격히 빨라져 x86 CPU와의 격차를 크게 줄였기 때문입니다. 그 결과 과거에는 모바일이나 임베디드 등 고성능보다는 저전력이나 낮은 가격으로 승부하던 시장뿐 아니라 서버나 노트북 등 고성능 기기 시장까지 ARM 기반 CPU가 파고들고 있습니다. 퀄컴은 스냅드래곤 8cx를 통해 윈도우 10 기반 노트북 및 태블릿 시장에 출사표를 던졌고 아마존은 자체 ARM 서버칩의 성능이 인텔이나 AMD의 서버칩에 비해 가성비가 더 높다고 발표했습니다. 애플의 A 시리즈 AP는 모바일 ARM CPU 중에서 성능이 가장 높은 편에 속합니다. 애플이 노트북이나 데스크톱에 들어갈 더 고성능 ARM 기반 프로세서를 만든다면 충분히 인텔 CPU와 경쟁할 수 있는 상황입니다. 애플 자체 프로세서를 탑재한 맥의 등장은 사실 시간문제였습니다. 애플은 WWDC(세계 개발자 컨퍼런스) 2020 기조연설을 통해 ARM 버전 맥을 올해 말 출시하겠다고 발표했습니다. 새로운 맥OS인 빅서(Big Sur)는 ARM 버전으로 개발된 것으로 시연용으로 보여준 모든 앱이 ARM 버전으로 구현된 것입니다. 애플은 x86 어플리케이션의 대부분을 수일 이내로 ARM 버전으로 수정할 수 있을 것으로 예상했습니다. 수정되지 않은 x86 앱이라도 x86-ARM 번역기인 로제타 2(Rosetta 2)를 통해서 새로운 ARM 기반 맥에서 사용할 수 있습니다. 참고로 파워 PC에서 x86으로 이전할 때 사용한 앱의 이름이 로제타입니다. 애플은 ARM 기반 맥에 들어갈 프로세서에 대한 정보는 제공하지 않았습니다. 단지 노트북 CPU 수준의 전력 효율성과 데스크톱 CPU 수준의 성능을 보여줄 것이라고 주장했습니다. 다만 아이패드용 AP를 사용할 것인지 아니면 새로운 고성능 프로세서를 탑재할 것인지는 밝히지 않았습니다. 전자를 택한다면 비용을 절감할 수 있고 후자를 택한다면 성능을 높일 수 있을 것입니다. 개발자를 위한 개발자 전환 킷(DTK, Developer Transition Kit)에는 아이패드 프로에 탑재된 A12Z와 16GB 메모리, 512GB SSD, 맥OS 빅서 베타 버전이 탑재되었습니다. 애플 자체 칩 전환에는 대략 2년 정도의 시간이 소요될 것으로 예상됩니다. 자체 칩을 사용할 경우 얻는 가장 큰 이점은 비용 절감입니다. 애플의 A 시리즈 AP는 인텔 CPU보다 저렴하기 때문입니다. 또 GPU의 경우도 라데온 대신 자체 GPU를 내장하면 비용을 한 단계 더 절감할 수 있습니다. 하지만 비용 절감이 유일한 이유는 아닙니다. 모든 애플 기기가 자체 ARM 기반 프로세서를 사용하면 맥OS와 iOS의 실용적인 통합이 가능합니다. 애플은 상당수 iOS 앱을 별도의 전환 과정 없이 맥에서도 사용할 수 있다고 언급했습니다. 결국, 맥의 활용도가 크게 높아지면서 아이폰 사용자를 자연스럽게 맥으로 끌어올 수 있습니다. 자체 생태계를 크게 강화할 수 있는 것입니다. 최신 A 시리즈 칩셋에 탑재한 인공지능 가속 기능을 맥에서 사용할 수 있는 것도 큰 장점입니다. 사실 x86에서 ARM으로 이전하는 비용이 만만치 않지만, 이전을 통해 얻는 여러 가지 이득이 비용을 상쇄하고도 남을 것입니다. 여담이지만, 본래 ARM은 영국의 애플이라고 불리던 아콘 컴퓨터가 개발한 CPU입니다. 아콘 컴퓨터는 오래전 파산했지만, CPU 설계 부분은 ARM으로 독립해 지금에 이르렀습니다. 이런 사연을 지닌 ARM이 진짜 애플의 두뇌 역할을 하게 됐으니 우연치곤 재미있는 일입니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-06-24 09:36 나우뉴스
[고든 정의 TECH+] 인텔이 키우는 ‘타이거 레이크’…노트북 시장 호랑이 될까?

인텔은 반도체 시장에서 삼성과 1위 자리를 다투는 기업으로 CPU 부분에서 누구도 넘볼 수 없는 강력한 경쟁력을 지니고 있습니다. 하지만 CPU 시장에서 인텔의 압도적 경쟁력은 지난 몇 년간 성능을 크게 키운 경쟁자에 의해 흔들리고 있습니다. 최신 Zen 아키텍처 기반의 라이젠 CPU를 들고나온 AMD는 TSMC와 손잡고 인텔보다 더 빨리 7nm 공정 CPU를 내놓으면서 데스크톱, 노트북, 서버 등 모든 시장에서 인텔을 압박하고 있습니다. 물론 아직도 인텔의 점유율은 상당히 높고 매출이나 영업이익 등 모든 외형 지표는 양호하지만, 인텔 혼자 독점하던 시장에서 경쟁자의 점유율이 빠르게 올라가면서 내부적으로는 심기가 불편할 수밖에 없는 상황입니다. 하지만 당장 인텔은 7nm 공정은 고사하고 10nm 공정 최신 제품도 빠르게 출시하지 못하는 상황입니다. 이런 상황에서 AMD는 7nm 공정 기반의 라이젠 모바일 4000 시리즈(르누아르)를 출시해 경쟁자를 더 압박하고 있습니다. 하지만 인텔도 도전자를 물리칠 새로운 카드를 내놓을 예정입니다. 바로 '타이거 레이크'(Tiger Lake)로 알려진 차세대 10nm CPU입니다. 타이거 레이크는 2019년에 그 존재가 로드맵에서 확인되었으며 2020년 초 CES에서 실물이 처음 공개됐습니다. 타이거 레이크는 서니 코브(Sunny Cove) 아키텍처를 개량한 윌로우 코브(Willow Cove) 아키텍처 CPU와 10nm++ 기반 최신 미세 공정이 적용되어 전 세대인 아이스 레이크(Ice Lake)보다 두 자릿수 높은 성능을 보여줄 예정입니다. 여기에 딥 러닝 부스트(Deep Learning Boost) 기능까지 추가되어 x86 모바일 CPU에서도 AI 가속 기능을 제공합니다. 하지만 가장 중요한 변화는 CPU보다 내장 그래픽입니다. 인텔의 CPU 내장 그래픽 성능은 항상 경쟁자인 AMD의 내장 그래픽에 미치지 못했습니다. AMD가 라데온 GPU를 개발하고 있어 그래픽 부분에서는 성능이 항상 앞섰던 것입니다. 결국 고민 끝에 인텔은 라데온 개발팀의 핵심 인력인 라자 코두리를 스카우트했습니다. 타이거 레이크에는 그 결과물인 Xe 그래픽 아키텍처가 탑재됩니다. 이런 인연 때문에 Xe를 탑재한 타이거 레이크와 최신 라데온 그래픽을 탑재한 라데온 4000 시리즈의 대결에 관심이 쏠리고 있습니다. 타이거 레이크에 탑재된 Xe 내장 그래픽의 성능은 아직 공개되지 않았지만, 최근 컴퓨터 하드웨어 커뮤니티에서는 타이거 레이크의 벤치마크 결과라고 주장하는 데이터들이 올라오고 있습니다. 이에 따르면 타이거 레이크가 라데온 4800U보다 그래픽 성능이 다소 앞서는 것으로 보이나 아직 진위 여부는 확인하기 힘든 상태입니다. 타이거 레이크에서 또 다른 흥미로운 관전 포인트는 새로운 인터페이스의 도입입니다. 인텔은 올해 초 타이거 레이크가 초고속 인터페이스인 썬더볼트 4를 지원한다고 발표했습니다. 썬더볼트는 USB 4.0과 통합될 예정이고 PCIe 규격과 연동되기 때문에 PCIe 4.0 지원도 모두 동시에 이뤄질 것이라는 소식이 들리고 있습니다. LPDDR5 같은 더 고성능의 모바일 메모리를 사용한다는 루머도 있습니다. 인텔은 타이거 레이크의 출시 일자를 2020년 중반으로 잡고 있습니다. 따라서 가까운 시일 내로 그 모습을 드러낼 것으로 예상됩니다. 다만 소비자가 직접 구매하는 CPU가 아니라 노트북 제조사에 제공되는 제품이기 때문에 소비자들은 11세대 코어 프로세서라는 명칭으로 올해 하반기 노트북 시장에서 볼 수 있을 것입니다. 과연 이름처럼 인텔이 키운 호랑이가 될 수 있을지 결과가 주목됩니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-06-10 09:30 나우뉴스
[고든 정의 TECH+] 인공지능 시장 정조준한 엔비디아의 인공지능 가속기 A100

엔비디아가 코로나19로 인해 사상 최초로 온라인으로 진행된 GTC 2020 컨퍼런스에서 차세대 아키텍처인 암페어(Ampere)와 이를 적용한 고성능 GPU인 A100을 공개했습니다. A100의 첫인상은 한마디로 ‘거대하다’입니다. 12nm 공정에서 더 미세한 7nm 공정으로 이전하면 트랜지스터 집적도가 증가하는 게 당연하지만, 전 세대의 2.5배가 넘는 542억 개는 예상을 뛰어넘는 수준입니다. GPU 다이 크기는 826㎟인데 이전 세대인 볼타(Volta) GV100이 815㎟ 크기의 다이에 211억 개의 트랜지스터를 집적한 것과 비교하면 정말 빽빽하게 트랜지스터를 담아 넣은 셈입니다. 하지만 이렇게 늘어난 크기에도 불구하고 A100의 배정밀도 연산 능력은 9.7 TFLOPs로 GV100의 7.8 TFLOPs과 비교해 큰 차이가 없습니다. 그 이유는 시대의 요구에 따라 고성능 컴퓨팅보다 인공지능에 관련 연산 유닛을 대거 집어넣었기 때문입니다. 사실 엔비디아는 2017년에 나온 볼타 GV100부터 GPU에 인공지능 기술을 대거 도입해 이 시장에서 승승장구했습니다. 암페어 A100은 아예 올인했다고 해도 좋을 정도로 인공 신경망 관련 신기술에 집중했습니다. 암페어 A100은 인공지능과 관련된 특수 연산인 텐서 연산을 가속하기 위해 3세대 텐서 코어를 탑재했습니다. 3세대 텐서 코어는 TensorFloat-32 (TF32) 텐서 연산 유닛을 새로 탑재해 FP32 데이터 연산과 입출력 속도를 10배 정도 끌어올렸습니다. 기존의 볼타에서도 지원했던 FP16 연산 속도도 2.5배 빨라졌습니다. 이것만으로도 인공지능 관련 연산 속도를 크게 높일 수 있지만, 엔비디아는 희소성 가속(Sparsity Acceleration)이라는 신기술을 도입해 인공 신경망 연산 속도를 다시 두 배 높였습니다. 따라서 실제 체감 속도는 최대 20배 빨라졌습니다. 엔비디아가 공개한 벤치마크 결과에 의하면 암페어 A100은 일반적으로 많이 사용되는 고성능 컴퓨팅 (HPC) 연산에서는 볼타 대비 1.5-2.1배 정도 빠르며 인공지능 연산은 방식에 따라 3-7배 정도 더 빠릅니다.(그래프 참조) 고성능 컴퓨팅 분야에서도 더 빨라지긴 했지만, 인공지능 관련 기능을 대폭 강화해 AI에 대한 요구가 많아지는 데이터 센터 및 기업 시장을 정조준한 것으로 풀이될 수 있습니다.암페어 아키텍처의 또 다른 장점은 인공지능 연산에서도 학습(training)에 특화된 볼타 아키텍처와 추론(inference)에 특화된 튜링 아키텍처의 장점을 포괄해 학습과 추론 모두에 사용할 수 있다는 것입니다. 볼타 아키텍처에서는 FP16 텐서 연산만 지원했고 나중에 등장한 튜링 아키텍처에서는 추론 연산에 중요한 INT4/8을 지원해 두 가지 제품이 각각의 용도에 사용되었습니다.(후자는 T4 가속기) 기업 입장에서는 작업에 따라 두 가지 인공지능 가속기를 도입해야 하는 문제점이 있었습니다. 암페어 A100에서는 300억 개 이상 늘어난 트랜지스터에 이 기능을 집중적으로 할당해 통합 인공지능 가속기로 거듭났습니다. 엔비디아가 같이 공개한 A100의 재미있는 부가 기능 중 하나는 하나의 GPU를 7개의 가상 GPU로 활용할 수 있는 Multi-Instance GPU(MIG) 기술입니다. A100처럼 큰 자원을 지닌 GPU를 모두 사용하는 인공지능 작업도 있을 수 있지만, 사실 전체가 필요하지 않을 수도 있습니다. 이 경우 GPU의 자원을 쪼개 여러 사용자가 같이 쓰거나 한 사용자라도 여러 작업을 동시에 수행할 수 있다면 작업 효율을 높일 수 있습니다.A100은 공개와 더불어 이미 고객에서 첫 제품이 인도된 상태입니다. 8개의 A100이 사용된 DGX A100은 미국 아르곤 국립 연구소에서 설치가 시작되었습니다. 19만9000달러의 가격표를 달고 나온 DGX A100은 두 개의 64코어 AMD 에픽 CPU와 1TB 메모리, 15TB 스토리지를 탑재했습니다. 전 세대와 달리 인텔 제온 대신 AMD 에픽 CPU를 채택한 점이 눈에 띄는데, 그만큼 에픽 CPU의 성능이 좋아졌기 때문으로 풀이됩니다. 두 회사가 라이벌 관계라는 점을 생각하면 재미있지만, 에픽 CPU의 성능도 좋고 PCIe 4.0도 지원하니까 사실 합리적인 선택입니다. 본래 엔비디아는 게임용 그래픽 카드인 지포스 제조사로 시작해서 전문가용 그래픽 카드인 쿼드로와 고성능 컴퓨팅 GPU인 테슬라로 영역을 점점 넓혀왔습니다. 최근에는 GPU 기반 인공지능 가속기로 IT 업계를 선도한다는 평가를 받고 있습니다. 물론 그와 동시에 엔비디아가 공개하는 최신 기술과 고성능 GPU는 일반 소비자에게 점점 더 생소한 물건이 되고 있습니다. 본체 가격만 수억 원에 달하는 DGX A100 서버를 집에 구비할 개인 소비자는 극히 드물 것입니다. 그러나 점점 발전하는 인공지능 기술은 이미 우리 삶에 큰 영향을 주고 있고 앞으로는 그 영향력이 더 커질 것입니다. 역사상 가장 큰 프로세서로 등장한 A100은 더 강력한 인공지능에 대한 기업들의 수요가 얼마나 큰지 보여주는 증거입니다. 하지만 인공지능을 비즈니스에 접목한 기업이나 연구에 활용하는 과학자 모두 여기에 만족하지 않을 것입니다. 분명 몇 년 안에 이보다 더 강력한 인공지능 하드웨어가 탄생하게 될 것입니다. 이렇게 발전한 인공지능이 인간을 위협하지 않고 인간을 위해서만 사용되기를 기대합니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-05-15 15:16 나우뉴스
[고든 정의 TECH+] AMD 세계 최고 성능 슈퍼컴퓨터에 두뇌 공급한다

지난 몇 년간 IT 테크 거인들의 경쟁은 점점 더 치열해지고 있습니다. CPU 부분에서는 그간 시장을 독점했던 인텔이 AMD의 거센 도전에 직면했고 클라우드 부분에서는 아마존의 AWS가 마이크로소프트의 애저와 치열한 경쟁을 벌이고 있습니다. 메모리 부분에서는 인텔이 차세대 비휘발성 메모리를 내놓으면서 기존의 메모리 제조사를 긴장시키고 있습니다. 거대 IT 회사들의 치열한 경쟁은 어제오늘 일이 아니지만, 이런 거인들의 틈바구니에서 눈에 띄는 회사가 하나 있습니다. 바로 열거한 기업 중에서 상대적으로 규모가 작은 AMD입니다. AMD의 2019년 매출액은 67억 달러로 인텔의 720억 달러의 10분의 1에도 미치지 못합니다. AMD의 작년 영업 이익은 6억3,100만 달러인 반면 인텔은 220억 달러로 아예 비교의 대상도 되지 않을 정도입니다. 작년에 AMD가 CPU와 GPU 판매 호조로 인해 수익이 크게 개선되었음에도 격차를 조금 좁히는 데 그쳤을 만큼 본래 회사 규모가 작은 편입니다. 이런 열세를 극복한 것은 바로 기술력입니다. AMD가 회사 존망의 위기에서 사운을 걸고 개발한 젠 (Zen) 아키텍처는 인텔과의 성능 격차를 크게 줄였을 뿐 아니라 3세대 제품에 와서는 오히려 가성비에서 앞선다는 평가를 받고 있습니다. 인텔보다 앞서 7nm 공정을 도입하고 CPU 코어 숫자를 크게 늘릴 수 있는 칩렛 (Chiplet) 디자인을 적용해 데스크톱 CPU 시장뿐 아니라 전문가용 고성능 CPU 및 서버 시장에서 약진한 것입니다. 그리고 이제 AMD는 다른 IT 거인들에 맞서 세상에서 가장 빠른 슈퍼컴퓨터에 도전하고 있습니다. 미국 정부는 슈퍼컴퓨터 같은 거대과학 부분에서 강력한 경쟁자로 급부상한 중국을 견제하고 미국의 기술 헤게모니를 유지하기 위해 오바마 행정부 시절부터 적극적인 투자를 아끼지 않고 있습니다. 따라서 미국 정부 산하 연구소들은 주요 IT 기업에 연구 개발비를 주고 고성능 슈퍼컴퓨터를 연이어 도입하고 있습니다. 내년에 오크 릿지 국립 연구소는 AMD와 크레이(Cray)에서 프런티어(Frontier)를 아르곤 국립 연구소는 인텔에서 오로라(Aurora)를 도입할 예정입니다. 이 슈퍼컴퓨터의 연산 능력은 엑사플롭스(EFLOPS)급이기 때문에 엑사스케일 컴퓨터로 불립니다. 내년에 이 슈퍼컴퓨터가 도입되면 미국이 무난하게 세계에서 가장 빠른 컴퓨터를 보유한 국가의 타이틀을 계속해서 쥐게 될 것으로 보이지만, 중국의 추격 역시 만만치 않아 미국 정부는 다음 세대 슈퍼컴퓨터를 이미 주문했습니다. 2023년 도입 예정인 엘 카피탄 (El Capitan)이 그것으로 AMD와 크레이가 로렌스 리버모어 국립 연구소(Lawrence Livermore National Laboratory)에 납품할 예정입니다. 도입 비용은 6억 달러로 여기에는 연구 개발비도 포함됩니다. 시스템 개발은 크레이가 담당하고 AMD는 여기에 두뇌 역할을 하는 CPU와 GPU를 공급합니다. 최근 크레이와 로렌스 리버모어 국립 연구소는 엘 카피탄에 대해 몇 가지 새로운 정보를 공개했습니다. 엘 카피탄의 목표 성능은 당초 알려진 것보다 올라간 2엑사플롭스로 로렌스 리버모어 국립 연구소에 도입된 슈퍼컴퓨터인 시에라 대비 16배 더 빠릅니다. 제작은 HPE의 자회사가 된 크레이가 담당하고 AMD는 핵심 프로세서인 Zen 4 기반의 에픽 CPU와 라데온 인스팅트 (Radeon Instinct) GPU를 공급하게 됩니다. AMD가 공개한 내용에 의하면 Zen 4는 5nm 공정 기반으로 2022년말에 선보일 예정입니다. 현재 Zen 2는 7nm 공정에서 제조된 것으로 구체적인 코어 숫자는 공개하지 않았지만, 성능을 높이기 위해서 더 많은 숫자의 코어를 집적했을 것으로 예상됩니다. 코어 숫자 증가 없이 아키텍처 및 미세 공정 개선으로 성능을 높이는 데는 한계가 있기 때문입니다. AMD는 2세대 에픽 CPU를 내놓으면서 최대 코어 숫자를 32개에서 64개로 두 배 높였습니다. Zen 4에서는 128코어 CPU를 보게 될 가능성도 있습니다. 4세대 에픽 CPU는 결국 서버 시장에도 판매될 것이므로 인텔 역시 이에 대한 대응책을 마련할 것입니다. 4세대 에픽 프로세서는 4개의 라데온 인스팅트 GPU와 연결됩니다. 차세대 라데온 인스팅트에 대해서도 자세한 내용을 공개하지는 않았지만, 이 GPU는 올해 출시 예정인 RDNA 2 아키텍처 기반 GPU가 아니라 다음 세대 GPU로 예상됩니다. AMD는 차세대 GPU에서 고성능 연산용과 그래픽용 두 가지 버전을 준비하고 있으며 슈퍼컴퓨터에는 고성능 연산 유닛을 많이 사용한 버전을 탑재할 것으로 보입니다. 라데온 인스팅트가 뛰어난 성능을 보일 경우 연산용 GPU 시장의 강자인 엔비디아나 Xe라는 새로운 제품으로 시장에 진입하는 인텔 모두 긴장하게 될 것입니다. 그런데 여기서 중요한 대목은 슈퍼컴퓨터 사업을 수주한 게 AMD만이 아니라는 것입니다. 미국 정부는 인텔, AMD, IBM, 엔비디아 같은 회사에서 복수로 슈퍼컴퓨터를 주문했습니다. 슈퍼컴퓨터에 적용된 기술은 서버에서 일반 소비자용 컴퓨터까지 퍼져 나가게 될 것이고 결국 IT 산업 전체를 발전을 촉진합니다. 하지만 하나의 회사가 아니라 여러 회사가 경쟁해야 해당 산업이 건전하게 발전할 수 있습니다. 미국의 목표는 단순히 슈퍼컴퓨터 1등이 아니라 좀 더 장기적인 안목에서 산업 자체를 육성하는 것으로 보입니다. 슈퍼컴퓨터를 포함해 IT 산업 육성책을 수시로 내놓는 우리 정부도 눈여겨봐야 할 부분이 아닐까 생각합니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-03-08 11:55 나우뉴스
[고든 정의 TECH+] 한번에 크게 만드는 대신 쪼개라?…CPU 업계 새 바람 칩렛

올해 2월 샌프란시스코에서 개최된 2020 IEEE 국제반도체 회로 학회(ISSCC·International Solid-State Circuits Conference)는 코로나19를 아슬아슬하게 피해 무사히 종료됐습니다. 이번 학회에도 수많은 기업과 연구소, 대학이 자신의 최신 연구 성과를 발표했는데, 이 가운데 무려 96개의 코어를 지닌 CPU를 공개한 연구팀이 있었습니다. 그 주인공은 인텔이나 IBM 같은 업계의 거인이 아니라 프랑스 원자력청(CEA) 산하 전자정보기술연구소(LETI)의 연구팀으로 이들은 16개의 코어를 지닌 작은 반도체 조각인 칩렛(Chiplet) 6개를 연결해 96코어 CPU를 개발했습니다.(사진) 프랑스 연구팀은 당장에 상용화 계획을 밝히지는 않았지만, 이들의 칩렛 디자인은 큰 주목을 받았습니다. 여러 개의 작은 반도체를 연결해 하나의 CPU를 만드는 것 자체는 사실 업계의 오래된 관행이라고 할 수 있습니다. 예를 들어 1997년에 나온 펜티엄 2의 경우 CPU보다 더 큰 L2 캐쉬 메모리를 탑재했습니다. 당시 제조 공정으로는 둘 다 한 번에 제조하기 어려웠기 때문입니다. 하지만 반도체 미세 공정 기술이 발전하면서 L2 캐쉬 메모리를 CPU 안에 탑재하는 것은 기본으로 자리 잡습니다. 펜티엄 3부터는 초기 제품만 제외하고 이후에는 L2 캐쉬가 CPU와 통합되었고 덕분에 CPU의 크기가 작아집니다. 이런 식으로 반도체 미세 공정이 발전하면서 CPU에는 점점 많은 것이 담기게 됩니다. 과거 칩셋에 있던 메모리 관리 기술이나 독립 칩으로 존재했던 내장 GPU도 통합됐습니다. 아예 시스템 전체가 하나의 칩으로 들어가는 시스템 온 칩(System on Chip, SoC) 역시 시대의 대세가 됐습니다. 덕분에 IT 기기의 소형화가 가능해지고 과거 컴퓨터보다 더 성능이 우수한 스마트폰이 등장했습니다. 이는 손톱만한 크기에 엄청난 숫자의 트랜지스터를 집적할 수 있는 반도체 제조 기술의 발전 덕분입니다. 하지만 공정 미세화는 엄청난 투자 비용을 요구합니다. 7nm 이하 미세 공정 파운드리(반도체 위탁생산)가 가능한 회사가 삼성전자와 TSMC뿐인 이유도 기술력은 물론 매년 100억 달러를 훌쩍 넘는 비용을 감당할 회사가 많지 않기 때문입니다. 당연히 미세 공정으로 갈수록 제조 비용이 껑충 뛰게 됩니다. 2017년 AMD의 CEO인 리사 수 박사는 250㎟ 다이 (die) 기준으로 7nm 공정의 제조 비용이 45nm 공정보다 4배 비쌀 것이라고 발표하기도 했습니다.이런 비용 증가가 다시 칩을 나누는 이유 중 하나입니다. 반도체는 웨이퍼라는 동그란 원판에서 제조한 후 사각형으로 떼어내 제품으로 만들기 때문에 작게 만들수록 못 쓰는 공간이 줄어듭니다. 더 중요한 사실은 못 쓰는 칩의 수를 줄일 수 있다는 것입니다. 트랜지스터를 많이 집적한 대형 칩일수록 심각한 오류가 생겨 못쓰게 될 가능성도 같이 커집니다. 반대로 말하면 칩의 크기가 작을수록 수율이 높아 제조 단가가 내려갑니다. 따라서 AMD는 7nm 공정부터 칩렛(Chiplet) 디자인을 적극 도입했습니다. 8개의 Zen 2 코어를 하나의 칩렛으로 만든 후 별도의 I/O 다이에 연결해 1-8개의 칩렛을 쓴 CPU를 내놓은 것입니다. 이 디자인의 또 다른 장점은 다양한 제품 생산에 매우 유리하다는 것입니다. 8코어 제품은 칩렛 1개만 쓰고 64코어 제품은 칩렛 8개를 사용하면 되니 하나의 칩렛과 몇 종류의 I/O 다이만 있으면 온갖 제품을 다 만들 수 있습니다. 당연히 재고 관리에도 유리하고 제조 단가도 낮출 수 있습니다. 현재 대부분의 제품을 하나의 칩으로 제조하는 인텔 역시 여러 개의 칩을 연결해 하나의 칩을 만드는 방식을 시도하고 있습니다. 인텔의 차이점은 2차원적으로 연결할 뿐 아니라 3차원적으로 칩을 쌓아 올리는 방식도 연구하고 있다는 점입니다. 그리고 CPU 이외에 다양한 칩을 서로 연결하는 기술도 개발 중입니다. 칩과 칩 사이의 고속 연결을 위한 EMIB (embedded multidie interconnect bridge)나 3D 적층 기술인 포베로스(FOVEROS)가 그것입니다. 칩렛 디자인의 문제는 여러 개로 쪼개진 칩 사이의 연결이 느려질 수 있다는 것입니다. 따라서 여러 개의 칩렛을 빠르게 연결될 수 있는 기술 개발이 관건입니다. 인텔은 이 부분에서 여러 가지 비전을 제시하고 있습니다. 따라서 1-2년 이내에 과거에는 상상하기 어려웠던 신제품을 들고나올 가능성이 있습니다. 반도체 산업은 지금까지 숱한 어려움을 극복하고 지금처럼 발전했습니다. 공정 미세화에 따른 급격한 비용 증가는 IT 산업의 발전을 가로막는 장애물이지만, 이전에도 그랬던 것처럼 수많은 연구자가 이 어려움을 극복할 수 있는 새로운 아이디어를 제시하고 있습니다. 결국 이런 노력을 바탕으로 지금보다 더 좋은 제품이 소비자 손에 들어올 것입니다. 고든 정 칼럼니스트 jjy0501@naver.com

2020-03-05 11:13 나우뉴스

11
12
13
14
15

연관검색어

핫이슈 기사

서울신문 많이 본 뉴스

위로