찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • CPU
    2026-04-15
    검색기록 지우기
  • Work
    2026-04-15
    검색기록 지우기
  • DM
    2026-04-15
    검색기록 지우기
  • ISE
    2026-04-15
    검색기록 지우기
  • KB
    2026-04-15
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
1,037
  • 거세지는 반도체 전쟁… 바이든, 인텔 中공장 생산 ‘제동’

    미중 두 나라의 ‘반도체 전쟁’이 갈수록 거세지고 있다. 미국 정부가 자국의 첨단기술이 중국으로 흘러가지 못하게 백방으로 틀어막자 중국 정부도 자국 반도체 기업에 수조원을 투자하며 전폭적인 지원에 나섰다. 블룸버그통신은 13일(현지시간) “인텔이 반도체 공급 부족 현상을 타개하기 위해 최근 중국 쓰촨(四川)성 청두(成都) 공장에서 (반도체 재료인) 실리콘 웨이퍼 생산을 늘리려고 했지만 조 바이든 행정부가 제동을 걸었다”고 보도했다. 삼성전자와 인텔 등 글로벌 반도체 기업들은 세계 최대 반도체 시장인 중국에 직접 공장을 짓고 생산량을 늘려 가고 있다. 이 과정에서 자연스레 일부 기술이 이전돼 중국 토종 업체들이 성장하는 발판이 된다. 미국은 도널드 트럼프 전 대통령 때부터 중국의 ‘반도체 굴기’에 경계심을 드러냈다. 바이든 대통령도 이번 결정을 통해 ‘더이상 반도체 기술 유출을 두고 보지 않겠다’는 보호주의 성향을 잘 보여 줬다는 평가다. 현재 인텔은 주력 제품인 중앙처리장치(CPU) 경쟁력 상실로 어려움이 많다. 이에 반도체 위탁생산(파운드리)이라는 신사업을 키워 이를 만회하고자 한다. 인텔은 파운드리 투자에 들어갈 천문학적 자금을 정부 지원으로 해결하고 싶어 해 바이든 대통령과 보조를 맞출 수밖에 없는 상황이다. 중국도 이에 질세라 자국 기업 키우기에 나섰다. 중국 최대 반도체 파운드리 업체인 SMIC는 지난 12일 공고를 내고 “상하이 자유무역구에 자본금 55억 달러(약 6조 4800억원) 규모로 합자회사를 세웠다”고 밝혔다. SMIC와 반도체(IC)산업투자펀드2기(반도체펀드), 하이린웨이가 각각 36억 5500만 달러와 9억 2200만 달러, 9억 2300만 달러를 출자해 37%, 33%, 30%의 지분을 나눠 갖는 방식으로 만들었다. 업계 관계자는 “SMIC 새 합자회사의 실제 주인은 지분의 3분의2 가까이를 확보한 중국 당국”이라고 말했다. 반도체펀드는 중국 정부가 주도하는 반도체 산업 투자사이고, 하이린웨이는 상하이시 정부가 운영하는 회사다. SMIC는 중국에서 정상적으로 운영되는 거의 유일한 파운드리 업체다. 지난해 미국 정부가 화웨이를 제재하고자 세계 1∼2위 파운드리 업체인 TSMC(대만)와 삼성전자와의 거래를 차단하면서 중국 내 SMIC의 전략적 가치는 더욱 높아졌다. 중국 정부는 지난해에도 반도체펀드와 상하이 당국을 통해 SMIC에 2조원 넘게 투자했다.
  • [고든 정의 TECH+] GPU도 서로 합쳤다…AMD 인스팅트 MI200 시리즈 공개

    [고든 정의 TECH+] GPU도 서로 합쳤다…AMD 인스팅트 MI200 시리즈 공개

    최근 CPU 업계의 한 가지 트랜드는 한 번에 큰 칩을 만드는 대신 여러 개의 작은 다이(Die, 집적회로 칩)를 서로 연결해 하나의 큰 칩처럼 만드는 것입니다. 제조사들은 프로세서의 성능을 높이기 위해 점점 더 복잡한 구조를 지닌 CPU를 개발하고 있습니다. 여기에 GPU나 각종 컨트롤러 및 인터페이스를 통합한 결과 프로세서의 크기는 최신 미세 공정으로도 감당하기가 부담스러울 정도로 커지고 있습니다. 최신 미세 공정을 사용할수록 가격이 천정부지로 치솟는 점 역시 제조사들에게 부담입니다. AMD는 7nm 공정 CPU부터 아예 CPU 코어 부분을 별도의 작은 칩렛(Chiplet)으로 분리시키고 여기에 14nm 공정으로 만든 I/O 다이를 붙여 CPU를 제조했습니다. 이렇게 하면 패키징 방식이 복잡해지는 단점이 있지만, 대신 꼭 최신 미세 공정을 적용하지 않아도 되는 부분에 저렴한 공정을 사용하고 칩렛을 여러 개 붙이는 방식으로 코어 숫자를 늘릴 수 있다는 장점이 있습니다. 인텔 역시 AMD의 칩렛 방식에 대응해 타일 방식의 멀티 다이 패키징 방식을 개발했습니다. 인텔은 고성능 GPU에서 이 방식을 먼저 적용한 후 소비자용 CPU인 메테오 레이크에 적용할 계획입니다. 그런데 사실 여러 개의 작은 다이를 하나로 합쳐 큰 프로세서를 만드는 방식은 CPU보다 거대한 GPU에 더 적합한 방식입니다. AMD는 최근 발표한 인스팅트 (Instinct) IM200 시리즈에서 두 개의 다이를 고속 인터페이스로 연결해 하나의 GPU처럼 만드는 방식을 도입했습니다.CPU와 마찬가지로 여러 개의 GPU를 사용해서 성능을 높이는 방식은 사실 오래전부터 사용되어 왔습니다. 엔비디아의 SLI, AMD 크로스파이어 기술이 대표적입니다. 하지만 이 방식은 두 개 이상의 GPU가 서로 데이터를 주고받는 과정에서 상당한 성능 손실이 발생합니다. 두 개의 그래픽 카드를 연결하면 성능이 두 배가 되는 것이 아니라 1.7배가 되는 식입니다. 이 단점을 극복하기 위해 그래픽 카드가 아니라 여러 개의 GPU 다이 사이를 직접 연결하는 방식이 필요했습니다. AMD의 인스팅트 IM200 가속기는 290억 개의 트랜지스터를 집적한 GCD 다이 두 개를 고속 인터페이스로 연결해 580억 개의 트랜지스터를 지닌 하나의 거대한 GPU처럼 작동하게 만들었습니다. (참고로 제조 공정은 TSMC의 N6) 덕분에 47.9TFLOPS의 FP32/64 벡터 역산 성능과 95.7TFLOPS의 FP32/64 메트릭스 연산 능력을 지니고 있습니다. 일반 연산 능력에 있어서는 542억 개의 트랜지스터를 하나의 거대한 다이에 집적한 엔비디아의 A100 가속기를 최대 4.9배 넘어선 것입니다. AMD는 인공지능 연산에 중요한 INT8 메트릭스 연산능력도 383TOPS로 경쟁사보다 좀 더 빠르다고 주장했습니다.IM200 시리즈는 8개의 HBM2E 메모리를 128GB를 탑재했으며 최대 3.2TB/s의 엄청난 대역폭을 자랑합니다. AMD는 OAM이라는 새로운 폼팩터를 도입해 4개에서 8개의 IM200 GPU를 1개 혹은 2개의 에픽 CPU와 조합해 사용할 수 있게 만들었습니다. 각각의 GPU는 560W의 전력을 소모하기 때문에 큰 벽돌 같은 대형 쿨러가 필요합니다. IM200 시리즈는 주로 게임을 구동하기 위한 일반적인 GPU가 아니라 2022년 공개할 엑사스케일 슈퍼컴퓨터에 들어갈 고성능 연산용 GPU입니다. 하지만 여기서 개발한 멀티 다이 패키징 기술은 앞으로 차세대 GPU에도 적용될 수 있습니다. 다이 사이를 연결하는 기술의 발전으로 여러 개를 연결해도 하나처럼 사용할 수 있다면 큰 다이를 만들 이유가 줄어들기 때문입니다. 한 번에 큰 칩을 제조할 경우 실패할 가능성도 높아져 수율은 떨어지고 가격은 올라갑니다. 앞으로 여러 개의 다이를 연결한 CPU나 GPU를 보게 될 가능성이 높아지는 이유입니다. AMD 인스팅트 IM 200 시리즈 자체는 일반 소비자가 사용할 일이 없는 서버, 슈퍼컴퓨터, 인공지능 연산 GPU이지만, 앞으로 소비자용 GPU의 발전 방향을 가늠하게 한다는 점에서 주목됩니다. 인텔과 AMD가 고성능 GPU에서 여러 개의 다이를 연결하는 방식을 이미 선보인 만큼 엔비디아의 대응 역시 주목됩니다. 
  • [고든 정의 TECH+] 인텔의 역작 ‘앨더 레이크’ (12세대 코어 프로세서) 무엇이 달라졌나

    [고든 정의 TECH+] 인텔의 역작 ‘앨더 레이크’ (12세대 코어 프로세서) 무엇이 달라졌나

    CPU 업계 부동의 1위였던 인텔은 2000년대 중반 코어 프로세서로 경쟁자인 AMD를 따돌린 후 2010년대 중반 이후부터 지지부진한 모습을 보였습니다. 삼성전자와 TSMC 같은 경쟁자를 앞서 있다고 호언장담했던 10nm 공정은 결국 2020년대 와서야 본격적으로 양산에 들어갔습니다. 하지만 그러는 사이 AMD는 젠 (Zen) 아키텍처를 적용한 신제품을 내놓으면서 인텔을 턱밑까지 추격했습니다. 라이젠 5000대에서는 게임 성능에서도 우위를 잃으면서 업계 1위의 위치가 흔들렸습니다. 점유율은 여전히 앞섰지만, 성능에서 앞서지 못했기 때문에 점유율을 계속 잃으면서 흔들린 것입니다.  지난 몇 년간 부진의 늪에서 벗어나지 못했던 인텔은 절치부심 구원 투수가 될 새로운 CPU를 개발했고 이제 그 모습을 공개했습니다. 현지 시각으로 11월 4일 공개된 12세대 코어 프로세서 (앨더 레이크, Alder lake)는 오랜 준비한 만큼 확실한 성과를 보여줬습니다. 초기 벤치마크와 리뷰 결과는 인텔이 왕좌를 다시 찾았다는 것을 보여줬습니다. 위기에서 벗어나기 위해 변화가 필요했던 인텔이 앨더 레이크에서 해답을 들고나온 것입니다. 구체적으로 무엇이 달라졌는지 간단히 살펴보겠습니다.인텔 7  인텔에게 엘더 레이크는 상당히 큰 의미가 있는 회심의 일격입니다. 5세대부터 11세대까지 6년을 사용한 14nm 공정에 종지부를 찍고 인텔의 최신 미세공정인 인텔 7 (과거 10nm ESF)을 사용한 첫 번째 데스크톱 CPU이기 때문입니다. 아키텍처는 이미 전 세대인 11세대 코어 프로세서 (로켓 레이크)에서 갈아탔지만, 한 번 더 개선해 성능을 더 높였습니다. 전력 소모량이나 발열이 많아 다소 아쉬운 부분도 있지만, 게임 성능을 포함한 여러 가지 성능이 모두 높아져 경쟁자인 라이젠 5000 시리즈를 능가하고 있습니다.  이렇게 성능이 개선된 것은 고성능 코어 (P core, P는 Performance) 8개와 고효율 코어 8개 (E core, E는 Efficiency)를 사용해 성능 극대화를 꾀했기 때문입니다. 전작인 로켓 레이크가 미세 공정의 한계로 인해 8코어까지만 제조가 가능했다면 인텔 7 공정을 이용한 앨더 레이크는 여유 있게 16코어를 탑재할 뿐 아니라 32개의 연산 유닛 (EU)을 지닌 GPU와 기타 여러 가지 부분을 탑재하고도 다이 (die) 사이즈를 209㎟로 줄이는 데 성공했습니다. 8코어 로켓 레이크가 276㎟나 되는 다이를 지녔던 것과 비교하면 상당히 크기를 줄인 것입니다.  성능이 높은 프로세서라는 이야기는 사실 더 복잡하고 큰 프로세서라는 이야기입니다. 따라서 더 작게 만들 수 있는 미세공정 없이는 성능을 높이는 데 한계가 있습니다. 인텔은 앨더 레이크에서 아키텍처는 물론 미세공정도 개선할 수 있음을 보여줬습니다. 다만 이 점은 경쟁자인 AMD도 마찬가지여서 인텔 4를 적용할 14세대 (메테오 레이크)와 5nm 공정을 적용할 Zen 4 이후 제품과의 불꽃 튀는 경쟁이 예상됩니다.  하이브리드 아키텍처  앨더 레이크가 과거 인텔 CPU와 가장 다른 점은 바로 고성능 - 고효율 코어의 하이브리드 구조라는 점입니다. 높은 성능을 낼 수 있지만 전력 소모량이 많은 고성능 코어와 성능은 낮지만 전력 효율이 높은 고효율 코어를 상황에 따라 교대로 사용하는 것은 모바일 AP에선 흔한 일입니다. 하지만 배터리 수명을 신경 쓸 필요가 없는 데스크톱 CPU 제품에선 굳이 필요하지 않은 기능이라 지금까지 적용한 제품이 없었습니다.  따라서 앨더 레이크가 데스크톱 CPU에서도 하이브리드 아키텍처를 도입한다고 했을 때 상당히 의아하다는 반응이 대세였습니다. 더구나 이런 식으로 16코어를 구성할 경우 32스레드가 아닌 24스레드(16 x 2+ 8)가 되는 점도 약점입니다. 그러나 벤치마크 결과를 보면 앨더 레이크 i9-12900KF의 멀티 스레드 성능은 라이젠 9 5950X를 넘어서고 있습니다. 단점은 전력 소모도 경쟁자를 넘어선다는 점입니다.  전기를 많이 먹어도 일단은 24스레드로 경쟁자의 32스레드를 앞서는 결과를 보여주니 하이브리드 구조의 성능에 대한 의구심은 풀리는 것 같습니다. 남은 의문은 노트북 제품군에서 하이브리드 구조의 효율성입니다. 하이브리드 아키텍처의 진가는 결국 배터리 사용 시간의 제약이 심한 노트북에서 발휘될 것입니다. 데스크톱 버전부터 공개했지만, 사실 앨더 레이크의 진짜 무대는 높은 성능과 긴 배터리 사용 시간의 두 마리 토끼를 잡을 수 있는 노트북 시장일지도 모릅니다.  DDR4 vs DDR5, 그리고 윈도우 10 vs 윈도우 11  앨더 레이크는 DDR4 3200과 DDR5 4800을 지원합니다. 하지만 동시에 두 가지 타입의 메모리를 사용할 순 없고 둘 중 하나만 선택해야 합니다. 메모리 속도는 당연히 DDR5가 빠르지만, 아직 DDR5 도입 초기라 가격이 비싸다는 것이 흠입니다. 그런 만큼 앨더 레이크에서 주목을 끌었던 부분 중 하나는 DDR5와 DDR4의 성능 차이입니다.  결론적으로 말하면 게임에서는 차이가 별로 없지만, 일부 작업에서는 의미 있는 차이를 보여줍니다. 게임은 아직 DDR5 메모리에 최적화되어 있지 않은 상태이고 사실 메모리보다 GPU의 영향을 더 많이 받기 때문에 현재는 차이가 별로 없는 것으로 보입니다. 따라서 주로 어떤 작업을 할지를 생각하고 메모리 종류를 선택해야 할 것으로 보입니다. 또 다른 궁금증은 윈도우 10과 윈도우 11의 성능 차이입니다. 일반적으로 운영체제 업그레이드는 CPU에 더 많은 부하를 주기 때문에 속도가 느려지는 경우가 많지만, 윈도우 11의 경우에는 인텔 스레드 디렉터 (Thread Director) 기능에 최적화되어 있어 하이브리드 아키텍처를 제대로 지원할 수 있습니다. 윈도우 11과 앨더 레이크의 출시 시점이 묘하게 겹치는 점을 생각하면 사전에 인텔과 마이크로소프트의 긴밀한 협조가 있었음을 짐작하게 하는 대목입니다.  하지만 아직은 하이브리드 아키텍처를 활용하는 프로그램 자체가 적은 편이라 윈도우 11의 성능상 이점은 크지 않습니다. 다만 이 부분 역시 저전력 코어가 할 일이 많은 노트북 환경에서는 달라질 수 있습니다.  결론적으로 말하면 앨더 레이크는 인텔이 아직 시장을 주도할 기술력을 지닌 회사라는 점을 다시 한번 입증해 보인 제품이라고 할 수 있습니다. 전력 소모나 발열은 다소 아쉽고 제 성능을 끌어낼 수 있는 DDR5나 DDR5 지원 메인보드 모두 비싸다는 점이 흠이지만, AMD의 정신이 번쩍 들게 만들 제품이라는 점은 확실합니다.  앞으로 한동안 CPU 시장은 새로운 아키텍처와 미세공정을 들고나온 인텔과 내년에 들고나올 AMD 간의 치열한 경쟁이 예상됩니다. 결과적으로 최종 승자는 선택의 폭이 넓어진 소비자가 될 것입니다. 
  • [고든 정의 TECH+] 128코어 서버 프로세서 개발을 꿈꾸는 사이파이브, CPU 시장 태풍의 눈 될까?

    [고든 정의 TECH+] 128코어 서버 프로세서 개발을 꿈꾸는 사이파이브, CPU 시장 태풍의 눈 될까?

    현재 CPU 시장은 ARM과 x86 천하라고 해도 과언이 아닙니다. ARM은 각종 임베디드, 컨트롤러, 사물인터넷, 모바일 기기에 탑재될 뿐 아니라 최근에는 서버와 워크스테이션까지 범위를 점점 넓혀 이제는 x86 CPU의 가장 큰 경쟁자가 되고 있습니다. 하지만 ARM 진영의 전망이 항상 밝은 것은 아닙니다. 아직은 결과를 장담할 수 없지만, 반도체 업계의 거인 중 하나인 엔비디아가 ARM 인수를 추진하고 있어 엔비디아와 이해 관계가 다를 수 있는 다른 회사들과 미묘한 신경전이 벌어지고 있습니다. 최근 ARM의 대안으로 급부상하고 있는 아키텍처가 오픈 소스 기반의 CPU 아키텍처인 RISC-V입니다. RISC-V는 모든 제조사가 라이선스 비용을 지불하지 않고도 사용할 수 있다는 점에서 조금이라도 라이선스 비용을 내야 하는 ARM이나 아예 일부 회사만 제조가 가능한 x86과 다른 매력이 있습니다. 아직은 RISC-V 아키텍처를 채용한 제품이 많지 않지만, 점점 제조사가 늘어나고 있을 뿐 아니라 주요 반도체 및 IT 대기업들이 관심을 보이고 있습니다. RISC-V 기반 아키텍처 설계 회사 중 가장 두각을 나타내는 곳은 바로 사이파이브 (SiFive)입니다. 현재 매출 많지 않은 스타트업인데도 인텔이 20억 달에 인수한다는 이야기가 나올 만큼 업계에서 기술력을 인정받고 있습니다. 인수는 결국 불발된 것으로 알려졌지만, 사이파이브는 인텔은 물론 삼성전자나 SK하이닉스 같은 대형 반도체 제조사들로부터 투자를 유치해 신제품 개발에 박차를 가하고 있습니다. 사이파이브는 2022년에서 2023년 사이 고성능 CPU 아키텍처인 P550를 출시할 예정입니다. P550은 인텔의 7nm 공정 (인텔 4)을 이용할 경우 코어 한 개의 면적이 0.23㎟에 불과할 정도로 작지만 2.4GHz로 작동할 수 있으며 SPEC2006int 벤치마크 기준 1GHz당 8.7점을 낼 수 있습니다. SPECint2006는 프로세서의 정수 연산능력을 평가하기 위한 벤치마크 툴로 ARM Cortex-A75는 6점대, Cortex-A76은 9점대입니다. 최신 x86 CPU의 경우 10점 대 이상입니다. 1~2년 후 등장한다는 점을 생각하면 P550의 성능은 뛰어난 편은 아니지만, 크기가 매우 작다는 점은 무시할 수 없는 장점입니다. 사이파이브는 P550이 같은 성능의 ARM Cortex-A75보다 면적이 1/3 수준에 불과합니다. 이렇게 크기가 작다면 매우 많은 코어를 넣어서 연산 능력을 크게 높일 수 있습니다. 다만 P550 자체는 아직 대형 서버 프로세서에 걸맞은 아키텍처를 지니고 있지는 않습니다. 사이파이브는 차기 아키텍처에서 서버 칩을 공개하겠다는 복안입니다. 사이파이브의 차세대 프로세서는 L1 캐시 용량을 128KB로 두 배 늘리고 L2 캐시 용량은 2MB로 8배 늘려 다른 서버 프로세서와 경쟁할 수 있을 만큼 용량을 키울 계획입니다. 그리고 여러 개의 코어를 탑재할 수 있게 16개 코어가 하나의 코어 콤플렉스를 구성하고 16MB의 대용량 L3 캐시 메모리를 공유할 수 있습니다. 이를 통해 하나의 프로세서에 최대 128코어를 넣을 계획입니다. 코어 한 개의 성능을 P550보다 최대 50% 높이고 코어 숫자는 ARM 서버 프로세서급으로 높여 서버 시장에 도전장을 내민다는 것입니다.흥미로운 부분은 인텔과 사이파이브의 협력 관계입니다. 사이파이브가 인텔의 최신 미세 공정을 이용해 서버 프로세서를 제조하면 인텔의 제온 제품군과 직접적인 경쟁 관계가 됩니다. 물론 서버 시장에서 강력한 입지와 생태계를 구축한 x86 아키텍처가 당장 흔들리지는 않겠지만, 최근 서버 시장에서 ARM 기반 자체 프로세서 채택이 늘어나는 데서 알 수 있듯이 잠재적인 경쟁자를 늘리는 것은 인텔에게 좋은 일이 아닙니다. 이런 부분을 생각하면 인텔이 돈을 더 들이더라도 사이파이브를 인수하는 편이 더 나을 수 있습니다. 사이파이브가 독자 서버 아키텍처를 만들어 인텔과 경쟁 관계로 진입하게 되면 TSMC나 삼성전자 같은 다른 파운드리와 협력할 수 있다는 것도 부담입니다. 다만 야심 차게 개발한 프로세서의 성능이 기대에 미치지 못할 경우 찻잔 속의 태풍으로만 끝날 가능성도 있습니다. RISC-V 자체는 상당한 잠재력을 지닌 아키텍처이고 라이선스 비용이 없는 오픈 소스의 장점 역시 무시할 수 없습니다. RISC-V 진영의 선두인 사이파이브가 몇 년 후 서버 시장에서 파란을 일으킬 수 있을지 미래가 주목됩니다. 
  • [고든 정의 TECH+] 애플의 야수 M1 프로와 M1 맥스…진짜 괴물칩인 이유

    [고든 정의 TECH+] 애플의 야수 M1 프로와 M1 맥스…진짜 괴물칩인 이유

    애플은 2010년 아이폰4에 탑재한 A4 SoC부터 프로세서를 스스로 디자인하고 외부에 위탁 생산해 왔습니다. 애플 실리콘(Apple Silicon)이라고 불리는 애플 자체 디자인 프로세서는 아이폰/아이패드를 위한 A 시리즈부터 애플워치를 위한 S 시리즈나 에어팟을 위한 H 시리즈, 블루투스와 와이파이를 위한 W 시리즈 등 상당히 다양한 제품들이 존재합니다. 이들 역시 iOS나 맥OS, 앱스토어처럼 애플 생태계의 중요한 부분이라고 할 수 있습니다. 하지만 이 생태계에는 자체 노트북 및 데스크톱 프로세서가 빠져 있었습니다. 애플은 하드웨어 생태계의 남은 빈칸을 채우기 위해 M 시리즈를 개발했습니다. 애플은 우선 맥북 에어, 아이맥, 맥 미니, 아이패드 프로를 위한 M1 프로세서를 먼저 선보였습니다. M1 프로세서는 160억 개의 트랜지스터를 집적해 비교 대상인 인텔의 CPU보다 더 복잡했지만, TSMC의 5nm 공정으로 제조한 덕분에 크기와 전력 소모를 크게 줄이고 성능은 앞설 수 있었습니다. 기대를 뛰어넘는 M1의 성능에 사람들의 관심은 애플의 차기작에 쏠렸습니다. 그리고 마침내 M1 프로와 M1 맥스가 공개됐습니다. M1 프로는 M1과 마찬가지로 TSMC의 5nm 공정으로 제조되었으나 M1의 두 배에 달하는 337억 개의 트랜지스터를 집적했습니다. 덕분에 10 코어 CPU와 16코어 GPU, 16코어 NPU를 하나의 다이 안에 모두 넣을 수 있습니다. GPU만 있는 경우이지만, 엔비디아의 지포스 RTX 3060(GA106)이 133억 개의 트랜지스터를 집적한 것과 비교하면 M1 프로가 얼마나 큰 프로세서인지 알 수 있습니다. 그런데 사실 M1 프로의 GPU 연상능력은 데스크톱 버전의 RTX 3060의 절반 수준인 5.2 TFOLPS에 불과합니다. 하지만 놀라운 기술적 성취인 이유는 칩 전체 전력 소모가 30W 수준이라 맥북 프로에 탑재해도 긴 배터리 사용 시간을 보장하기 때문입니다. 애플 A 시리즈에서 갈고 닦은 저전력 기술이 M1에서 빛을 발했다고 할 수 있습니다. 현재 같은 수준의 전력을 소모하는 프로세서 가운데 그래픽 성능으로 M1과 경쟁할 수 있는 노트북 프로세서는 존재하지 않습니다. 노트북에 별도 그래픽 카드를 탑재하는 순간 이미 전력 소모는 M1 프로를 몇 배 뛰어넘게 됩니다. CPU가 소모하는 전력까지 생각하면 맥북 프로처럼 가볍고 배터리가 오래가는 노트북은 불가능합니다. 그런데 프로세서가 제 성능을 발휘하기 위해서는 메모리도 중요합니다. M1은 LPDDR4x(4266MT/s) 메모리를 사용했지만, M1 프로는 LPDDR5 메모리를 사용해 대역폭을 200GB/s로 높였습니다. 메모리의 정확한 속도는 공개하지 않았지만 256bit LPDDR5 (128bit x2) 메모리를 사용하는 만큼 LPDDR5-6400일 가능성이 높습니다. 한 가지 독특한 점은 두 개의 16GB LPDDR5 메모리 블록이 바로 옆에 붙어 있다는 것입니다. 이는 애플이 M1에서 선보인 통합 메모리(unified memory) 구조로 메모리를 아예 패키지 내부에 탑재해 메모리까지 접근하는 시간을 극단적으로 줄인 것입니다. 그래픽 카드처럼 별도의 GDDR 메모리를 사용하지 않아도 높은 그래픽 성능을 지닐 수 있는 비결 중 하나입니다. 물론 메모리 확장이 불가능하다는 단점이 있으나 32GB나 되는 용량을 생각하면 확장이 필요한 경우는 드물 것입니다. 여기에 CPU + GPU + 칩셋 + 메모리의 크기를 극단적으로 줄여 노트북의 무게와 부피를 줄일 수 있습니다. 다만 200GB/s의 대역폭은 CPU에게는 충분해도 GPU에게는 부족할 수 있습니다. 앞서 예를 든 RTX 3060의 경우 GPU가 360GB/s의 대역폭을 지닌 GDDR6 메모리 8-12GB를 단독으로 사용할 수 있습니다. 그런데 M1 프로는 200GB/s의 대역폭을 CPU와 나눠야 하죠. 사실 CPU와 통합된 내장 그래픽이 제힘을 내기 힘든 이유가 바로 메모리 병목 현상입니다. 그러나 애플은 통합 메모리 구조와 M1 프로 칩 내부에 탑재된 두 개의 거대한 SLC 메모리 블록을 통해 이 문제를 극복한 것으로 보입니다.M1 맥스는 M1 프로의 확장형으로 GPU와 메모리 컨트롤러, 그리고 SLC 블록을 모두 두 배로 늘린 대신 트랜지스터 숫자가 570억 개로 늘어났습니다. 덕분에 GPU 연산 능력도 10.4 TFLOPS로 높아졌고 메모리 대역폭 역시 400GB/s로 늘어났습니다. 메모리 역시 두 배인 64GB를 사용합니다. 하지만 기존의 고성능 GPU보다 100W나 낮은 전력을 소모하면서 같은 성능을 낼 수 있습니다. 비교적 가볍고 배터리도 오래 가는 노트북에서 이런 성능을 지닌 제품을 찾는다면 맥북 프로가 유일한 해답입니다. 이런 일이 가능한 이유는 경쟁자와 달리 5nm 미세공정을 이용해서 CPU와 GPU를 포함한 모든 부분을 하나의 칩에 넣은 SoC 구조를 지니기 때문입니다. 그리고 전력 소모가 적은 LPDDR5만 사용해 주로 DDR4 메모리를 사용하는 노트북 CPU와 전기를 많이 먹는 GDDR6 메모리를 탑재한 노트북 그래픽 카드에서는 불가능한 높은 에너지 효율을 달성했습니다. 물론 이렇게 최신 기술을 많이 사용하면 가격은 올라갑니다. 특히 TSMC 5nm 같은 최신 미세공정 웨이퍼 가격은 상당히 비싸다고 알려져 있습니다. M1 프로의 다이 크기는 246 ㎟로 M1의 두 배 수준이고 M1 맥스는 432㎟으로 5nm 공정 제품 가운데 가장 큰 편에 속합니다. 따라서 제조 단가가 비쌀 수밖에 없습니다. 다만 요즘 가격이 매우 비싼 외장 그래픽 카드 성능의 내장 그래픽을 지니고 있다는 점, 그리고 본래 맥북 프로가 고급형으로 비싸다는 점을 감안하면 큰 문제는 아닐 것으로 생각됩니다. 애플의 M1 시리즈는 애플의 표현대로 야수(beast)와 같은 성능을 지니고 있습니다. 그래픽 성능은 현존하는 x86 CPU의 내장 그래픽으로는 도저히 따라잡을 수 없는 수준이고 게임 콘솔에 탑재된 커스텀 SoC 정도가 성능을 겨뤄볼 수 있는 수준이지만, 전력 소모량이나 크기가 M1 프로와 맥스가 압도적으로 작아 비교 불가입니다. 개인적으로는 애플 M1 시리즈가 기존 프로세서 제조사들을 크게 자극하리라 생각합니다. 애플 실리콘을 탑재한 맥과 맥북이 많이 팔린다는 이야기는 이들의 입지가 좁아진다는 뜻이기 때문입니다. 애플의 야수에 대응하는 인텔, AMD, 엔비디아의 대항마들을 기대해 봅니다.
  • [고든 정의 TECH+] 인텔 역습에 대항하는 AMD…3D V 캐시와 ZEN 4로 잡는다

    [고든 정의 TECH+] 인텔 역습에 대항하는 AMD…3D V 캐시와 ZEN 4로 잡는다

    인텔 12세대 코어 프로세서(앨더 레이크)의 벤치마크 결과가 하나씩 유출되면서 업계가 술렁이고 있습니다. 지난 몇 년간 AMD의 라이젠에 고전을 면치 못했던 인텔이 다시 성능상의 우위를 되찾았다는 이야기가 나오고 있기 때문입니다. 물론 정확한 성능과 가격, 전력 소모, 발열 등 주요 정보는 정식 출시가 이뤄진 후 알 수 있겠지만, 다소 실망스러운 모습을 보였던 데스크톱 11세대 코어 프로세서(로켓 레이크)와 달리 최신 미세 공정과 아키텍처를 적용해 성능이 대폭 향상되었을 것으로 보는 게 일반적인 시각입니다. 여기에 PCIe 5.0 및 DDR5 적용처럼 아직 AMD가 도입하지 못한 최신 기술을 사용할 수 있어 소비자용 CPU 부분에서 다시 주도권을 뺏아올 가능성이 커지고 있습니다. AMD 역시 당연히 앨더 레이크를 제압할 대항마를 준비 중입니다. 올해는 일단 가격 인하로 승부를 볼 것으로 보이지만, 내년에는 두 번에 걸쳐 오랜 시간 갈고 닦은 신제품을 선보일 예정이기 때문입니다. 최근 AMD 공식 유튜브에는 수석 마케팅 책임자인 존 테일러와 기술 마케팅 담당자인 로버트 할록이 출연해 ‘AMD 라이젠 프로세서: 5년 후’라는 주제로 AMD의 내년 계획을 공개했습니다. 할록은 AMD의 프로세서 전략이 코어 아키텍처, (반도체) 프로세스 기술, CPU 동작 주파수, 플랫폼이라는 네 개의 큰 기둥을 지니고 있다고 언급했습니다. 그리고 이 네 가지 주요 부분이 라이젠 출시 5년 차를 맞이하는 내년에 큰 변화를 맞이할 예정입니다.우선 코어 부분에서는 새로운 아키텍처인 ZEN4가 도입됩니다. 인텔이 새 아키텍처를 도입해 성능을 크게 끌어올린 것처럼 AMD 역시 아키텍처 혁신을 통해 인텔을 다시 압박하겠다는 전략입니다. ZEN4는 반도체 제조 공정 역시 TSMC 5nm 공정을 도입해 인텔 7 (과거 10nm ESF) 공정을 사용하는 앨더 레이크와 그 후속 제품을 앞설 예정입니다. 하지만 최신 미세 공정 반도체 웨이퍼 공급이 원활하지 않기 때문에 ZEN4의 출시 시점은 내년 하반기가 될 예정입니다. 그렇다고 1년 동안 기다리기만 할 순 없기 때문에 AMD는 내년 초에 몇 년 간 준비해둔 신기술을 선보일 계획입니다. 그 비장의 기술이 바로 3D V 캐시(3D V-Cache)입니다.올해 중반에 공개한 3D V 캐시는 64MB 용량 L3 캐시를 ZEN3 라이젠 칩렛 위에 올리는 방식으로 L3 캐시 용량을 3배로 늘릴 수 있습니다. 16코어 제품의 경우 이론적으로 192MB의 L3 캐시를 지닐 수 있습니다. 이는 웬만한 서버 프로세서보다 많은 용량입니다. 캐시 메모리가 클수록 CPU가 한 번에 작업할 수 있는 데이터가 늘어나므로 제조 공정이나 아키텍처 변화 없이 성능을 높일 수 있습니다. AMD는 3D V 캐시 탑재로 게임 성능이 최대 15% 정도 늘어날 것이라고 주장했습니다. 3D V 캐시를 탑재한 라이젠 CPU는 내년 초 출시 예정입니다. 출시 시점을 생각하면 앨더 레이크와 정면 승부를 벌일 것으로 예상됩니다. 관건은 가격입니다. 추가적인 캐시 다이를 붙이는 만큼 원가 상승은 불가피한데, 앨더 레이크와 경쟁을 감안해 가격을 조정할 것으로 보입니다. 할록이 언급한 네 가지 기둥 중 나머지 두 개인 CPU 주파수와 플랫폼 역시 2022년 하반기에 출시될 ZEN4에서 변화를 겪게 될 예정입니다. AMD는 오랜 시간 유지해온 AM4 소켓을 AM5 소켓으로 변경할 예정입니다. DDR5 및 PCIe 5.0 지원을 위해서는 어쩔 수 없는 선택입니다. 단 CPU 쿨러는 호환되게 유지할 예정입니다. 소소하지만 소비자를 위한 배려가 돋보이는 부분입니다. AM5 소켓과 새 메인보드 플랫폼 도입은 익히 알려진 사실이지만, CPU 주파수에 대한 언급은 새로운 부분입니다. 현재 x86 CPU의 클럭은 5GHz 언저리에서 발전을 멈춘 상태입니다. 인텔 코어 프로세서보다 최고 클럭이 약간 낮았던 라이젠 CPU는 이제는 많이 따라잡은 상황이긴 하나 아직도 라이젠 9 5950X의 최고 클럭은 4.9GHz에 머무르고 있습니다. ZEN4는 아키텍처 개선과 5nm 미세 공정 도입으로 5GHz 초반 클럭 달성이 가능할지도 모릅니다. CPU 동작 클럭이 높아질수록 성능도 비례해서 높아지기 때문에 이 역시 궁금한 부분 중 하나입니다. 최근 CPU 성능 발전은 점점 정체되는 상황이지만, 인텔과 AMD가 이미 극한까지 끌어올린 성능을 더 끌어올리기 위해 경쟁하면서 CPU 성능은 꾸준히 높아지고 있습니다. 어떤 시장이든 업체간 적절한 경쟁은 소비자에게 좋은 일입니다. 2022년에도 꾸준한 경쟁을 기대합니다.
  • “코로나로 막힌 수출길 뚫었다”… 울산 규제자유특구 기업들 수출 성과

    “코로나로 막힌 수출길 뚫었다”… 울산 규제자유특구 기업들 수출 성과

    울산지역 규제자유특구 입주 기업들이 코로나 사태로 막힌 수출길을 뚫고 있다. 이들 기업이 개발한 코로나19 진단 키트 등이 수출길에 오르면서 규제특구 활성화에도 청신호가 켜졌다. 9일 울산시에 따르면 게놈서비스 규제자유특구에 입주한 (주)클리노믹스는 지난해 헝가리에 코로나19 진단키트 50만 세트를 수출한 데 이어 올해 미국 법인에서 코로나19 진단 서비스를 통해 큰 수익을 거두고 있다. 클리노믹스 관계자는 “우리가 개발한 코로나19 진단키트가 지난해 FDA 승인을 받은 후 같은 해 헝가리에 진단키트를 수출해 지난해 한 해 총 98억원의 수익을 거뒀다”며 “올해는 미국 법인에서 진단 서비스를 진행 중이고, 상반기까지만 99억원의 수익을 달성했다”고 말했다. 또 ‘원드롭’도 코로나19 진단키트를 개발해 지난 6월 식약처로부터 수출용 허가를 받았다. 현재 유럽인증(Cevid)을 앞두고 있어 인증을 받으면 유럽은 물론 동남아시아까지 수출길이 열린다. 원드롭 관계자는 “유럽인증 획득이 유력한 상황으로 인증을 받게 되면 유럽뿐 아니라 동남아로도 수출길이 열리게 된다”고 설명했다. 앞서 울산시는 지난해 7월 지역 게놈서비스 산업이 규제자유특구로 지정된 뒤 감염병 대응 기반 구축 사업을 진행해 구체적인 성과를 거두고 있다. 현재 게놈 규제자유특구에 입주한 민간 기업은 총 11개사다. 또 울산과학기술원(UNIST)과 울산정보산업진흥원, 울산대병원, 울산병원 등도 참여기관으로 입주해 복합만성질환과 우울증, 심혈관질환에 대한 진단키트 개발을 활발히 진행하고 있다. 더불어 게놈서비스산업 신성장동력화의 핵심인 바이오데이터팜 구축도 순항하고 있다. 울산시와 울산정보산업진흥원은 지난 6일 3D프린팅 벤처집적지식산업센터에서 ‘바이오데이터팜 시스템 구축’ 착수보고회를 개최했다. 올해 도입 규모는 CPU 9804 core, 메모리 265 TB(테라바이트), 스토리지 80 PB(페타바이트)로 1만명 게놈 데이터를 60일 이내 기초분석이 가능한 고속연산용 고성능컴퓨팅 시스템이 될 것으로 기대된다. 이번 사업을 통해 조성된 인프라는 질환별 진단마커, 감염병 대응 플랫폼 등 게놈서비스 실증 사업에 활용될 예정이다. 시 관계자는 “바이오데이터팜 시스템을 활용해 울산 게놈서비스 특구사업이 성공적으로 추진되면 핀란드 핀젠 프로젝트처럼 많은 바이오기업과 제약회사를 유치해 추가적인 진단기기, 시약, 치료제 개발 등이 가능해질 것으로 기대한다”고 밝혔다. 한편 정부는 지금까지 총 5차례에 걸쳐 규제자유특구를 지정했다. 울산은 2019년 11월 수소그린모빌리티 규제자유특구, 게놈 서비스 규제자유특구 등 3개 분야 규제자유특구에 지정됐다.
  • [고든 정의 TECH+] 뇌를 닮은 컴퓨터에 진심인 인텔…로이히 2 뉴로모픽 칩 공개

    [고든 정의 TECH+] 뇌를 닮은 컴퓨터에 진심인 인텔…로이히 2 뉴로모픽 칩 공개

    CPU나 GPU를 이용하는 현재의 인공지능은 실제 뉴런이 아니라 컴퓨터가 계산한 가상의 인공 뉴런을 이용해 지능을 구현합니다. 물론 인공지능 연산을 위한 전용 하드웨어를 사용하는 경우가 늘어나고 있지만, 이것 역시 물리적인 뉴런을 사용하는 것이 아니라 신경망 연산 등에 특화된 회로를 지닌 프로세서로 뉴런 대신 트랜지스터를 집적하고 있습니다. 하지만 이런 방식으로는 진짜 뇌 같은 사고 능력을 지닌 인공지능을 만들기 힘들다고 생각한 연구자들도 있습니다. 이들은 일반적인 트랜지스터가 아니라 전자 회로로 만든 인공 뉴런을 사용한 프로세서인 뉴로모픽(Neuromorphic) 칩을 연구했습니다. 알고리즘으로 가상 뉴런을 만드는 게 아니라 진짜 전자 뉴런을 지닌 프로세서를 만드는 것입니다. 물론 뉴로모픽 프로세서는 현재 인공지능의 주류라고 보기는 어렵습니다. 하지만 IBM이나 인텔 등 여러 컴퓨터 관련 기업들이 많은 관심을 보이면서 관련 연구가 활발합니다. 인텔은 지난 2017년 1세대 뉴로모픽 칩인 로이히(Loihi)를 공개한 바 있습니다. 흥미롭게도 로이히 2는 인텔 최초의 EUV 공정인 인텔 4(과거 7nm 공정) 공정을 이용해 제조했습니다. 14nm 공정을 적용한 1세대 칩보다 훨씬 미세한 인텔 4 공정을 적용한 로이히 2 칩은 1세대 칩 절반인 31㎟ 크기 다이에 8배나 많은 100만 개의 뉴런을 집적할 수 있습니다. 덕분에 속도도 10배나 빨라지고 여러 개의 칩을 연결해 성능을 높이기도 쉬워졌습니다. 최근 발전 속도가 느려진 CPU나 GPU보다 훨씬 빠른 성능 향상입니다. 앞으로 뉴로모픽 칩의 발전이 기대되는 이유입니다.사실 인텔은 차세대 반도체 제조 기술인 EUV 리소그래피 적용에서 삼성이나 TSMC보다 뒤처진 상황입니다. 그러나 이미 많은 연구와 투자를 진행한 덕분에 초기 단계에 제품을 지닌 것으로 보입니다. 현재 인텔이 공개한 것은 전생산(pre-production) 단계 제품으로 양산 전 엔지니어링 샘플 수준이지만, 현재 개발 중인 최신 미세공정을 적용한 것을 보면 인텔의 기대를 짐작할 수 있습니다. 참고로 올해 말 인텔 7 기반 제품인 앨더레이크가 출시되고 인텔 4 제품이 본격 출하되는 것은 내후년이 될 것으로 예상됩니다. 그런데 하드웨어 발전 이상으로 중요한 부분은 소프트웨어 지원입니다. 뉴로모픽 프로세서가 아무리 똑똑해도 개발자들이 사용할 수 없다면 무용지물입니다. 현재 GPU나 전용 가속 프로세서가 인공지능에서 표준이 된 것도 개발자들이 편리하게 사용할 수 있는 여러 가지 개발 도구와 라이브러리, 그리고 생태계가 존재하기 때문입니다. 인텔은 로이히 기반 시스템을 개발자들이 쉽게 사용할 수 있도록 지원하기 위해 라바 소프트웨어 프레임워크(Lava Software Framework)를 같이 개발했습니다. 하드웨어 단계에서 다른 방식을 사용하는 만큼 인공지능 개발자에게 인기가 높은 텐서플로나 파이토치 라이브러리는 로이히 프로세서에서는 사용할 수 없습니다. 라바 소프트웨어 프레임워크는 파이썬 기반의 개발 환경을 제공해 개발자들이 뉴로모픽 프로세서에 최적화된 프로그램을 개발하는 데 도움을 주고 서로의 라이브러리를 사용할 수 있도록 지원합니다.로이히 2는 전용 하드웨어를 갖추지 못한 개발자나 제조사를 위해 클라우드 형식으로 서비스되거나 혹은 서버 시스템에 통합할 수 있는 인공지능 가속기 형태로 제공될 예정입니다. 구체적인 가격과 출시 일정은 잡히지 않았지만, 인텔 4 공정의 양산 일정을 생각하면 실제 출시는 1~2년 후가 될 것으로 예상됩니다. 현재 인공지능 가속기 분야에서 인텔은 엔비디아에 많이 늦은 상황입니다. 현재 출시를 앞둔 고성능 GPU를 통해 반전의 기회를 노리고 있지만, 앞서가는 엔비디아를 한 번에 따라잡기는 무리일 것이라는 시각이 많습니다. 이미 경쟁자가 앞선 분야가 아니라 아예 새로운 분야를 개척하는 것도 돌파구가 될 수 있습니다. 로이히 2가 뉴로모픽 프로세서 시대를 활짝 열어줄지 미래가 궁금합니다. 
  • [고든 정의 TECH+] 애플 아이폰13을 이해하는 열쇠…A15 바이오닉의 비밀

    [고든 정의 TECH+] 애플 아이폰13을 이해하는 열쇠…A15 바이오닉의 비밀

    올해 가을에도 변함없이 새 아이폰은 화제의 중심에 서 있습니다. 몇 세대 동안 크게 변하지 않은 외형과 기능 때문에 혁신이 없다고 말하는 이들도 있지만, 애플은 이번에도 여러 가지 신기술을 담았다고 주장했습니다. 아이폰13에서 특별히 강조한 부분은 영상입니다. 사람을 강조하는 인물사진 모드처럼 새로 추가된 시네마틱 모드는 초점을 바꿔가며 영화처럼 영상을 촬영할 수 있습니다. 더 커진 이미지 센서와 A15 바이오닉 칩 덕분에 아이폰13 사용자들은 이전 세대보다 더 뛰어난 사진과 영상을 얻을 수 있습니다. 물론 최신 스마트폰 가운데 아이폰 카메라만 좋아지는 건 아니지만, 애플은 시네마틱 모드가 남다른 사용자 경험을 줄 것이라고 자신하고 있습니다. 하지만 애플이 강조하고자 했던 장점 외에 말하고 싶지 않은 단점도 눈에 보입니다. 바로 A15 바이오닉 칩입니다. 애플은 A15 바이오닉에 대해서 매우 제한적인 정보만 제공했지만, 트랜지스터 집적도가 150억 개에 이른다는 점 하나만으로도 최첨단 반도체 기술의 성취를 보여줬다고 해도 과언이 아닙니다. 목적이 다른 만큼 1:1 비교는 불가능하지만, 다른 프로세서와 비교해보면 얼마나 놀라운 숫자인지 알 수 있습니다. 예를 들어 CPU 프로세서 중 8코어 1세대 라이젠 프로세서의 경우 트랜지스터 숫자가 48억 개 정도였습니다. 그리고 16코어 라이젠 3세대 프로세서의 경우 100억 개 정도로 알려져 있습니다. 최근 공개한 IBM의 서버 프로세서인 Power10의 경우 180억 개, 애플의 전작인 A14 바이오닉이 118억 개, 애플 M1 프로세서가 160억 개 정도입니다. A15 바이오닉의 150억 개는 5nm 공정으로는 스마트폰 AP에 구현 가능한 최대치라고 봐도 무방한 수준입니다. 하지만 트랜지스터 숫자 증가와 달리 성능 향상 폭은 크지 않습니다. 이번 발표에서 가장 재미있는 부분은 과거처럼 전 세대 제품이 아니라 경쟁사 대비 CPU가 최대 30%, GPU가 최대 50% 빠르다고 한 점입니다. 그런데 사실 전 세대인 A14 바이오닉도 스냅드래곤 888보다 더 빨랐습니다. 자세한 수치는 벤치마크 결과가 나와봐야 알겠지만, 이 이야기를 종합할 때 A15와 A14의 CPU/GPU 성능 차이는 크지 않은 것을 알 수 있습니다. A14 바이오닉 벤치마크 결과를 참고하면 경쟁사 대비 CPU가 30% 빠르다는 것은 A15 바이오닉의 성능 향상 폭이 10% 이내라는 점을 시사합니다. GPU 역시 5코어 기준으로 경쟁사 대비 50%가 빠르다는 것은 A14 바이오닉보다 30% 이상 빠르지 않다는 이야기로 4코어 기준으로는 A14와 A15의 성능 차이가 별로 크지 않을 것으로 추정할 수 있습니다. A13 바이오닉 때처럼 20%만 빨랐어도 굳이 설명을 빼놓지 않았을 가능성이 높습니다.애플이 자신 있게 밝힌 부분은 16코어 뉴럴 엔진의 성능입니다. 전작의 11TOPs에서 15.8TOPs로 44% 정도 빨라졌습니다. 덕분에 이미지의 인공지능 처리도 빨라져 4K 영상도 다양한 효과를 추가할 수 있게 된 것으로 보입니다. 디스플레이 엔진과, 비디오 인코더/디코더 역시 성능이 향상되어 120Hz 디스플레이와 4K HDR 60프레임 영상처리가 더 부드러워졌습니다. 물론 애플이 밝힌 것처럼 아직 경쟁자가 A14 바이오닉을 따라잡지도 못한 상태에서 이보다 더 성능이 좋은 A15 바이오닉을 탑재했으니 역대 최강 성능이라는 점은 의심할 필요가 없습니다. 다만 32억 개나 늘어난 트랜지스터가 어디로 갔는지는 궁금해지는 부분입니다. 아마도 그 대답은 44% 정도 좋아진 AI 처리 성능과 디스플레이, 영상, 이미지 처리 능력에 있을 것입니다. 그리고 더 많은 데이터를 빠르게 처리하기 위해 프로세서에 탑재한 캐시 메모리인 시스템 캐시 메모리가 2배(아마도 32MB)로 늘어난 것도 트랜지스터 증가에 크게 기여한 것으로 보입니다.따라서 애플이 A15 바이오닉에서 추구한 목표는 이미 업계 최고인 CPU/GPU 성능보다 사진, 영상, 디스플레이 처리 능력 개선이라고 할 수 있습니다. 스티브 잡스 시절부터 하드웨어 스펙보다 사용자 경험을 더 중시하는 애플의 철학이 반영된 디자인임과 동시에 최근 프로세서 성능을 과거처럼 빠르게 높이기 힘들어진 업계의 사정을 반영한 결과입니다. 사실 CPU 업계의 경우 이미 한 세대 당 성능 향상 폭이 10% 이내인 경우가 비일비재합니다. 프로세서 클럭은 5GHz 선에서 이제 더 높이기 힘들어진 상황이고 코어 숫자를 늘리는 것 역시 공정 미세화가 점점 어려워지면서 벽에 부딪히고 있습니다. 아키텍처를 개선해 성능을 높이는 건 10-20% 정도면 최선을 다한 결과이고 그나마 같은 공정에서는 전력 소모도 함께 늘어납니다. GPU 업계는 이보다 사정이 낫긴 하지만, 과거처럼 빠르게 성능을 높이기 힘들어진 사정은 비슷합니다. 따라서 인공지능을 이용한 이미지 품질 향상이나 실시간 레이트레이싱 지원 같은 새로운 기능을 추가해 사용자들이 체감할 수 있는 변화를 끌어내고 있습니다. 애플의 시네마틱 모드 같은 새로운 기능 추가도 비슷한 관점에서 볼 수 있습니다. 그렇다고 해서 이제 프로세서 성능 향상이 멈췄다는 이야기가 아닙니다. 과거처럼 1년 만에 50%, 100% 성능이 높아지긴 어렵다는 이야기입니다. 사실 매년 10%만 높아져도 몇 세대가 지나면 복리처럼 누적되어 상당히 큰 변화가 나타나게 됩니다. 데스크톱처럼 모바일 CPU와 GPU의 성능 역시 그렇게 진보할 것입니다. 다만 이미 CPU나 GPU 성능이 이미 상당히 높아져 10-20%로는 체감할 수 있는 변화를 주기 힘들어진 상황에서 사용자 경험에 집중하는 애플의 전략은 매우 타당해 보입니다.
  • 더 세련되고 똑똑해진 아이폰13… 삼성 “반으론 안 접히네”

    더 세련되고 똑똑해진 아이폰13… 삼성 “반으론 안 접히네”

    카메라 초점 조정, 영화 화면 같은 느낌노치 20% 작게… ‘두뇌’ AP 최신형 적용“CPU 속도 경쟁사 제품보다 50% 빨라”값 95만~217만원… 새달 1일부터 예약애플의 신작 스마트폰인 ‘아이폰13’이 좀 더 똑똑하고 세련되게 돌아왔다. 카메라와 각종 센서 때문에 디스플레이 상단이 검은색으로 움푹 파여 있어 ‘M자 탈모’로 불려온 노치가 작아졌고, 스마트폰의 두뇌라 불리는 애플리케이션 프로세서(AP)는 크게 개선됐다. 이를 놓고 기존에 쓰던 기능이 전부 조금씩 좋아지긴 했으나 ‘결정적 한방’ 역할을 할 혁신 기능이 없다는 혹평도 나온다. 애플은 전작에 이어 아이폰13 시리즈도 글로벌 1억대 이상 팔겠다며 새 제품에 대한 자신감을 내비치고 있다. 애플은 14일(현지시간) 미국 캘리포니아 쿠퍼티노의 애플파크에서 열린 온라인 행사를 통해 아이폰13 시리즈를 선보였다. 이번 제품은 미니(5.4인치), 일반형(6.1인치), 프로(6.1인치), 프로맥스(6.7인치) 네 가지로 출시됐다. 그동안 화면에서 거슬린다는 평가를 받았던 노치 크기가 전작 대비 20% 작아져 디스플레이를 더 넓게 쓸 수 있고, AP는 최신 제품인 A15바이오닉이 적용됐다. 카메라도 피사체에 따라 초점이 자유롭게 조정돼 마치 영화 화면 같은 느낌을 주는 ‘시네마틱 모드’가 새롭게 지원된다. 프로 시리즈에 장착된 카메라는 접사 기능이 대폭 개선돼 2㎝ 이내의 피사체 촬영도 가능하다. 배터리 수명 역시 제품별로 전작 대비 1.5~2.5시간가량 길어졌다. 이번 행사 전후에는 스마트폰 라이벌인 애플과 삼성전자 사이에 일종의 ‘트래시 토크’(운동 경기 도중 상대방을 자극하는 발언)가 벌어지기도 했다. 삼성전자 미국법인 공식 트위터 계정인 ‘삼성 모바일 US’는 아이폰13이 공개된 직후에 “우리는 오랫동안 120헤르츠(Hz) 주사율을 채택해오고 있다”, “우리만 (120Hz가) 데자뷰라고 느끼는 건 아니지?”라는 글을 올렸다. 삼성전자는 지난해 2월 공개한 ‘갤럭시S20’ 때부터 1초당 120개의 화면을 보여주는 120Hz를 적용했는데 이제서야 이것이 가능한 아이폰13을 비꼰 것이다. 또한 “반으로 접혔다면 얼마나 더 멋질까”라고도 말해 삼성이 최근 내놓은 폴더블(접히는)폰을 추켜세웠다. 애플도 행사 도중 자사의 AP를 자랑하면서 “경쟁 제품 대비 중앙처리장치(CPU) 속도가 50%, 그래픽 처리 속도가 30% 빠르다. 솔직히 말하면 경쟁사는 아이폰 칩을 따라잡기에 급급하다. 심지어 2년전 출시한 칩과 비교해도 그렇다”며 모바일 칩 제조 주요 경쟁사로 꼽히는 삼성전자와 퀄컴을 공개 저격했다. 아이폰13의 가격은 95만~217만원이다. 국내에선 다음달 1일부터 사전 주문이 가능하고 8일부터 구입할 수 있다.
  • ‘애플·삼성’ 트래시 토크 “아이폰 따라오기 바빠” vs “반으로 못 접어?”

    ‘애플·삼성’ 트래시 토크 “아이폰 따라오기 바빠” vs “반으로 못 접어?”

    애플의 신작 스마트폰인 ‘아이폰13’이 좀 더 똑똑하고 세련되게 돌아왔다. 카메라와 각종 센서 때문에 디스플레이 상단이 검은색으로 움푹 파여 있어 ‘M자 탈모’로 불려온 노치가 작아졌고, 스마트폰의 두뇌라 불리는 애플리케이션 프로세서(AP)는 크게 개선됐다. 이를 놓고 기존에 쓰던 기능이 전부 조금씩 좋아지긴 했으나 ‘결정적 한방’ 역할을 할 혁신 기능이 없다는 혹평도 나온다. 애플은 전작에 이어 아이폰13 시리즈도 글로벌 1억대 이상 팔겠다며 새 제품에 대한 자신감을 내비치고 있다. 애플은 14일(현지시간) 미국 캘리포니아 쿠퍼티노의 애플파크에서 열린 온라인 행사를 통해 아이폰13 시리즈를 선보였다. 이번 제품은 미니(5.4인치), 일반형(6.1인치), 프로(6.1인치), 프로맥스(6.7인치) 네 가지로 출시됐다. 그동안 화면에서 거슬린다는 평가를 받았던 노치 크기가 전작 대비 20% 작아져 디스플레이를 더 넓게 쓸 수 있고, AP는 최신 제품인 A15바이오닉이 적용됐다. 카메라도 피사체에 따라 초점이 자유롭게 조정돼 마치 영화 화면 같은 느낌을 주는 ‘시네마틱 모드’가 새롭게 지원된다. 프로 시리즈에 장착된 카메라는 접사 기능이 대폭 개선돼 2㎝ 이내의 피사체 촬영도 가능하다. 배터리 수명 역시 제품별로 전작 대비 1.5~2.5시간가량 길어졌다.이번 행사 전후에는 스마트폰 라이벌인 애플과 삼성전자 사이에 일종의 ‘트래시 토크’(운동 경기 도중 상대방을 자극하는 발언)가 벌어지기도 했다. 삼성전자 미국법인 공식 트위터 계정인 ‘삼성 모바일 US’는 아이폰13이 공개된 직후에 “우리는 오랫동안 120헤르츠(Hz) 주사율을 채택해오고 있다”, “우리만 (120Hz가) 데자뷰라고 느끼는 건 아니지?”라는 글을 올렸다. 삼성전자는 지난해 2월 공개한 ‘갤럭시S20’ 때부터 1초당 120개의 화면을 보여주는 120Hz를 적용했는데 이제서야 이것이 가능한 아이폰13을 비꼰 것이다. 또한 “반으로 접혔다면 얼마나 더 멋질까”라고도 말해 삼성이 최근 내놓은 폴더블(접히는)폰을 추켜세웠다.애플도 행사 도중 자사의 AP를 자랑하면서 “경쟁 제품 대비 중앙처리장치(CPU) 속도가 50%, 그래픽 처리 속도가 30% 빠르다. 솔직히 말하면 경쟁사는 아이폰 칩을 따라잡기에 급급하다. 심지어 2년전 출시한 칩과 비교해도 그렇다”며 모바일 칩 제조 주요 경쟁사로 꼽히는 삼성전자와 퀄컴을 공개 저격했다. 아이폰13의 가격은 95만~217만원이다. 국내에선 다음달 1일부터 사전 주문이 가능하고 8일부터 구입할 수 있다.
  • “반으로 접혔다면”…삼성, 애플 아이폰13 공개한 날 도발 트윗

    “반으로 접혔다면”…삼성, 애플 아이폰13 공개한 날 도발 트윗

    15일 애플이 아이폰13 시리즈 등 새로운 제품을 공개하자 삼성전자가 소셜네트워크서비스(SNS)를 통해 애플을 저격하고 나섰다. 삼성전자는 이날 미국 법인 공식 트위터 계정에서 애플이 새로운 아이폰을 공개한 직후 “데자뷔를 느끼는 사람은 우리뿐이야?”라며 아이폰13 시리즈가 전작 아이폰12 시리즈와 크게 차이가 없는 점을 꼬집었다. 삼성전자는 또 “반으로 접을 수 있다면 얼마나 멋졌을까”라며 자사의 새로운 폴더블폰 갤럭시Z폴드3와 갤럭시Z플립3를 뽐냈다. 그러면서 “우리는 120㎐ 적용한 지 꽤 됐는데”라고 아이폰 13 프로와 프로맥스 모델에만 120㎐ 주사율을 적용한 애플을 공격했다. 이어 “2021년에도 노치가 있다니”라며 언더디스플레이 카메라(UDC) 기술을 적용한 갤럭시Z폴드3를 해시태그로 언급하기도 했다. 삼성전자는 “변하지 않는 것에 대해 얘기할 게 있는데, 우리는 더 두드러지는 것을 선호한다”고 덧붙였다.앞서 애플도 신제품을 출시하는 온라인 행사에서 삼성과 퀄컴을 향해 도발하는 듯한 발언을 했다. 이날 애플은 아이폰13 시리즈에 애플리케이션 프로세서(AP)로 ‘A15 바이오닉’을 탑재했다고 설명하면서 “경쟁 제품 대비 CPU 속도가 50%, 그래픽 처리 속도가 30% 빠르다”고 했다. AP는 스마트폰의 두뇌 역할을 하는 칩으로, ‘A15 바이오닉’은 대만 TSMC가 5nm(나노미터) 공정에서 생산했다. 이어 애플은 “솔직히 말하면 경쟁사는 아이폰 칩을 따라잡기에 급급하다. 심지어 2년전 출시한 칩과 비교해도 그렇다”며 “오늘 A15바이오닉 칩으로 그 격차가 더 벌어졌다”고 했다. 모바일 칩 제조 경쟁사인 삼성전자와 퀄컴을 공개 저격한 것. 애플은 이날 행사에서 아이폰13과 아이폰13 미니·프로·프로맥스 등 4종을 선보였다. 아이폰13은 A15바이오닉 칩과 16코어 뉴럴엔진 등을 적용했다. 아이폰13 시리즈는 10월 8일부터 국내에서 판매된다.
  • [고든 정의 TECH+] 멀티 타일 구조로 변화를 택한 인텔 사파이어 래피즈 프로세서

    [고든 정의 TECH+] 멀티 타일 구조로 변화를 택한 인텔 사파이어 래피즈 프로세서

    현재 우리가 사용하는 대부분의 모바일 AP나 데스크톱, 노트북 CPU는 다이(die)라고 부르는 하나의 집적회로 칩으로 구성되어 있습니다. 물론 두 개 이상의 다이를 사용하는 경우도 있는데, CPU + GPU나 CPU + 캐시 메모리, 혹은 두 개 이상의 CPU 다이를 붙여 만든 멀티 칩 패키징 (MCM) 방식의 프로세서들이 있습니다. 과거에는 한 번에 모든 부분을 제조하기 힘들었기 때문에 캐시 메모리나 보조 프로세서를 별도의 다이에 배치한 경우도 있었습니다. 하지만 반도체 제조 공정이 눈부시게 발전하면서 수십억 개의 트랜지스터를 하나의 다이에 집적할 수 있게 됐고, 덕분에 CPU나 GPU는 물론이고 과거에는 칩셋에 있던 부분까지 하나로 모은 SoC(System on a chip)가 새로운 대세가 됐습니다. 그런데 최근에는 반도체 미세 공정의 발전보다 프로세서가 커지는 속도가 빨라 하나의 다이로 된 모노리식(monolithic) 프로세서의 제조가 매우 어려워지고 있습니다. 여기에 10nm 이하의 최신 미세 공정 웨이퍼의 가격이 비싸지는 것도 부담입니다. 따라서 CPU 제조사들은 여러 개의 다이를 결합한 디자인으로 다시 회귀하고 있습니다. AMD의 경우 8코어 CPU를 모은 CPU 칩렛과 I/O 다이를 별도로 만든 후 이를 조합해 다양한 프로세서를 만들고 있습니다. 오랜 세월 거대한 서버 프로세서에도 모노리식 디자인을 고집했던 인텔 역시 최근 과감한 변화를 시도하고 있습니다. 인텔은 내년 정식으로 출시할 제온 프로세서인 사파이어 래피즈(Sapphire Rapids)에 여러 개의 다이를 인텔의 고속 인터페이스인 EMIB 방식으로 연결한 멀티 타일 구조를 도입했다고 발표했습니다.인텔 7 공정(과거 10nm ESF)으로 제조되는 사파이어 래피즈는 최대 400㎟의 SoC 다이 (타일) 네 개를 연결해 최대 1600㎟ 크기의 CPU를 만들 수 있습니다. 현재 제조 기술로 만들 수 있는 가장 큰 모노리식 다이는 700-800㎟ 정도 크기입니다. 최신 미세 공정과 거대한 크기 덕분에 사파이어 래피즈는 최근 인텔의 최대 약점으로 꼽힌 코어 숫자의 열세를 쉽게 극복할 수 있을 것으로 예상됩니다. AMD는 최대 8개의 칩렛을 붙이는 방식으로 64코어 프로세서를 만든 반면 인텔의 아이스레이크 제온의 경우 최대 38코어에 불과했습니다. 모노리식 다이 구조이다 보니 여러 개의 다이를 결합한 구조를 이기기 힘들었던 것입니다. 인텔은 사파이어 래피즈의 코어 숫자에 대해 언급하지 않았지만, 1600㎟의 거대한 크기를 생각하면 코어 숫자가 대폭 늘어났다고 볼 수밖에 없습니다. 그런데 이렇게 멀티 타일 구조를 선택할 경우 가장 큰 문제점은 타일 간 데이터 전송입니다. 만약에 여기서 병목현상이 생기면 속도는 현저히 느려질 것입니다. 인텔은 EMIB 방식을 통해 이 문제를 최대한 극복했습니다. 다만 얼마나 극복했는지는 실제 프로세서가 나와야 검증이 가능한 부분입니다. 사파이어 래피즈의 가장 큰 변화는 멀티 타일 구조의 채택이지만, 그 밖에도 성능을 높이기 위해 여러 가지 변화를 시도했습니다. 코어의 경우 소비자용 CPU인 앨더 레이크(12세대 코어 프로세서)에 사용된 골든 코브(Gold Cove) 코어를 사용해 성능을 최대 19% 높였습니다(동일 클럭 기준). 그리고 서버용 콜든 코브 코어는 높은 성능을 위해 소비자용에는 없는 몇 가지 추가 기능과 함께 더 많은 L2 캐시를 탑재했습니다. DDR5 메모리 적용과 PCIe 5.0 같은 최신 인터페이스도 적용되어 더 고속으로 데이터를 처리할 수 있습니다. 그러나 이보다 더 눈에 띄는 변화는 차세대 고속 메모리인 HBM2E 메모리 적용입니다.HBM은 비싸지만, 속도가 매우 빠른 메모리로 지금까지는 주로 고가의 GPU에만 탑재되었습니다. 서버칩에 탑재되는 것은 사파이어 래피즈가 처음입니다. HBM2E 메모리 적용 모델의 경우 타일 하나당 HMB2E가 하나씩 붙어 다이가 4+4가 됩니다. HBM2E 메모리를 고속으로 연결하는 역할 역시 EMIB이 담당합니다. HBM2E 메모리는 캐시로 사용할 수도 있고 D램처럼 같이 사용할 수도 있습니다. 본래 인텔은 서버 시장에서 독점적 위치에 있었으나 최근 AMD 에픽이 급성장하고 아마존 같은 대형 고객사가 ARM 기반의 자체 서버 프로세서를 만들면서 최대 위기에 처했다는 평가를 받고 있습니다. 사파이어 래피즈의 파격적인 변화는 더 이상 서버 시장에서 밀리지 않겠다는 의지를 반영한 것으로 풀이됩니다. 과연 인텔이 AMD와 ARM 진영이 거센 도전을 물리치고 서버 시장 1위 자리를 지킬 수 있을지 궁금합니다.
  • [고든 정의 TECH+] 3D 칩렛 기술 로드맵 발표한 AMD…인텔과 높이 쌓기 경쟁 시작?

    [고든 정의 TECH+] 3D 칩렛 기술 로드맵 발표한 AMD…인텔과 높이 쌓기 경쟁 시작?

    최근 열린 반도체 관련 학회인 핫 칩(Hot Chips) 콘퍼런스에서 AMD는 3차원 반도체 패키징 기술에 대한 새로운 내용을 공개했습니다. 리사 수 CEO가 컴퓨텍스 2021에서 3D 칩렛 기술 (3D chiplet technology)을 공개한 지 몇 달 만의 일입니다. 당시 리사 수 박사는 8 코어 라이젠 칩렛 (chiplet, CPU 코어를 모은 반도체) 위에 6x6mm 크기의 64MB L3 캐시를 탑재해 게임 성능을 평균 15% 높일 수 있다고 주장했습니다.  CPU가 가장 직접적으로 사용하는 메모리인 캐시 (cache) 메모리는 빠르게 접근할 수 있는 위치부터 L1, L2, L3, L4로 명명합니다. 캐시 메모리는 CPU 입장에서 보면 바로 책상 위에 펼쳐 놓고 쓰는 공책에 해당합니다. 시스템 메모리는 가방 속 참고서, 그리고 하드디스크나 SSD 같은 저장 장치는 도서관에 해당한다고 할 수 있습니다.  당연히 캐시 메모리가 많을수록 CPU 성능이 높아지지만, CPU에서 캐시 메모리가 차지하는 면적을 늘리면 가격도 따라서 올라가기 때문에 적당한 타협이 필요합니다. 최신 8코어 CPU는 대개 16-32MB의 L3 캐시를 지니고 있습니다. 그런데 AMD는 여기에 64MB L3 캐시 메모리를 추가로 쌓을 수 있다는 폭탄선언을 한 셈입니다.  당시에는 이런 일이 어떻게 가능한지 자세히 설명하지 않았지만, 이번 핫 칩 컨퍼러스에서는 보다 구체적인 내용이 공개됐습니다. AMD의 3D 칩렛 기술은 TSMC가 개발한 SoIC (System on Integrated Chip) 적층 기술에 기반하고 있습니다. AMD는 반도체 생산 시설이 없는 팹리스 반도체 회사이고 실제 제조는 TSMC가 위탁 생산을 하고 있으니 당연한 결과입니다.  하지만 이번 발표가 대단하지 않은 것은 아닙니다. L3 캐시 메모리는 CPU와 매우 밀접하게 붙여 있어야 고속으로 데이터를 주고받을 수 있어 하나의 반도체 칩 안에 있는 것이 일반적입니다. 따라서 3D 칩렛 기술은 상당히 일반적이지 않은 결과입니다. AMD와 TSMC가 업계 최초로 L3 캐시 메모리를 CPU 다이 위에 올릴 수 있었던 이유는 아주 미세한 구리 회로를 직접 두 개의 반도체 다이 사이에 정확히 밀착시켜 데이터 전송 속도를 크게 높인 덕분입니다. (사진)  AMD에 따르면 3D 칩렛 기술은 기존의 마이크로 범프 3D (Micro Bump 3D)의 50μm 간격 연결 부위보다 훨씬 촘촘한 9μm 간격으로 연결되어 있어 에너지 효율이 3배나 우수하고 밀도는 15배나 높습니다. 덕분에 CPU와 빠른 데이터 전송이 필요한 L3 캐시 메모리를 CPU 칩렛이 아니라 별도의 칩렛으로 만든 후 위에 쌓을 수 있었던 것입니다. 이번 발표에 따르면 L3 캐시 메모리 칩렛 적층은 시작에 불과합니다. 앞으로 CPU 칩렛 위에 다시 CPU 칩렛을 쌓거나 GPU 같이 다른 프로세서를 쌓을 수도 있고 DRAM 같이 위에 올릴 수 있습니다. 또 이렇게 위로 쌓은 칩들을 평면으로 연결해 마치 고층 빌딩이 서로 연결된 것 같은 하이브리드 2D/2.5D/3D 칩을 만들 수도 있습니다. 이 부분은 HBM 메모리 같은 고속 적층형 메모리를 3D 칩렛과 연결해 프로세서+메모리 형태의 고성능 제품을 만들 수 있다는 의미로 해석됩니다. 그런데 사실 이 이야기는 인텔이 내년에 출시할 폰테 베키오 GPU에서 이미 구현된 내용이기도 합니다. 인텔은 5개의 다른 공정에서 만든 47개의 액티브 타일을 연결해 트랜지스터 숫자가 1000억 개가 넘는 거대 GPU를 생산한다고 발표한 상황입니다. 그리고 2년 후 등장할 메테오 레이크 CPU는 CPU/GPU/SoC-LP 세 개의 타일을 결합해 제조할 예정입니다. 인텔 역시 이름만 다를 뿐 여러 개의 다이를 3D 및 2D 패키징으로 연결해 하나의 CPU를 만드는 셈입니다. 3차원 적층 기술은 메모리 반도체 업계에서는 이미 오래전부터 진행됐습니다. 평면으로 확장해서는 필요한 만큼 용량을 늘리기 어렵기 때문입니다. 구조가 매우 복잡한 시스템 반도체는 메모리보다 3차원 적층이 어렵지만, 조금씩 한계를 극복하면서 돌파구를 마련해 이제는 상용화 단계에 이르렀습니다. 현 시점에서 인텔과 AMD 모두 반도체를 높이 쌓으려는 데는 그럴 만한 이유가 있습니다. 미세 공정으로 진행할수록 반도체 웨이퍼 가격은 급등하기 때문에 모든 부분을 최신 미세 공정으로 제조하면 늘어나는 비용을 감당하기 어렵습니다. 좀 더 저렴한 공정을 이용할 수 있는 부분은 따로 제조하면 상당한 비용을 절감할 수 있습니다. 또 큰 반도체 하나보다 작은 부분을 만든 후 조립하면 제조도 쉽게 수율도 올라갑니다. 마지막으로 여러 개의 다이를 하나처럼 연결하면 과거에는 상상하기 힘들었던 초대형 프로세서도 제조할 수 있다는 장점이 있습니다. 현재 개발 중인 3D 패키징 기술을 통해 프로세서 성능은 한 단계 더 업그레이드될 것입니다. 그리고 이런 기술적 진보의 혜택은 최종적으로 소비자에게 돌아갈 것입니다.
  • 15초 만에 체성분 측정… 내 몸 변화 추이 실시간 체크 ‘OK’

    15초 만에 체성분 측정… 내 몸 변화 추이 실시간 체크 ‘OK’

    오는 27일 정식 출시되는 삼성전자의 ‘갤럭시워치4 클래식’에서 눈여겨볼 부분은 크게 두 가지다. ‘체성분 측정’ 기능과 새로운 운영체제(OS)인 ‘웨어 OS’가 그것이다. 헬스장이나 병원에서나 가능했던 체성분 측정이 갤럭시워치 시리즈에 처음으로 장착됐다고 하니 안 써 볼 수가 없었다. 또한 여태까지는 갤럭시워치에 삼성전자가 자체 개발한 OS인 ‘타이젠’이 들어갔는데 갤럭시워치4에는 구글과 협력한 웨어 OS가 최초로 적용돼 얼마나 좋아졌는지 확인해 보고 싶은 마음이 있었다.갤럭시워치4 클래식을 며칠간 써 보니 체성분을 측정하는 것은 크게 어렵지 않았다. 시계 오른쪽에 있는 두 개의 버튼에 중지와 약지를 각각 갖다 대고 약 15초만 있으면 됐다. 측정이 끝나고 나서 갤럭시워치나 스마트폰 화면을 통해 골격근량과 체지방량, 체지방률, 체질량지수(BMI), 체수분, 기초대사량 등의 정보를 한눈에 볼 수 있었다. 평소 냉장고 인근에 가져다 놓은 체중계에 자주 올라갔었는데 이제는 체지방까지 자주 확인할 수 있으니 내 몸을 더 챙기는 기분이 들었다. 며칠간 측정한 체성분 결과가 스마트폰에 기록되기 때문에 내 몸의 변화 추이를 확인할 수 있다는 점도 편리했다. 웨어 OS가 장착되면서 갤럭시워치4 내부에 있는 구글플레이를 통해 앱을 내려받을 수 있다는 점도 큰 변화였다. 평소 스마트폰에서 사용하던 플랫폼인 ‘플로’를 설치해 보니 갤럭시워치에서도 음악을 선택해 들을 수 있었다. 미리 깔려 있는 구글 지도 앱을 쓰거나 구글플레이에서 다른 지도 앱을 내려받으면 걷다가 중간 중간 손목의 디스플레이를 확인해 가며 목적지에 찾아갈 수 있어 유용했다. 전작보다 중앙처리장치(CPU) 속도가 20% 향상되고, 램 용량도 50% 늘어난 덕에 갤럭시워치 내부에서 동작이 버벅거림 없이 부드러웠고 스마트폰과의 연동도 생각보다 재깍재깍 이뤄졌다. 시계를 차고 자면 수면 시간이 몇 시간이었는지, 그중에서도 얕은 수면이나 깊은 수면은 몇 시간 정도였는지, 수면 중 혈중 산소 농도는 어땠는지 등을 자세히 알려 준다는 점도 좋았다. 다만 갤럭시워치의 운영체제가 바뀌면서 이번 제품부터 애플 스마트폰 이용자들은 사용할 수 없다는 것에 유의해야 한다.
  • [리뷰]손목 시계에서 체성분 측정이 된다구?…‘갤럭시워치4 클래식’ 써보니

    [리뷰]손목 시계에서 체성분 측정이 된다구?…‘갤럭시워치4 클래식’ 써보니

    오는 27일 정식 출시되는 삼성전자의 ‘갤럭시워치4 클래식’에서 눈여겨볼 부분은 크게 두 가지다. ‘체성분 측정’ 기능과 새로운 운영체제(OS)인 ‘웨어 OS’가 그것이다. 헬스장이나 병원에서나 가능했던 체성분 측정이 갤럭시워치 시리즈에 처음으로 장착됐다고 하니 안 써 볼 수가 없었다. 또한 여태까지는 갤럭시워치에 삼성전자가 자체 개발한 OS인 ‘타이젠’이 들어갔는데 갤럭시워치4에는 구글과 협력한 웨어 OS가 최초로 적용돼 얼마나 좋아졌는지 확인해 보고 싶은 마음이 있었다. 갤럭시워치4 클래식을 며칠간 써 보니 체성분을 측정하는 것은 크게 어렵지 않았다. 시계 오른쪽에 있는 두 개의 버튼에 중지와 약지를 각각 갖다 대고 약 15초만 있으면 됐다. 측정이 끝나고 나서 갤럭시워치나 스마트폰 화면을 통해 골격근량과 체지방량, 체지방률, 체질량지수(BMI), 체수분, 기초대사량 등의 정보를 한눈에 볼 수 있었다. 평소 냉장고 인근에 가져다 놓은 체중계에 자주 올라갔었는데 이제는 체지방까지 자주 확인할 수 있으니 내 몸을 더 챙기는 기분이 들었다. 며칠간 측정한 체성분 결과가 스마트폰에 기록되기 때문에 내 몸의 변화 추이를 확인할 수 있다는 점도 편리했다.웨어 OS가 장착되면서 갤럭시워치4 내부에 있는 구글플레이를 통해 앱을 내려받을 수 있다는 점도 큰 변화였다. 평소 스마트폰에서 사용하던 플랫폼인 ‘플로’를 설치해 보니 갤럭시워치에서도 음악을 선택해 들을 수 있었다. 미리 깔려 있는 구글 지도 앱을 쓰거나 구글플레이에서 다른 지도 앱을 내려받으면 걷다가 중간 중간 손목의 디스플레이를 확인해 가며 목적지에 찾아갈 수 있어 유용했다.전작보다 중앙처리장치(CPU) 속도가 20% 향상되고, 램 용량도 50% 늘어난 덕에 갤럭시워치 내부에서 동작이 버벅거림 없이 부드러웠고 스마트폰과의 연동도 생각보다 재깍재깍 이뤄졌다. 시계를 차고 자면 수면 시간이 몇 시간이었는지, 그중에서도 얕은 수면이나 깊은 수면은 몇 시간 정도였는지, 수면 중 혈중 산소 농도는 어땠는지 등을 자세히 알려 준다는 점도 좋았다. 다만 갤럭시워치의 운영체제가 바뀌면서 이번 제품부터 애플 스마트폰 이용자들은 사용할 수 없다는 것에 유의해야 한다.
  • [고든 정의 TECH+] 엔비디아에 도전장 내민 인텔…GPU 시장 왕좌 빼앗을까?

    [고든 정의 TECH+] 엔비디아에 도전장 내민 인텔…GPU 시장 왕좌 빼앗을까?

    인텔이 인텔 아키텍처 데이 2021 행사를 통해 12세대 코어 프로세서인 엘더 레이크, 게이밍 GPU인 알케미스트, 그리고 고성능 연산용 GPU인 폰테 베키오의 아키텍처에 대한 상세한 정보를 공개했습니다. 흥미롭게도 이런저런 루머가 나돌았던 알케미스트(Xe-HPG, 고성능 게이밍)와 폰테 베이오(Xe-HPC, 고성능 연산)의 기본 구조는 엔비디아가 2018년 출시한 튜링 GPU의 모습과 약간 닮은 부분이 있습니다. 이번 공개 내용을 보면 과거 실행 유닛(EU)이라고 불린 그래픽 연산 유닛은 이제 벡터 엔진으로 이름이 바뀌었고 벡터 엔진 옆에는 인공지능 관련 연산을 담당하는 매트릭스 엔진(XMX)이 같은 숫자만큼 존재합니다. 그리고 여러 개의 벡터 엔진과 매트릭스 엔진 아래 하드웨어 레이 트레이싱(Ray Tracing)을 담당하는 부분이 있습니다. 그런데 엔비디아의 튜링 GPU 역시 그래픽 연산을 담당하는 쿠다(CUDA) 코어와 인공지능 연산을 담당하는 텐서 코어, 그리고 하드웨어 레이 트레이싱을 지원하는 RT 코어를 지니고 있습니다. 참고로 레이 트레이싱은 광원에서 나온 빛이 여러 사물의 표면에 반사되는 경로를 계산해 현실적인 빛의 효과를 그래픽에 추가하는 기술입니다.재미있는 사실은 현재 인텔의 GPU 개발을 담당한 라자 코두리가 2017년 AMD에서 인텔로 이적했다는 점입니다. 라자 코두리 수석 부사장은 본래 라데온 GPU를 개발하면서 엔비디아의 지포스에 맞섰던 사람입니다. 그런 그가 찾아낸 해법 역시 엔비디아와 비슷한 셈입니다. 물론 라데온의 길을 다시 걷기보다는 현재 업계 1위인 엔비디아를 타도하는 것이 옳은 전략이라는 점은 의심의 여지가 없습니다. 하지만 그렇다고 인텔이 무조건 엔비디아를 따라하기만 한 건 아닙니다. 인텔의 GPU 제조 방식은 엔비디아와 큰 차이가 있습니다. 바로 CPU를 개발하면서 축적한 다이 간 연결 기술인 포베로스(Foveros)와 EMIB(embedded multidie interconnect bridge)를 이용해 서로 다른 공정에서 만든 반도체 칩을 연결해 매우 큰 GPU를 만드는 방식입니다. 많게는 수백억 개의 트랜지스터를 집적한 최신 GPU는 한 번에 실수 없이 제조하기가 쉽지 않습니다. 특히 다이 사이즈가 커질수록 제조가 어려워집니다. A100처럼(TSMC 7nm 공정 사용) GPU 다이 크기가 826㎟이나 되고 트랜지스터 숫자도 542억 개나 되면 그렇지 않아도 비싼 웨이퍼에 수율도 좋지 않아 가격이 꽤 비싸 집니다. 인텔은 이 문제에 대한 해결책으로 여러 개의 작은 반도체 칩을 평면으로 연결하는 고속도로인 EMIB와 수직으로 연결하는 방식인 포베로스 기술을 개발했습니다. 이렇게 하면 반도체 패키징 과정이 매우 복잡해지는 문제가 있지만, 대신 꼭 최신 미세 공정을 적용하지 않아도 되는 부분은 더 저렴한 공정을 사용할 수 있고 한 번에 제조가 매우 어려운 초대형 프로세서도 만들 수 있습니다. 인텔이 공개한 폰테 베키오는 5개의 다른 공정으로 만든 47개의 반도체 조각인 액티브 타일(Active Tile)을 포베로스와 EMIB 기술로 연결해 무려 1000억 개 이상의 트랜지스터를 지닌 초대형 GPU입니다. 현재까지 상용화된 가장 복잡한 프로세서인 엔비디아의 A100보다 두 배의 트랜지스터 집적도를 지니고 있습니다. 연산 능력 역시 FP32 기준으로 45TFLOPS 이상으로 A100의 19.5TFLOPS의 두 배가 넘습니다. 오랜 세월 개발한 포베로스와 EMIB 기술이 이제 빛을 본 셈입니다.인텔은 이날 아키텍처 데이 행사에서 알케미스트 GPU의 연산 성능은 공개하지 않았으나 폰테 베키오의 연산 능력은 구체적으로 명시했는데, 슈퍼 컴퓨터/데이터 센터/인공 지능 연산을 위한 고성능 GPU 시장에서 엔비디아를 압박하겠다는 뜻으로 풀이됩니다. 코두리 수석 부사장은 회사를 옮겨도 주적은 엔비디아로 한결같다는 점이 재미있습니다. 이번 공개에서 마지막으로 주목할 점은 인텔이 TSMC의 최신 미세 공정인 6nm (N6), 5nm (N5) 공정을 사용하기로 한 것입니다. 알케미스트 GPU는 6nm 공정으로 제조되어 미세 공정에서 경쟁자보다 약간 우위에 섰고 폰테 베키오는 인텔 7 공정을 포함한 다양한 미세 공정을 사용하지만, 컴퓨트 타일은 5nm 공정을 사용해 역시 경쟁자보다 앞서고 있습니다. 최소한 미세 공정에서 밀리는 일은 없다는 이야기입니다. GPU 생산은 TSMC에 외주를 맞길 것이라는 점은 이미 알려진 내용이지만, 이번 발표를 보면 인텔이 얼마나 상대방을 이기고 싶어 했는지를 짐작할 수 있습니다. 인텔의 발표 내용을 신뢰한다면 폰테 베키오 GPU가 나오는 순간 엔비디아의 A100은 1위 자리를 내줘야 합니다. 물론 작년에 A100을 내놓은 엔비디아 역시 차세대 GPU를 개발 중이라 순순히 1위 자리를 내주지는 않을 것입니다. GPU 시장 진출을 선언한 인텔이 시작부터 엔비디아를 위협할지 아니면 엔비디아가 다시 1위 자리를 지킬 수 있을지 결과가 주목됩니다.    
  • [고든 정의 TECH+] 그래픽 카드 삼분천하?…출사표 던진 인텔 아크

    [고든 정의 TECH+] 그래픽 카드 삼분천하?…출사표 던진 인텔 아크

    현재 독립 그래픽 카드 시장은 엔비디아의 지포스 강세가 지속되는 가운데 AMD의 라데온이 만만치 않은 적수로 경쟁 구도를 유지하고 있습니다. 본래 90년대에는 수많은 그래픽 카드가 시장에서 경쟁하고 있었으나 엔비디아가 지포스 2 제품군을 내놓은 이후엔 사실상 천하 통일이 이뤄진 상태였습니다. 누구도 지포스의 권위에 도전하지 못할 것 같았던 2000년, ATI (나중에 AMD에 합병)는 라데온을 내놓으며 지포스의 시장 독점을 막고 그래픽 카드 양강 시대를 열었습니다. 그러나 라데온 등장 이후 20년 동안 그래픽 카드 시장에는 새로운 경쟁자가 없었습니다. 엔비디아와 AMD의 기술력이 월등한 데다 GPU의 구조가 갈수록 복잡해지면서 신생 업체가 끼어들기에는 진입 장벽이 너무 높았던 것입니다. 인텔이 잠재적인 경쟁자로 지목되기는 했으나 라라비로 알려진 그래픽 카드 프로젝트가 결국 고성능 연산용 프로세서 개발로 방향을 틀면서 인텔의 그래픽 카드 시장 진출은 무산되는 듯 보였습니다. 그래픽 카드 프로세서인 GPU는 CPU보다 훨씬 거대해 제조 비용은 많이 들면서 상대적으로 경쟁이 치열해 CPU처럼 높은 마진율을 보장할 수 없습니다. 당시 인텔 입장에서 굳이 무리수를 두면서까지 그래픽 카드 시장에 진입할 동기는 부족했습니다. 그러나 지난 몇 년간 GPU는 인공지능 연산 및 고성능 연산 부분에서 수요가 폭발해 CPU만큼이나 중요한 위치를 차지하게 됐습니다. 인텔도 GPU 시장을 포기할 수 없게 된 것입니다. 따라서 인텔은 AMD 라데온의 수장인 라자 코두리를 영입하고 GPU 시장에 다시 진입하겠다고 발표합니다. 그리고 이제 하나씩 그 결과물들을 공개하고 있습니다. 인텔은 올해 보급형 그래픽 카드인 DG1을 출시했고 내년 1분기에는 게이밍 그래픽 카드인 DG2를 출시할 계획이었습니다. DG2 혹은 Xe-HPG라고 알려진 인텔의 고성능 GPU에 대해서는 성능과 스펙 등 구체적인 정보가 거의 공개되지 않았지만, 인텔은 조금씩 내용을 공식 혹은 비공식 채널을 통해 흘리고 있습니다. 우선 인텔 게이밍 GPU의 브랜드는 아크 (Arc)로 정해졌습니다. DG (discrete graphic, 개별 그래픽)보다 훨씬 강한 이미지를 주는 명칭인데, 인텔은 아크 GPU의 세대별 명칭까지 알파벳 순으로 정해놨습니다. 현재 엔지니어링 샘플이 나와 있는 1세대는 알케미스트 (Alchemist)라고 명명했고 그다음으로 배틀메이지 (Battlemage), 셀레스티얼 (Celestial), 드루이드 (Druid)가 출시될 예정입니다. (구체적인 시기는 미정)1세대 알케미스트 GPU에 대한 내용은 거의 공개된 것이 없지만, 라자 코두리 인텔 수석부사장은 DG2 512라고 적힌 프로세서의 사진을 몇 주 전 자신의 트위터에 공개했습니다. (사진) 이 사진에 대한 가장 가능성 높은 해석은 512개의 실행 유닛 (EU)를 지닌 GPU라는 것입니다. 보급형 그래픽 카드인 DG1의 실행 유닛은 80-96개로 대락 2TFLOPS 급 연산 능력을 지니고 있습니다. 따라서 알케미스트 GPU는 10TFLOPS 이상의 연산 능력을 지닐 것으로 추정해 볼 수 있습니다. 그렇다면 엔비디아와 AMD의 메인스트림급 GPU와 경쟁이 가능한 수준입니다. 인텔이 공개한 또 다른 정보에 의하면 알케미스트 GPU는 지포스의 DLSS (Deep Learning Super Sampling)나 라데온의 피델리티FX 초해상도 (FidelityFX Super Resolution (FSR))처럼 인공지능 기반의 이미지 품질 향상 옵션을 제공합니다. 지포스 GPU처럼 독립적인 AI 가속 연산 유닛을 지녔는지는 공개하지 않았지만, 그럴 가능성은 열어둔 셈입니다. 알케미스트에 대한 구체적인 정보는 출시 시점인 2022년 1분기가 가까워질수록 더 많은 내용이 공개될 것입니다. 현재 그래픽 카드 시장은 암호 화폐 채굴 수요 덕분에 가격이 고공행진을 계속하고 있습니다. 최근 가격이 다소 안정화됐지만, 여전히 그래픽 카드 가격은 비싼 편입니다. 이럴 때 인텔이 우수한 성능의 게이밍 그래픽 카드를 내놓는다면 의외의 성공을 거둘 수도 있습니다. 일단 시장에 안착하면 인텔은 계속해서 신제품을 내놓으면서 시장에서 입지를 다지려 할 것입니다. 인텔의 GPU 천하 삼분지계가 실제로 통할지는 두고 봐야 알겠지만, 소비자 입장에서는 전혀 나쁠 게 없는 소식입니다. 새로운 공급자가 생기면 가격은 낮아지는 게 일반적인 결과이기 때문입니다. 라자 코두리를 비롯해서 업계에서 잔뼈가 굵은 인재들을 영입한 만큼 과거 인텔이 선보인 내장 그래픽과는 비교할 수 없을 만큼 뛰어난 GPU가 나올 것이라는 기대도 있습니다. 과연 시장의 기대를 충족시킬 수 있을지 결과가 주목됩니다.
  • 셋톱박스와 사운드바를 합쳤다…“月2200원에 거실이 영화관으로”

    셋톱박스와 사운드바를 합쳤다…“月2200원에 거실이 영화관으로”

    LG유플러스가 유료방송 셋톱박스에 사운드바 기능을 합친 신제품을 내놨다. 코로나19의 장기화로 큰 TV를 마련해 집에서 영화를 즐기는 이들이 늘어났단 점을 겨냥했다. LG유플러스 측에서는 월 2200원만 더 지불하면 시중의 70만원대 제품보다 좋은 음향을 즐길 수 있다며 자신감을 표출했다. LG유플러스는 12일 온라인 기자간담회를 통해 셋톱박스 신제품인 ‘U+tv 사운드바 블랙’의 출시를 알렸다. 글로벌 영상·음향기업 돌비 래버러토리스의 ‘돌비 비전’과 ‘돌비 애트모스’ 등 최신 기술을 세계 최초로 유료방송 셋톱박스에 적용한 사례라고 LG유플러스는 설명했다. 유료방송 서비스인 ‘U+tv’ 가입자는 3년 약정 기준으로 세금 포함 월 6600원에 사운드바 블랙을 이용할 수 있다. 일반 셋톱박스보다 월 2200원을 더 내면 되는 것이다. 사운드바 블랙은 기기의 전방에서 소리가 출력되지만 청자에게는 음향이 여러 방향으로 도달하도록 설정됐다. 소리가 나가는 방향과 반사되는 지점 등을 모두 고려해 듣는 이 주변을 입체 사운드로 가득 채우는 애트모스 기술 덕분이다. 돌비 애트모스는 바로 앞에서 출입문을 여는 소리와 먼 곳의 자동차 경적도 구분해 들려준다. 대화와 배경음 데시벨의 균형을 잡아줘 이용자가 대사를 놓치지 않고 몰입도 있게 영화나 드라마를 즐길 수 있게도 해준다. 또한 셋톱박스 중앙처리장치(CPU)의 성능은 기존 제품의 2배 이상 향상돼 버벅거림 없이 다양한 작업을 수행할 수 있을 것으로 보인다.최창국 LG유플러스 홈·미디어사업그룹장(상무)은 “출시하기 전에 블라인드 테스트를 진행했다”며 “지금 시장에 실제 판매되고 있는 오디오 전문 회사의 약 70만원 이상 되는 사운드바와 블라인드 테스트를 했는데 참여자들이 저희 사운드바가 오히려 낫다고 했다”고 밝혔다. 사운드바 블랙을 내놓은 것은 최근 유료방송 이용자들의 소비 행태가 완전히 달라졌다고 판단했기 때문이다. LG유플러스의 조사에 따르면 코로나19 시대에 가장 늘어난 소비 활동은 ‘비디오 콘텐츠 시청’이었다. 사회적 거리두기 이전 대비 45% 증가한 것으로 나타났다. 같은 기간 영화관을 중심으로 한 문화활동은 66% 감소했다. 또한 75인치 이상 프리미엄 TV 구매도 지난해 158% 성장하면서 큰 화면으로 영화나 드라마를 즐기고 있는 수요가 늘어났단 것을 보여줬다. 시장조사업체 퓨처소스의 자료에서도 2019년 1878만대 수준이던 글로벌 사운드바 출하량은 지난해 7% 늘어난 2013만대를 기록했다고 나타났다. 최 상무는 “비대면 시대에 들어서면서 고객들의 평균 TV 시청시간이 21% 이상 늘었다”면서 “출범 13년을 맞은 IPTV(인터넷TV) 서비스가 ‘넥스트 레벨’을 제시해야하는 중요한 시점이 도래한 셈”이라고 말했다.
  • “TSMC, 삼성 제치고 내년 7월 세계 첫 3나노 반도체 양산”

    “TSMC, 삼성 제치고 내년 7월 세계 첫 3나노 반도체 양산”

    세계 최대 파운드리(반도체 위탁생산) 업체인 대만의 TSMC가 기존 예상보다 1년 빠른 내년 여름에 삼성전자를 제치고 세계 최초로 3㎚(나노미터·1㎚=10억분의 1m) 반도체 양산에 들어간다고 대만 연합보가 10일 현지 공급망 소식통을 인용해 보도했다. 보도에 따르면 TSMC는 인텔의 주문을 받아 3㎚ 공정이 적용된 서버용 중앙처리장치(CPU)와 그래픽처리장치(GPU) 생산을 준비 중이다. 내년 2월부터 대만에서 3㎚ 공정 생산라인을 가동해 7월부터 인텔이 주문한 CPU와 GPU를 양산할 계획이라는 것이다. 계획이 차질없이 진행되면 TSMC는 파운드리 경쟁사인 삼성전자를 제치고 세계 최초로 현존 최고의 초미세공정에 해당하는 3㎚ 반도체 제품을 양산하는 기업이 된다. 이는 기존 시장의 예측을 1년 이상 앞당긴 것이라고 연합보는 설명했다. 현재 TSMC와 삼성전자는 모두 5㎚ 공정이 적용된 시스템 반도체 제품을 양산 중인 가운데 차세대 미세공정 기술 연구·개발 경쟁도 치열하다. 연합보는 이번 주문 계약에 대해 “인텔이 3㎚ 공정 기술에서 TSMC가 삼성보다 앞선다는 점을 인정한 것으로서 (TSMC의) 선도 지위를 더욱 강화하게 될 것”이라고 의미를 부여했다. 또 TSMC가 내년 6월부터는 애플의 주문을 받아 3㎚ 애플리케이션 프로세서(AP)를 주문받아 생산하게 될 것으로 내다보면서 현지 협력업체들은 내년 하반기 TSMC의 3㎚ 공정 반도체 생산량 증가 속도가 상당히 빨라질 것으로 내다보고 있다고 전했다.
위로