찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 집적도
    2026-06-22
    검색기록 지우기
  • 전 연인
    2026-06-22
    검색기록 지우기
  • 60년
    2026-06-22
    검색기록 지우기
  • 2026-06-22
    검색기록 지우기
  • 2026-06-22
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
208
  • [고든 정의 TECH] 2025년까지 2nm 공정...TSMC 새 로드맵 발표

    [고든 정의 TECH] 2025년까지 2nm 공정...TSMC 새 로드맵 발표

    현재 파운드리 반도체 업계는 점유율이 50%가 넘는 TSMC와 이를 맹추격하는 삼성, 그리고 이 시장에 새롭게 뛰어들어 업계를 재편하려는 인텔의 공격적 투자로 치열한 경쟁이 치열한 상태입니다. 하지만 거대 반도체 제조사들의 불꽃 튀는 경쟁과는 별개로 실제 미세 공전의 진행 속도는 점차 느려지고 있습니다. 이미 회로의 미세화가 너무 진행되어 더 작게 만들기가 어려워졌기 때문입니다. 현재 N4 (4nm) 공정까지 양산에 성공한 TSMC 역시 예외는 아니라서 이미 엄청나게 작은 나노미터급 회로를 더 작게 만들기 위해 고군분투하고 있습니다. 최근 더 자세한 내용을 공개한 로드맵에는 이런 고뇌가 그대로 드러나 있습니다.  TSMC의 4nm 공정은 5nm 공정의 개선판으로 사실 로직 밀도의 변화는 거의 없고 성능을 높인 공정입니다. 그러나 올해 하반기 양산에 들어가는 3nm (N3)는 로직 밀도(logic density, 단위 면적당 넣을 수 있는 회로의 밀도)가 1.7배 정도 늘어나 같은 크기라도 최대 1.7배 더 많은 트랜지스터를 집적한 프로세서를 만들 수 있습니다. 이미 100억 개를 훌쩍 뛰어넘은 고성능 스마트폰 어플리케이션 프로세서(AP)는 앞으로 200억 개 이상으로 트랜지스터 집적도가 올라갈 수 있을 것으로 보입니다.  하지만 N3 공정 이후 차세대 공정인 N2 (2nm)으로의 이전에는 상당한 시간이 걸릴 예정입니다. 따라서 2023년에 나오는 것은 N3 공정의 개량형인 N3E 공정입니다. N3E는 로직 밀도는 약간 줄어들지만, 대신 N3 보다 성능이 약간 더 올라갑니다. N3는 N5와 비교해서 같은 성능에서 25-30% 전력 소비가 감소하거나 혹은 같은 전력 소모에서 성능이 10-15% 높아집니다. N3E는 N5와 비교해 전력 소비를 최대 34% 줄이거나 성능을 최대 18%로 높인 버전으로 실제적으로는 큰 차이가 없을 것으로 예상됩니다.  2024년에 등장할 N3 계열 반도체 제조 공정 역시 상황은 비슷합니다. N3P는 성능 (Performance)에 초점을 맞춘 공정이고 N3X는 전력 소모와 상관없이 극한의 성능 (eXtreme)을 요구하는 고객을 위한 공정입니다. N3S는 성능보다 밀도에 더 중점을 둔 공정으로 개발되고 있습니다. TSMC는 아예 고객들이 반도체의 FinFET 디자인을 고를 수 있는 핀플렉스(FinFlex)라는 새로운 서비스도 도입할 계획입니다. 하나의 공정으로 이렇게 다양한 제품군을 만든다는 이야기는 뒤집어 말해 N2 공정으로 이전이 어렵다는 이야기입니다. 물론 N4도 마찬가지 상황이라 여러 제품군이 나오게 됩니다. N2 공정은 성능이나 로직 밀도에서 큰 개선이 있는 것은 아니지만, 반도체 제조 공정 면에서는 상당한 변화가 있습니다. 트랜지스터가 작아질수록 누설 전류가 문제되는 데, 반도체 제조사들은 FinFET 방식으로 이 문제를 극복했습니다. 하지만 이제 이것도 한계에 이르러 게이트 올 어라운드 (GAA)이라는 방식을 도입하고 있습니다.  TSMC의 나노시트 (Nanosheet) 기술을 적용한 GAAFET을 N2 공정부터 도입할 계획입니다. 신기술을 처음으로 도입하는 만큼 밀도나 성능 향상보다는 보수적인 접근법을 선택한 것으로 보입니다. N2의 목표는 N3E와 비교해 로직 밀도 1.1배 이상, 성능 10-15% 이상, 전력 소모 25-30% 이상 감소입니다. 실제 양산에 들어가는 것은 2025년 하반기 이후입니다. N2 역시 여러 파생 공정이 나올 것으로 예상됩니다.  최근 반도체 제조사들은 미세 공정만으로 더 많은 트랜지스터를 담기 어려워지면서 여러 개의 칩을 하나의 큰 칩처럼 묶는 칩렛 디자인과 3D 패키징 기술을 도입하고 있습니다. TSMC 역시 고객들에게 다양한 3D 패키징 기술을 제공하고 있는데, AMD의 3D V 캐시가 대표적인 사례입니다. TSMC는 이렇게 여러 가지 방법을 동원해 파운드리 선두 자리를 지키기 위해 노력하고 있지만, 이런 접근법과 기술력은 경쟁자들도 크게 다르지 않습니다. 삼성전자나 인텔 모두 만만치 않은 회사들이라 TSMC가 미래에도 지금의 점유율을 지킬 수 있을지는 두고 봐야 알 수 있습니다.
  • “대출규제 완화하면 서울 아파트값 오르고, 지방은 하락”

    “대출규제 완화하면 서울 아파트값 오르고, 지방은 하락”

    주택담보대출비율(LTV) 상향 등 대출규제를 완화하면 서울의 아파트 가격이 오르고, 지방의 아파트 가격은 하락한다는 분석이 나왔다. 한국은행이 23일 발표한 ‘자산으로 우리나라 주택시장 특징 및 시사점’ 보고서에 따르면 주택공급 증가는 주택 자산가치를 하락시키지만, 대출규제 완화는 서울 아파트 구입을 위한 차입여건 개선으로 이어져 가격을 상승시키는 요인이 되는 것으로 분석됐다. 보고서는 우리나라 주택에 대해 다른 국가와 비교해 상대적으로 변동성은 낮고, 가격 상승률은 높다고 봤다. 또 아파트 비중이 커 주택시장의 동질성이 높은 편이라 매매가 쉽다고 분석했다. 우리나라 주택의 가격이 높은 이유로는 높은 도시화와 집적도, 시세차익에 대한 기대, 인구 1000명당 주택 수 등 주택재고 수준이 낮은 점, 표준화 정도가 높고 거래가 많은 아파트의 특징 등이 작용한다고 봤다. 이러한 주택의 특징을 감안했을 때 LTV 상향 등 대출규제를 완화하면 서울 지역 아파트의 자산가치는 일정기간 오르지만, 지방 아파트의 자산가치는 하락하는 것으로 분석됐다. 보고서는 주택시장 안정을 위해서는 일관된 주택공급 정책이 필요하다고 봤다. 주택공급을 늘리면 자산가치는 지역이나 유형에 관계없이 하락하는 것으로 나타났다. 보고서는 “금리나 대출규제와 같은 수요를 관리하는 정책은 지역에 따라 효과가 다르게 나타난다”며 “공급정책의 효과는 상대적으로 뚜렷하고, 공급이 확대돼 주택이 자산보다 내구재(주거서비스)로서 중요도가 높아지고 선호지역이 다양화되면 주택의 자산가치 안정에 기여할 가능성이 크다”고 설명했다. 이어 “수요자와의 소통을 강화해 공급 계획을 시기, 지역, 주택유형별로 이해하기 쉽게 공표하고, 장기적으로는 소비자의 선호, 수요 등 여건 변화에 따라 공급계획의 변동과 그 원인을 상세히 알리는 것도 정책의 신뢰성을 높이는 데 기여할 것”이라고 강조했다.
  • [고든 정의 TECH+] 슈퍼 컴퓨터 시장을 향한 인텔의 복안…CPU와 GPU를 하나로!

    [고든 정의 TECH+] 슈퍼 컴퓨터 시장을 향한 인텔의 복안…CPU와 GPU를 하나로!

    지난 몇 년간 인텔은 AMD의 거센 추격과 ARM 기반 서버 칩의 등장, 인공지능 시장에서 엔비디아의 독주로 인해 업계 1위의 위상이 흔들렸습니다. 이 위기를 극복하기 위해 1년 전 취임한 팻 겔싱어 인텔 CEO는 여러 가지 미래 전략과 로드맵을 발표했습니다. 그중 하나는 거대한 반도체 칩을 한 번에 제조하는 대신 여러 개의 칩을 고속 인터페이스로 연결해 하나의 큰 반도체 칩처럼 만드는 기술입니다.  작년에 세부 내용을 공개한 인텔의 사파이어 래피즈(Sapphire Rapids) 제온 스케일러블 CPU는 최대 400㎟ 크기의 다이 4개를 인텔의 고속 인터페이스인 EBIM로 연결하고 여기에 추가로 초고속 메모리인 HBM2E 메모리까지 하나의 패키지에 넣을 수 있습니다. 차세대 GPU인 폰테 베키오 (Xe HPC)는 무려 47개의 타일을 하나로 묶어 트랜지스터 집적도를 1000억개까지 끌어올렸습니다.  한 번에 너무 큰 칩을 제조할 경우 수율이 급격히 낮아지는데다 첨단 미세 공정으로 갈수록 가격이 매우 높아지기 때문에 이렇게 여러 개의 칩을 하나로 묶는 기술이 업계의 새로운 트랜드가 되고 있습니다. 또 반드시 최신 미세 공정을 사용하지 않아도 되는 부분은 구형 공정을 이용해 가격도 절감할 수 있다는 점이 큰 장점입니다.  그런데 CPU나 GPU 모두 여러 개의 타일을 묶어서 만든다면 CPU + GPU 프로세서 역시 제조가 쉬워집니다. 인텔이 새로 공개한 팔콘 쇼어스 (Falcon Shores) XPU는 이런 맥락에서 당연히 등장할 수밖에 없는 제품이라고 할 수 있습니다.  팔콘 쇼어스는 인텔의 x86 CPU와 Xe GPU를 하나로 합친 고성능 및 슈퍼컴퓨팅 프로세서입니다. 물론 현재 판매 중인 인텔 12세대 코어 프로세서 (앨더 레이크) 역시 대부분 내장 GPU를 지니고 있기 때문에 x86 CPU와 Xe GPU의 통합 구조라고 할 수 있으나 팔콘 쇼어스는 서버 및 슈퍼 컴퓨팅 부분에서 처음 도입하는 CPU/GPU 통합 프로세서라는 차이점이 있습니다.  그래 봐야 제온 스케일러블 CPU와 Xe HPC GPU를 하나로 통합한 것에 지나지 않느냐고 반문할 수 있지만, 사실 이 통합이 핵심입니다. 고성능 서버 CPU와 고성능 연산용 GPU는 막대한 양의 데이터를 서로 주고받기 때문에 데이터 및 메모리 병목 현상이 발생하기 쉽습니다.이를 극복할 수 있는 대안 중 하나는 아예 하나의 패키지 안에 CPU, GPU, 메모리를 통합하는 것입니다. 인텔은 팔콘 쇼어스를 통해 전력 대비 성능과 메모리 대역폭을 5배 이상 끌어올릴 수 있다고 보고 있습니다. 물론 이 제품은 목적상 고성능 슈퍼컴퓨팅 및 인공지능 연산용으로 기존의 제온 서버 프로세서를 대체하는 것은 아닙니다.  서버급 CPU와 GPU를 통합하면서 기대할 수 있는 두 번째 이점은 공간 절약입니다. 거대한 서버 CPU와 제법 큰 공간을 차지하는 GPU를 서버용 메인보드에 여러 개 끼워 넣으면 당연히 서버의 부피는 커질 수밖에 없습니다. 아예 메모리까지 하나로 통합한 팔콘 쇼어스 XPU는 기존의 전통적인 CPU + GPU 서버 보다 5배 정도 시스템 밀도를 높일 수 있습니다. 데이터 센터의 크기가 자꾸만 커지는 상황에서 크기가 작은 서버의 등장은 반가운 일입니다. 결국 비용 절감으로 이어지기 때문입니다.  하지만 팔콘 쇼어스는 올해가 아닌 2024년 이후 등장할 예정입니다. 인텔은 최신 20A 이후 공정을 팔콘 쇼어스에 도입할 계획입니다. 인텔은 서버 CPU에서 AMD에 시장을 내주고 있고 엔비디아가 장악한 고성능 GPU 시장에는 진입조차 못하고 있습니다. 다만 전례 없는 수준의 연구와 투자를 병행하고 의욕적인 제품 로드맵을 공개하고 있어 몇 년 후에는 업계 판도가 바뀔 수도 있는 상황입니다. 과연 인텔의 변신이 성공할지 미래가 궁금합니다. 
  • 한화솔루션, 삼성전기 통신모듈 일부 사업 인수

    한화솔루션, 삼성전기 통신모듈 일부 사업 인수

    한화솔루션이 삼성전기의 통신모듈 일부 사업을 인수하면서 와이파이(WIFI)와 5G 밀리미터웨이브 유기기판 안테나 모듈 시장에 진출한다. 전자사업 다각화를 위해서다. 앞으로 대용량 데이터를 실시간으로 전송하는 전자제품과 자동차 전자장치(전장) 등 수요 증가에 따른 반도체모듈 사업에도 뛰어들겠단 계획이다. 한화솔루션과 삼성전기는 30일 인수 계약 체결을 마치고 내년 3월 말까지 최종 절차를 마무리할 예정이라고 밝혔다. 와이파이 모듈은 스마트폰 등 IT기기 간의 통신에 사용되는 부품이다. 5G 밀리미터웨이브 안테나 모듈은 통신 기지국과 데이터를 초고속으로 주고받을 때 쓰인다. 삼성전기는 와이파이 모듈 설계 및 고집적도 패키징과 테스트에 대한 글로벌 역량을 갖추고 있다. 글로벌 세트업체와의 오랜 협업을 기반으로 설계에서 제조까지의 솔루션을 보유하고 있다. 한화솔루션은 기존 스마트폰에 통신모듈을 공급하는 것을 넘어 모듈 기술을 활용해 빠르게 성장하는 무선이어폰, 가상현실(VR)과 증강현실(AR) 기기 시장에도 진출할 계획이다. 특히 통신기능이 탑재된 TV, 스피커 등 각종 전자기기를 연결하는 사물인터넷(IoT) 시장과 인포테인먼트, 첨단운전자보조장치(ADAS), 차량 통신 및 원격 업데이트 등이 필요한 자동차 전장 분야에서 통신 모듈의 수요가 폭발적으로 늘어날 것으로 기대하고 있다. 장세영 한화솔루션 부사장은 “삼성전기의 통신 모듈 설계·제조 역량과 한화의 글로벌 네트워크를 결합해 시너지를 낼 것”이라며 “당사의 전자 사업에 미래 성장성이 높은 반도체 모듈 사업을 추가한 것으로 차별화 사업 아이템과 고급인력 확충으로 지속적인 성장을 추구하겠다”고 말했다.
  • [고든 정의 TECH+] 애플 아이폰13을 이해하는 열쇠…A15 바이오닉의 비밀

    [고든 정의 TECH+] 애플 아이폰13을 이해하는 열쇠…A15 바이오닉의 비밀

    올해 가을에도 변함없이 새 아이폰은 화제의 중심에 서 있습니다. 몇 세대 동안 크게 변하지 않은 외형과 기능 때문에 혁신이 없다고 말하는 이들도 있지만, 애플은 이번에도 여러 가지 신기술을 담았다고 주장했습니다. 아이폰13에서 특별히 강조한 부분은 영상입니다. 사람을 강조하는 인물사진 모드처럼 새로 추가된 시네마틱 모드는 초점을 바꿔가며 영화처럼 영상을 촬영할 수 있습니다. 더 커진 이미지 센서와 A15 바이오닉 칩 덕분에 아이폰13 사용자들은 이전 세대보다 더 뛰어난 사진과 영상을 얻을 수 있습니다. 물론 최신 스마트폰 가운데 아이폰 카메라만 좋아지는 건 아니지만, 애플은 시네마틱 모드가 남다른 사용자 경험을 줄 것이라고 자신하고 있습니다. 하지만 애플이 강조하고자 했던 장점 외에 말하고 싶지 않은 단점도 눈에 보입니다. 바로 A15 바이오닉 칩입니다. 애플은 A15 바이오닉에 대해서 매우 제한적인 정보만 제공했지만, 트랜지스터 집적도가 150억 개에 이른다는 점 하나만으로도 최첨단 반도체 기술의 성취를 보여줬다고 해도 과언이 아닙니다. 목적이 다른 만큼 1:1 비교는 불가능하지만, 다른 프로세서와 비교해보면 얼마나 놀라운 숫자인지 알 수 있습니다. 예를 들어 CPU 프로세서 중 8코어 1세대 라이젠 프로세서의 경우 트랜지스터 숫자가 48억 개 정도였습니다. 그리고 16코어 라이젠 3세대 프로세서의 경우 100억 개 정도로 알려져 있습니다. 최근 공개한 IBM의 서버 프로세서인 Power10의 경우 180억 개, 애플의 전작인 A14 바이오닉이 118억 개, 애플 M1 프로세서가 160억 개 정도입니다. A15 바이오닉의 150억 개는 5nm 공정으로는 스마트폰 AP에 구현 가능한 최대치라고 봐도 무방한 수준입니다. 하지만 트랜지스터 숫자 증가와 달리 성능 향상 폭은 크지 않습니다. 이번 발표에서 가장 재미있는 부분은 과거처럼 전 세대 제품이 아니라 경쟁사 대비 CPU가 최대 30%, GPU가 최대 50% 빠르다고 한 점입니다. 그런데 사실 전 세대인 A14 바이오닉도 스냅드래곤 888보다 더 빨랐습니다. 자세한 수치는 벤치마크 결과가 나와봐야 알겠지만, 이 이야기를 종합할 때 A15와 A14의 CPU/GPU 성능 차이는 크지 않은 것을 알 수 있습니다. A14 바이오닉 벤치마크 결과를 참고하면 경쟁사 대비 CPU가 30% 빠르다는 것은 A15 바이오닉의 성능 향상 폭이 10% 이내라는 점을 시사합니다. GPU 역시 5코어 기준으로 경쟁사 대비 50%가 빠르다는 것은 A14 바이오닉보다 30% 이상 빠르지 않다는 이야기로 4코어 기준으로는 A14와 A15의 성능 차이가 별로 크지 않을 것으로 추정할 수 있습니다. A13 바이오닉 때처럼 20%만 빨랐어도 굳이 설명을 빼놓지 않았을 가능성이 높습니다.애플이 자신 있게 밝힌 부분은 16코어 뉴럴 엔진의 성능입니다. 전작의 11TOPs에서 15.8TOPs로 44% 정도 빨라졌습니다. 덕분에 이미지의 인공지능 처리도 빨라져 4K 영상도 다양한 효과를 추가할 수 있게 된 것으로 보입니다. 디스플레이 엔진과, 비디오 인코더/디코더 역시 성능이 향상되어 120Hz 디스플레이와 4K HDR 60프레임 영상처리가 더 부드러워졌습니다. 물론 애플이 밝힌 것처럼 아직 경쟁자가 A14 바이오닉을 따라잡지도 못한 상태에서 이보다 더 성능이 좋은 A15 바이오닉을 탑재했으니 역대 최강 성능이라는 점은 의심할 필요가 없습니다. 다만 32억 개나 늘어난 트랜지스터가 어디로 갔는지는 궁금해지는 부분입니다. 아마도 그 대답은 44% 정도 좋아진 AI 처리 성능과 디스플레이, 영상, 이미지 처리 능력에 있을 것입니다. 그리고 더 많은 데이터를 빠르게 처리하기 위해 프로세서에 탑재한 캐시 메모리인 시스템 캐시 메모리가 2배(아마도 32MB)로 늘어난 것도 트랜지스터 증가에 크게 기여한 것으로 보입니다.따라서 애플이 A15 바이오닉에서 추구한 목표는 이미 업계 최고인 CPU/GPU 성능보다 사진, 영상, 디스플레이 처리 능력 개선이라고 할 수 있습니다. 스티브 잡스 시절부터 하드웨어 스펙보다 사용자 경험을 더 중시하는 애플의 철학이 반영된 디자인임과 동시에 최근 프로세서 성능을 과거처럼 빠르게 높이기 힘들어진 업계의 사정을 반영한 결과입니다. 사실 CPU 업계의 경우 이미 한 세대 당 성능 향상 폭이 10% 이내인 경우가 비일비재합니다. 프로세서 클럭은 5GHz 선에서 이제 더 높이기 힘들어진 상황이고 코어 숫자를 늘리는 것 역시 공정 미세화가 점점 어려워지면서 벽에 부딪히고 있습니다. 아키텍처를 개선해 성능을 높이는 건 10-20% 정도면 최선을 다한 결과이고 그나마 같은 공정에서는 전력 소모도 함께 늘어납니다. GPU 업계는 이보다 사정이 낫긴 하지만, 과거처럼 빠르게 성능을 높이기 힘들어진 사정은 비슷합니다. 따라서 인공지능을 이용한 이미지 품질 향상이나 실시간 레이트레이싱 지원 같은 새로운 기능을 추가해 사용자들이 체감할 수 있는 변화를 끌어내고 있습니다. 애플의 시네마틱 모드 같은 새로운 기능 추가도 비슷한 관점에서 볼 수 있습니다. 그렇다고 해서 이제 프로세서 성능 향상이 멈췄다는 이야기가 아닙니다. 과거처럼 1년 만에 50%, 100% 성능이 높아지긴 어렵다는 이야기입니다. 사실 매년 10%만 높아져도 몇 세대가 지나면 복리처럼 누적되어 상당히 큰 변화가 나타나게 됩니다. 데스크톱처럼 모바일 CPU와 GPU의 성능 역시 그렇게 진보할 것입니다. 다만 이미 CPU나 GPU 성능이 이미 상당히 높아져 10-20%로는 체감할 수 있는 변화를 주기 힘들어진 상황에서 사용자 경험에 집중하는 애플의 전략은 매우 타당해 보입니다.
  • 이재명 굳히기 vs 이낙연 뒤집기… 첫 경선지 ‘충청 필승’ 총력

    이재명 굳히기 vs 이낙연 뒤집기… 첫 경선지 ‘충청 필승’ 총력

    수도권·호남 제외하면 권리당원 비율 최고충청 지지율 이재명 20%대·이낙연 10%대양측 캠프 충청의원 영입… 주말 표심잡기더불어민주당 대선 경선이 31일 대전·충남 권리당원 온라인투표를 시작으로 최종 후보 선출(10월 10일)을 향한 ‘5주 대장정’에 돌입한다. 충청권에서 ‘과반 대세’를 굳혀 결선 투표 없이 1차 투표에서 끝내려는 이재명 경기지사, 역전 가능성을 증명해 결선 투표 뒤집기를 노리는 이낙연 전 대표 모두 사활을 걸었다.지역 순회 경선 결과는 4일 대전·충남, 5일 세종·충북에서 처음 공개된다. 순회 경선지마다 발표되는 대의원·권리당원 투표 결과에 다음달 8~12일 실시하는 1차 선거인단(국민·일반당원) 투표를 합산해 12일 1차 슈퍼위크 결과를 발표한다. 초반 판세가 지지층 결집을 좌우하는 것은 물론 부동층 선택에 ‘바람’으로 작용하는 터라 각 후보 모두 충청을 필승 지역으로 꼽는다. 수도권·호남을 제외하고 민주당 권리당원 비율(10%)이 가장 높다는 점도 충청을 뺏길 수 없는 이유로 꼽힌다. 민주당 본경선 돌입 후 지난 한 달간 시행한 여론조사에서 이 지사는 20%대, 이 전 대표는 10%대 충청권 지지율을 유지하고 있다. 대의원·권리당원 여론과 가까운 ‘민주당 지지층’ 대상 최근 충청권 조사(리얼미터, 23~24일, 전국 2015명, 표본오차는 95% 신뢰 수준에 ±2.2% 포인트. 중앙선거여론조사심의위 참조)에서는 이 지사 25.5%, 이 전 대표 23.1%로 예측 불허였다.현장에서 뛰는 캠프 관계자와 중립지대 의원들의 전망을 종합하면 충남에서는 이 지사 우위, 충북에서는 이 전 대표 지지세가 만만치 않다는 분석이다. 이 지사 캠프 핵심 관계자는 29일 “충남의 압도적 지지와 비교하면 충북이 다소 약하다는 상대평가이지 대세론을 굳히는 데 문제없다”고 자신했다. 이 지사 캠프는 5선 변재일(충북 청주청원) 의원의 합류 후 바닥 민심 훑기에 총력전을 벌이는 태세다. 충북 지역 현역 의원 8명 중 5명이 캠프에 합류한 이 전 대표 측도 승리를 자신했다. 이 전 대표 캠프 관계자는 “권리당원과 선거인단 모집은 현역 의원 영향력이 절대적”이라며 “충청에서 6대4로 이 지사에 앞설 것”이라고 전망했다. 이런 가운데 이 지사는 지난 28일 대전 대덕연구단지, 충남 홍성과 천안 방문을 시작으로 이날 충북 청주와 오송을 찾는 강행군을 이어 갔다. 청주에서는 “과학기술·바이오·이차전지·디스플레이로 이어지는 충청권 첨단산업 벨트를 조성하겠다”고 공약했다. 이 전 대표도 나흘째 충청에 머무르며 중부 3군 핵심당원 간담회, 충남 금산 수해 피해 주민 간담회 등을 소화했다. 이 전 대표는 지난 28일 아프가니스탄 조력자를 품은 진천 주민들에게 직접 감사를 전했다. 충청 민심을 얻으려는 여권 주자들의 공약은 행정수도 완성, 세종의사당 설치, 충청권 메가시티, 강호축 광역철도 완성 등으로 요약된다. 이 지사는 세종시에 대통령 제2집무실을 설치하고, 2004년 헌법재판소가 내린 ‘수도 이전은 위헌’ 결정에 대한 판단을 다시 받아 보겠다고 약속했다. 이 전 대표는 ‘한강의 기적에 이은 금강의 기적’과 K테크노폴리스(연구개발 집적도시) 조성이 대표 공약이다.
  • 충청 대첩 돌입…‘과반 대세 굳히기’ 이재명 vs. ‘뒤집고 결선까지’ 이낙연

    충청 대첩 돌입…‘과반 대세 굳히기’ 이재명 vs. ‘뒤집고 결선까지’ 이낙연

    더불어민주당 대선 경선이 31일 대전·충남 권리당원 온라인투표를 시작으로 최종 후보 선출(10월 10일)을 향한 ‘5주 대장정’에 돌입한다. 충청권에서 ‘과반 대세’를 굳혀 결선 투표 없이 1차 투표에서 끝내려는 이재명 경기지사, 역전 가능성을 증명해 결선 투표 뒤집기를 노리는 이낙연 전 대표 모두 사활을 걸었다. 지역 순회 경선 결과는 4일 대전·충남, 5일 세종·충북에서 처음 공개된다. 순회 경선지마다 발표되는 대의원·권리당원 투표 결과에 다음달 8~12일 실시하는 1차 선거인단(국민·일반당원) 투표를 합산해 12일 1차 슈퍼위크 결과를 발표한다. 초반 판세가 지지층 결집을 좌우하는 것은 물론 부동층 선택에 ‘바람’으로 작용하는 터라 각 후보 모두 충청을 필승 지역으로 꼽는다. 수도권·호남을 제외하고 민주당 권리당원 비율(10%)이 가장 높다는 점도 충청을 뺏길 수 없는 이유로 꼽힌다. 민주당 본경선 돌입 후 지난 한 달간 시행한 여론조사에서 이 지사는 20%대, 이 전 대표는 10%대 충청권 지지율을 유지하고 있다. 대의원·권리당원 여론과 가까운 ‘민주당 지지층’ 대상 최근 충청권 조사(리얼미터, 23~24일, 전국 2015명, 표본오차는 95% 신뢰 수준에 ±2.2% 포인트. 중앙선거여론조사심의위 참조)에서는 이 지사 25.5%, 이 전 대표 23.1%로 예측 불허였다. 현장에서 뛰는 캠프 관계자와 중립지대 의원들의 전망을 종합하면 충남에서는 이 지사 우위, 충북에서는 이 전 대표 지지세가 만만치 않다는 분석이다. 이 지사 캠프 핵심 관계자는 29일 “충남의 압도적 지지와 비교하면 충북이 다소 약하다는 상대평가이지 대세론을 굳히는 데 문제없다”고 자신했다. 이 지사 캠프는 5선 변재일(충북 청주청원) 의원의 합류 후 바닥 민심 훑기에 총력전을 벌이는 태세다.충북 지역 현역 의원 8명 중 5명이 캠프에 합류한 이 전 대표 측도 승리를 자신했다. 이 전 대표 캠프 관계자는 “권리당원과 선거인단 모집은 현역 의원 영향력이 절대적”이라며 “충청에서 6대4로 이 지사에 앞설 것”이라고 전망했다. 이런 가운데 이 지사는 지난 28일 대전 대덕연구단지, 충남 홍성과 천안 방문을 시작으로 이날 충북 청주와 오송을 찾는 강행군을 이어 갔다. 청주에서는 “과학기술·바이오·이차전지·디스플레이로 이어지는 충청권 첨단산업 벨트를 조성하겠다”고 공약했다. 이 전 대표도 나흘째 충청에 머무르며 중부 3군 핵심당원 간담회, 충남 금산 수해 피해 주민 간담회 등을 소화했다. 이 전 대표는 지난 28일 아프가니스탄 조력자를 품은 진천 주민들에게 직접 감사를 전했다. 충청 민심을 얻으려는 여권 주자들의 공약은 행정수도 완성, 세종의사당 설치, 충청권 메가시티, 강호축 광역철도 완성 등으로 요약된다. 이 지사는 세종시에 대통령 제2집무실을 설치하고, 2004년 헌법재판소가 내린 ‘수도 이전은 위헌’ 결정에 대한 판단을 다시 받아 보겠다고 약속했다. 이 전 대표는 ‘한강의 기적에 이은 금강의 기적’과 K테크노폴리스(연구개발 집적도시) 조성이 대표 공약이다.
  • [고든 정의 TECH+] 엔비디아에 도전장 내민 인텔…GPU 시장 왕좌 빼앗을까?

    [고든 정의 TECH+] 엔비디아에 도전장 내민 인텔…GPU 시장 왕좌 빼앗을까?

    인텔이 인텔 아키텍처 데이 2021 행사를 통해 12세대 코어 프로세서인 엘더 레이크, 게이밍 GPU인 알케미스트, 그리고 고성능 연산용 GPU인 폰테 베키오의 아키텍처에 대한 상세한 정보를 공개했습니다. 흥미롭게도 이런저런 루머가 나돌았던 알케미스트(Xe-HPG, 고성능 게이밍)와 폰테 베이오(Xe-HPC, 고성능 연산)의 기본 구조는 엔비디아가 2018년 출시한 튜링 GPU의 모습과 약간 닮은 부분이 있습니다. 이번 공개 내용을 보면 과거 실행 유닛(EU)이라고 불린 그래픽 연산 유닛은 이제 벡터 엔진으로 이름이 바뀌었고 벡터 엔진 옆에는 인공지능 관련 연산을 담당하는 매트릭스 엔진(XMX)이 같은 숫자만큼 존재합니다. 그리고 여러 개의 벡터 엔진과 매트릭스 엔진 아래 하드웨어 레이 트레이싱(Ray Tracing)을 담당하는 부분이 있습니다. 그런데 엔비디아의 튜링 GPU 역시 그래픽 연산을 담당하는 쿠다(CUDA) 코어와 인공지능 연산을 담당하는 텐서 코어, 그리고 하드웨어 레이 트레이싱을 지원하는 RT 코어를 지니고 있습니다. 참고로 레이 트레이싱은 광원에서 나온 빛이 여러 사물의 표면에 반사되는 경로를 계산해 현실적인 빛의 효과를 그래픽에 추가하는 기술입니다.재미있는 사실은 현재 인텔의 GPU 개발을 담당한 라자 코두리가 2017년 AMD에서 인텔로 이적했다는 점입니다. 라자 코두리 수석 부사장은 본래 라데온 GPU를 개발하면서 엔비디아의 지포스에 맞섰던 사람입니다. 그런 그가 찾아낸 해법 역시 엔비디아와 비슷한 셈입니다. 물론 라데온의 길을 다시 걷기보다는 현재 업계 1위인 엔비디아를 타도하는 것이 옳은 전략이라는 점은 의심의 여지가 없습니다. 하지만 그렇다고 인텔이 무조건 엔비디아를 따라하기만 한 건 아닙니다. 인텔의 GPU 제조 방식은 엔비디아와 큰 차이가 있습니다. 바로 CPU를 개발하면서 축적한 다이 간 연결 기술인 포베로스(Foveros)와 EMIB(embedded multidie interconnect bridge)를 이용해 서로 다른 공정에서 만든 반도체 칩을 연결해 매우 큰 GPU를 만드는 방식입니다. 많게는 수백억 개의 트랜지스터를 집적한 최신 GPU는 한 번에 실수 없이 제조하기가 쉽지 않습니다. 특히 다이 사이즈가 커질수록 제조가 어려워집니다. A100처럼(TSMC 7nm 공정 사용) GPU 다이 크기가 826㎟이나 되고 트랜지스터 숫자도 542억 개나 되면 그렇지 않아도 비싼 웨이퍼에 수율도 좋지 않아 가격이 꽤 비싸 집니다. 인텔은 이 문제에 대한 해결책으로 여러 개의 작은 반도체 칩을 평면으로 연결하는 고속도로인 EMIB와 수직으로 연결하는 방식인 포베로스 기술을 개발했습니다. 이렇게 하면 반도체 패키징 과정이 매우 복잡해지는 문제가 있지만, 대신 꼭 최신 미세 공정을 적용하지 않아도 되는 부분은 더 저렴한 공정을 사용할 수 있고 한 번에 제조가 매우 어려운 초대형 프로세서도 만들 수 있습니다. 인텔이 공개한 폰테 베키오는 5개의 다른 공정으로 만든 47개의 반도체 조각인 액티브 타일(Active Tile)을 포베로스와 EMIB 기술로 연결해 무려 1000억 개 이상의 트랜지스터를 지닌 초대형 GPU입니다. 현재까지 상용화된 가장 복잡한 프로세서인 엔비디아의 A100보다 두 배의 트랜지스터 집적도를 지니고 있습니다. 연산 능력 역시 FP32 기준으로 45TFLOPS 이상으로 A100의 19.5TFLOPS의 두 배가 넘습니다. 오랜 세월 개발한 포베로스와 EMIB 기술이 이제 빛을 본 셈입니다.인텔은 이날 아키텍처 데이 행사에서 알케미스트 GPU의 연산 성능은 공개하지 않았으나 폰테 베키오의 연산 능력은 구체적으로 명시했는데, 슈퍼 컴퓨터/데이터 센터/인공 지능 연산을 위한 고성능 GPU 시장에서 엔비디아를 압박하겠다는 뜻으로 풀이됩니다. 코두리 수석 부사장은 회사를 옮겨도 주적은 엔비디아로 한결같다는 점이 재미있습니다. 이번 공개에서 마지막으로 주목할 점은 인텔이 TSMC의 최신 미세 공정인 6nm (N6), 5nm (N5) 공정을 사용하기로 한 것입니다. 알케미스트 GPU는 6nm 공정으로 제조되어 미세 공정에서 경쟁자보다 약간 우위에 섰고 폰테 베키오는 인텔 7 공정을 포함한 다양한 미세 공정을 사용하지만, 컴퓨트 타일은 5nm 공정을 사용해 역시 경쟁자보다 앞서고 있습니다. 최소한 미세 공정에서 밀리는 일은 없다는 이야기입니다. GPU 생산은 TSMC에 외주를 맞길 것이라는 점은 이미 알려진 내용이지만, 이번 발표를 보면 인텔이 얼마나 상대방을 이기고 싶어 했는지를 짐작할 수 있습니다. 인텔의 발표 내용을 신뢰한다면 폰테 베키오 GPU가 나오는 순간 엔비디아의 A100은 1위 자리를 내줘야 합니다. 물론 작년에 A100을 내놓은 엔비디아 역시 차세대 GPU를 개발 중이라 순순히 1위 자리를 내주지는 않을 것입니다. GPU 시장 진출을 선언한 인텔이 시작부터 엔비디아를 위협할지 아니면 엔비디아가 다시 1위 자리를 지킬 수 있을지 결과가 주목됩니다.    
  • [고든 정의 TECH+] 반도체 식힐 직접 수랭기술 공개한 TSMC…비장의 카드 될까?

    [고든 정의 TECH+] 반도체 식힐 직접 수랭기술 공개한 TSMC…비장의 카드 될까?

    최근 파운드리 시장은 어느 때 보다 뜨거운 관심을 받고 있습니다. 일부 자동차 공장을 멈추게 만든 반도체 수급 대란이나 중국의 반도체 굴기, 미국의 자국 내 반도체 산업 육성, 그리고 국내 반도체 업계의 투자 등 여러 가지 이슈가 겹치면서 과거에는 생소했던 파운드리(반도체 위탁생산)가 이제는 익숙한 용어가 됐습니다. 반도체 생산 공정은 나노미터 단위로 점점 작아질수록 기술적 난이도와 팹(fab) 건설 비용이 천정부지로 치솟는 특징이 있습니다. 그런 만큼 초미세 공정이 가능한 파운드리 업체의 숫자는 이제 TSMC와 삼성전자 단 두 곳에 지나지 않는 상황입니다. TSMC는 최신 미세 공정부터 여전히 수요가 많은 구형 공정까지 다양한 팹을 지니고 있으며 오랜 세월 파운드리 사업에서 잔뼈가 굵은 업체이기 때문에 이 분야에 누구보다도 많은 노하우를 지니고 있습니다. 하지만 과거 파운드리에서 존재가 미미했던 삼성이 엔비디아 같은 오랜 단골을 뺏어갈 정도로 영향력이 커졌고 인텔도 본격적인 투자를 진행하면 어떤 결과가 나올지 모르는 상황이기 때문에 TSMC 역시 경쟁자들을 물리치기 위한 비장의 무기들을 개발하고 있습니다. 그중 하나가 2021년 VLSI 심포지엄에서 발표한 직접 수랭(Direct Water Cooling, DWC) 기술입니다. 열이 많이 나는 고성능 프로세서의 경우 워터 펌프와 라디에이터로 열을 식히는 수랭 방식이 드물지 않기 때문에 수랭 기술이 뭐가 특별하냐고 생각할 수 있지만, 직접 반도체를 식한다는 점이 차이점입니다. 직접 수랭 기술은 반도체 바로 위에 물이 흐르는 미세관을 만들어 반도체를 직접 식힌다는 의미입니다. 첨단 과학기술력의 결정체인 최신 미세 공정 반도체는 사실 매우 약한 존재입니다. 따라서 최신 프로세서들은 반도체를 보호하는 튼튼한 금속판인 히트 스프레더(Heat spreader)로 덮여 있습니다. 그 사이 공간은 열전도율이 높은 물질인 서멀 그리스(Thermal Grease)로 채워 넣습니다. 수랭이든 공랭이든 쿨러는 모두 히트 스프레더 위에 다시 서멀 그리스를 바른 후 장착합니다. 따라서 사실 수백W의 전력을 소모하는 CPU와 GPU는 상당한 많은 단계를 거쳐야 공기나 물과 접촉할 수 있는 것입니다. 당연히 냉각 효율은 떨어집니다. 직접 수랭 기술은 이 문제를 해결하기 위해 몇 년 전부터 선보인 기술입니다. 칩의 위에 아주 작은 미세관이 있는 실리콘 층을 하나 더 쌓아 열을 제거하는 것입니다. 최신 반도체는 아파트처럼 여러 층으로 올리는 경우가 드물지 않기 때문에 사실 한 층을 더 넣는 건 그렇게 큰 문제가 되지 않습니다. 문제는 작은 미세관에 누수 없이 많은 물을 흘려보내 프로세서를 안정적으로 냉각시키는 것입니다. 조금이라도 누수가 발생하면 많은 전류가 흐르는 반도체가 바로 손상되면서 고가의 시스템이 완전히 망가집니다. 이런 문제 때문에 직접 수랭 기술은 이론적으로는 훌륭하지만, 상용화는 어려운 기술로 여겨졌습니다.이런 문제점에도 불구하고 TSMC가 직접 수랭 기술에 도전하는 데는 그럴 만한 이유가 있습니다. 최신 CPU와 GPU의 트랜지스터 집적도는 이미 수백억 개를 돌파했지만, 더 고성능의 프로세서를 만들기 위해서는 더 많은 트랜지스터가 필요합니다. 그런데 더 많은 트랜지스터는 더 많은 발열을 의미합니다. 과거에는 공정 미세화로 이 문제를 극복했지만, 이제는 점점 공정 미세화가 어려워지고 있습니다. 그런데 직접 수랭 방식을 적용하면 500㎟ 이상 크기의 대형 칩에서 200W가 아니라 2000W의 발열도 감당할 수 있다는 게 TSMC의 설명입니다. 이런 일이 실제로 가능하다면 대형 CPU나 GPU도 메모리처럼 여러 층으로 쌓아 집적 밀도를 높일 수 있을 것입니다. 평면으로 더 작게 못 만든다면 아파트처럼 여러 층으로 쌓는 것이 현실적인 대안입니다. TSMC는 여러 가지 반도체를 수직으로 올리는 3D 칩 적층 기술을 적극 도입하려 하지만, 메모리보다 훨씬 큰 발열 문제가 발목을 잡고 있습니다. 직접 수랭 기술은 발열 문제를 타개할 비장의 카드인 셈입니다. 물론 이번에 발표한 내용을 보면 당장 상용화할 수준은 아니고 프로토타입 제품을 만들어 가능성을 검증한 정도입니다. 서버에서 사용할 수 있을 정도로 신뢰성 높은 제품을 개발한다면 새로운 게임 체인저가 될 수 있겠지만 사실 쉬운 일은 아닐 것입니다. 과연 TSMC가 성공할 수 있을지 궁금합니다.
  • [고든 정의 TECH+] 차세대 비휘발성 메모리 3D 크로스포인트의 미래는?

    [고든 정의 TECH+] 차세대 비휘발성 메모리 3D 크로스포인트의 미래는?

    올해 3월 마이크론 테크놀로지(Micron Technology, Inc. 이하 마이크론)는 인텔과 손잡고 개발했던 차세대 비휘발성 메모리인 3D 크로스포인트(Xpoint) 사업에서 철수한다고 발표했습니다. 그리고 지난 주 마이크론이 지닌 유일한 3D 크로스포인트 메모리 생산 시설인 유타주 레히(Lehi)의 팹(fab)을 텍사스 인스트루먼트에 9억 달러에 매각한다고 발표했습니다. 3D 크로스포인트 기술은 기존의 낸드 플래시 메모리 기반 SSD보다 레이턴시가 1000배 빠르고 공정이 미세해질수록 수명이 줄어드는 낸드와 달리 1000만 번 쓰기가 가능하고 D램보다 10배나 높은 집적도를 지닌 차세대 비휘발성 메모리로 소개됐습니다. 간단히 설명하면 D램과 비슷한 속도를 지닌 메모리 + 저장 장치를 만들기 위해 개발한 차세대 메모리라고 할 수 있습니다. 현재 컴퓨터는 작업에 필요한 데이터를 저장 장치에서 꺼내 D램으로 가져와서 처리하고 결과를 다시 저장 장치에 기록합니다. 데이터의 크기가 커질수록 비효율적인 구조입니다. 궁극적인 대안은 저장 장치에서 바로 데이터를 처리하고 결과물도 남기는 방식입니다. 3D 크로스포인트는 이를 가능하게 만들 차세대 메모리로 주목받았습니다. 하지만 출시 초기부터 과연 시장에서 성공할 수 있는지 회의적인 시각도 적지 않았습니다. 옵테인 브랜드로 출시된 인텔의 3D 크로스포인트 메모리는 SSD를 대신하기에는 너무 비쌌고 D램 대신 사용하기에는 다소 느렸습니다. 그래도 인텔은 적극적으로 옵테인을 밀면서 제품들을 출시했지만, 이를 공동으로 개발한 동업자인 마이크론은 미지근한 반응을 보였을 뿐입니다. 마이크론은 2019년에야 콴트X X100 (QuantX X100)라는 서버용 SSD 제품을 내놓긴 했으나 실제로 시장에서는 거의 볼 수 없었고 이후 후속작도 없어 3D 크로스포인트 사업에서 철수하게 될 것이라는 전망이 나왔습니다.이런 결과가 나오게 된 이유는 간단합니다. 생각보다 3D 크로스포인트 메모리의 수요가 저조하기 때문입니다. 일반 PC 시장에서는 낸드 플래시 메모리 기반 SSD의 가격이 저렴해지고 속도도 빨라지면서 굳이 비싼 가격을 주고 옵테인 SSD를 구매할 이유가 없습니다. 그나마 대용량 데이터를 고속으로 주고받으면서 내구성도 신경 써야 하는 서버 시장에서는 조금 희망이 있지만, 이 역시 비용에 민감한 건 마찬가지라서 수요가 크지 않은 편입니다. 결국 3D 크로스포인트 사업부는 인텔이나 마이크론이나 모두 적자로 알려져 있습니다. 쉽게 말해 인텔도 3D 크로스포인트 메모리 생산 능력이 부족하지 않고 오히려 현재 있는 것도 곤란한 상황이라 마이크론의 생산 시설을 구매할 이유가 없습니다. 이런 이유로 마이크론은 인텔이 아닌 제3의 구매자에게 3D 크로스포인트 생산 시설을 매각할 수밖에 없었던 것으로 보입니다. 당초 기술 유출을 우려한 인텔이 구매할 것이라는 관측도 있었으나 결국 인텔도 포기한 셈입니다. 매각 대상이 차세대 비휘발성 메모리 기술에 관심이 많은 삼성이나 SK 하이닉스가 아니라 텍사스 인스트루먼트라는 사실 역시 인텔이 끼어들지 않은 이유로 생각됩니다. 텍사스 인스트루먼트(Texas Instruments, TI)는 일반인들에게는 생소하지만, 사실 역사가 꽤 오래된 반도체 회사로 각종 마이크로 컨트롤러나 영상, 음향, 통신, 신호처리 등에 사용되는 반도체를 생산합니다. 아날로그 반도체 시장에서는 1위 업체이기도 합니다. 레히에 있는 팹은 시스템 반도체 팹으로 전환할 경우 45nm, 65nm 공정으로 생산성이 좋은 300mm 웨이퍼 팹이기 때문에 현재 수요가 넘치는 시스템 반도체 생산용으로 전환될 것으로 보입니다. 텍사스 인스트루먼트는 3D 크로스포인트 관련 특허가 없는 건 물론이고 메모리 생산 자체에 관심이 없기 때문에 기술 유출 우려는 크지 않습니다. 아무튼 이런 대상에게 매각된다는 사실 자체가 3D 크로스포인트 메모리의 현재 상황을 상징적으로 보여주고 있습니다. 3D 크로스포인트 기술이 6년 전 화려하게 스포트라이트를 받으며 공개되었던 때를 생각하면 격세지감이 느껴지지만, 이제는 새로 들어오려는 기업은 없고 나가려는 기업만 있는 셈입니다. 다만 인텔이 아직 옵테인을 포기하지 않았고 결국 다른 경쟁자들도 차세대 비휘발성 메모리가 필요하다는 점을 생각하면 반전의 기회는 남아 있습니다. 3D 크로스포인트가 메모리가 의도한 것처럼 D램과 SSD를 통합하거나 아니면 적어도 그 중간에서 자신만의 입지를 찾을지 아니면 결국 이도 저도 아닌 메모리로 자연스럽게 시장에서 퇴출될지 미래가 궁금합니다.
  • [고든 정의 TECH+] 2.6조 개 트랜지스터를 지닌 인공지능 프로세서 - 2세대 웨이퍼 스케일 엔진 공개

    [고든 정의 TECH+] 2.6조 개 트랜지스터를 지닌 인공지능 프로세서 - 2세대 웨이퍼 스케일 엔진 공개

    초창기 인공지능 알고리즘은 별도의 연산 하드웨어 없이 CPU를 이용해 모든 연산을 처리했습니다. 그러나 CPU는 복잡한 명령어를 순차적으로 처리하는 데 유리한 구조로 단순한 신경망 밖에 구현할 수 없다는 한계가 있습니다.  따라서 인공지능 연구자들은 CPU의 한계를 극복하기 위해 대용량 그래픽 데이터의 병렬처리에 최적화된 GPU에 주목했습니다. GPU는 수백 개의 코어를 사용해서 한꺼번에 막대한 데이터를 연산하는데, 이는 CPU보다 인공지능 연산에 유리한 구조입니다. 인공지능 연구자들은 GPU 덕분에 과거에는 상상할 수 없었던 수준까지 인공지능 알고리즘의 성능을 끌어올렸습니다. 이제는 아예 최신 GPU도 인공지능 연산을 염두에 두고 개발될 정도로 인공지능 연산을 위한 GPU 수요가 커졌습니다.  그러나 GPU라고 해서 단점이 없는 완벽한 기계는 아닙니다. GPU 가장 큰 문제점은 혼자서 일을 할 수 없다는 것입니다. GPU는 기본적으로 컴퓨터의 그래픽 연산 프로세서이기 때문에 CPU, 메모리, 스토리지와 함께 작업해야 합니다. 따라서 CPU, 메모리와 끊임없이 데이터를 주고받아야 합니다. 데이터의 양이 커질수록 연산 능력이 아니라 데이터 병목현상 때문에 속도가 느려질 수밖에 없는 것입니다.  미국의 인공지능 관련 스타트업인 세레브라스 시스템스 (Cerebras Systems, 이하 세레브라스)는 이 문제를 극복할 수 있는 새로운 대안을 제시했습니다. 이들의 해결책은 300mm (12인치) 웨이퍼 하나를 통째로 하나의 통합 프로세서로 만들어 연산 코어와 메모리를 가득 채우고 가까운 거리에서 고속으로 연결하는 것입니다.  반도체는 웨이퍼라는 동그란 원판에서 한꺼번에 제작된 후 작게 조각내 CPU나 GPU 같은 개별 제품으로 판매됩니다. 컴퓨터에서 CPU와 GPU는 PCIe 같은 인터페이스로 연결되고 역시 CPU 밖에 위치한 메모리는 메모리 컨트롤러를 통해 제어됩니다. 대용량의 데이터를 주고받기 위해 서로 가까이 있어야 하지만, CPU, GPU, 메모리는 사실 서로 멀리 떨어진 셈입니다.  세레브라스의 웨이퍼 스케일 엔진 (Wafer Scale Engine, WSE)은 웨이퍼를 여러 개로 쪼갠 후 별도의 제품으로 만들어 서로 복잡한 과정으로 데이터를 주고받는 대신 작은 연산 코어와 메모리를 그냥 하나의 웨이퍼에 두고 데이터를 한꺼번에 처리하는 새로운 접근법을 택했습니다.  세레브라스의 1세대 웨이퍼 스케일 엔진은 TSMC의 16nm 공정으로 제조되었으며 거의 40만 개의 코어와 18GB의 온 보드 SDRAM을 장착해 고속 AI 연산에 최적화되어 있습니다. 하지만 현재 최신 미세 공정을 생각하면 16nm 공정 프로세서는 시대에 다소 뒤처진 감이 있습니다. 따라서 세레브라스는 최근 TSMC의 7nm 공정을 이용한 2세대 웨이퍼 스케일 엔진을 공개했습니다. 무려 85만 개의 AI 연산 코어와 40GB의 온보드 SDRAM을 탑재했으며 트랜지스터 집적도는 1세대의 1.2조 개에 두 배가 넘는 2.6조 개에 달합니다. 이론적 성능 역시 1세대의 두 배 이상입니다.   신생 스타트업이 기술적 난이도가 상당한 프로세서 개발에 성공한 이유는 인공지능 관련 스타트업에 유리한 미국 내 환경과 정부의 적극적인 지원이 있었기 때문입니다. 1세대 웨이퍼 스케일 엔진은 로렌스 리버모어 국립 연구소 (LLNL) 같은 국책 연구소의 슈퍼컴퓨터에 통합되었고 올해 3분기부터 출하될 2세대 웨이퍼 스케일 엔진은 아르곤 국립 연구소, 로렌스 리버모어 국립 연구소 같은 미국 내 연구소는 우선 도입될 예정입니다. 신개념 인공지능 기술을 국책 연구소에서 선도적으로 도입해서 성능을 검증하고 판로를 열어준 것입니다.  중국 등 다른 나라의 거센 추격을 받고 있긴 하지만, 아직 고성능 인공지능 프로세서 분야에서는 미국이 앞서 나가고 있습니다. 엔비디아, 인텔, AMD 등 미국 반도체 회사들이 이 분야에서 가장 선두를 달리고 있고 구글, 아마존, 마이크로소프트, 페이스북 같은 거대 IT 회사들이 탄탄한 수요를 뒷받침하고 있습니다. 그리고 세레브라스 같은 신생 스타트업도 혁신적인 아이디어만 있으면 민간과 정부에서 자금을 지원받아 새로운 인공지능 프로세서를 개발할 수 있는 길이 열려 있습니다. 세레브라스의 성공 여부와 상관없이 이 분야에서 한동안 미국이 앞서 나갈 것으로 보는 이유입니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • [고든 정의 TECH+] 애플 M1 프로세서 탑재 맥 시리즈 공개…애플의 노림수는?

    [고든 정의 TECH+] 애플 M1 프로세서 탑재 맥 시리즈 공개…애플의 노림수는?

    지난 10여 년 간 애플의 가장 큰 수익원은 아이폰이나 아이패드 같은 iOS 기기였습니다. 사람들의 관심 역시 모바일 기기에 집중되면서 맥(Mac)에 대한 관심은 상대적으로 적어졌습니다. 하지만 올해는 다른 모습입니다. 애플이 2006년부터 사용했던 인텔 CPU를 자체 개발한 ARM 기반 칩으로 교체한다는 폭탄 선언을 했기 때문입니다. 사실 루머로는 몇 년 전부터 나왔던 이야기인데, 막상 현실이 되니 세간의 관심이 집중된 것입니다. 애플 매킨토시는 1984년 첫 출시 때부터 10년 동안 모토로라 68000 계열 CPU를 사용했습니다. 그러다가 1994년부터 IBM 파워PC(PowerPC) 계열로 갈아탔습니다. 당시만 해도 애플은 파워PC의 성능이 인텔 CPU보다 우수하다고 주장했습니다. 그러나 애플은 2006년에 돌연 맥 CPU를 인텔 프로세서로 변경합니다. 여기에는 그럴 만한 이유가 있었습니다. IBM의 파워PC의 성능은 강력하긴 했지만, 기본적으로 고성능 PC와 서버를 목표로 개발되어 저전력 성능이 중요한 노트북에는 적합하지 않았습니다. 반면 당시 인텔은 전력 대 성능비를 획기적으로 개선한 코어 듀오(Core Duo) 프로세서를 출시했습니다. 인텔 프로세서의 개선 방향은 스티브 잡스가 생각한 맥의 미래와 일치했습니다. 저전력 성능을 크게 강화한 인텔 프로세서 덕분에 애플은 맥북 에어처럼 획기적으로 얇고 가벼운 노트북을 개발할 수 있었습니다. 하지만 몇 년 전부터 애플이 인텔 프로세서 대신 자체 프로세서를 사용할 것이라는 루머가 꾸준히 제기되었습니다. 이유는 간단합니다. 인텔 프로세서는 몇 년째 14nm 공정과 오래된 아키텍처에서 벗어나지 못하고 있지만, 애플의 A 시리즈 프로세서는 미세 공정과 아키텍처를 꾸준히 개량해 x86 CPU를 넘볼 수준까지 성능이 올라갔기 때문입니다. 애플 자체 칩과 인텔 칩의 성능 차이가 별로 없다면 애플 입장에서는 굳이 x86과 ARM으로 생태계를 분리할 이유가 없습니다. 맥에 자체 프로세서를 탑재할 경우 비용 절감 효과는 물론이고 애플 생태계에 최적화된 커스텀 프로세서를 장착할 수 있습니다. 결국 애플은 맥 제품군에 자체 프로세서를 탑재한다고 발표했고 그 결과물을 이제 공개했습니다. 애플 M1은 아이폰 12에 사용된 애플 A14 바이오닉 칩의 업그레이드 버전으로 고성능 파이어스톰 코어 4개와 고효율 아이스스톰 코어 4개로 구성된 8코어 프로세서입니다. A14와 비교하면 파이어스톰 코어 숫자가 2개에서 4개로 늘어났고 L2 캐쉬도 12MB로 50% 늘어났습니다. 더 많은 발열량을 허용할 수 있는 맥북과 맥 미니에 탑재하는 만큼 클럭도 더 높을 것으로 예상됩니다. GPU 역시 두 배 늘어난 8코어 GPU를 탑재해 스마트폰 가운데 최고 수준인 아이폰 12보다 성능이 훨씬 우수할 것으로 예상됩니다. 뉴럴 엔진은 16코어로 A14 바이오닉과 동일한데, 이 정도면 내장형 인공지능 가속기로 최상위급이기 때문에 굳이 더 늘릴 필요가 없었을 것입니다. M1의 트랜지스터 집적도는 A14 바이오닉보다 42억 개 늘어난 160억 개에 달하지만, TSMC의 최신 5nm 공정을 사용해 다이 면적은 10nm 공정 인텔 아이스레이크 CPU보다 크게 늘어나지 않았을 것으로 보입니다. 여기에 LPDDR4X 메모리 두 개를 옆에 붙여 놓은 통합 메모리 아키텍처 구조로 크기를 더 줄여 시스템을 매우 작고 가볍게 만들 수 있게 됐습니다. 애플은 새로운 메모리 장착 방식이 전통적인 메모리 모듈보다 더 우수한 성능을 보인다고 주장했습니다. 다만 M1 칩을 탑재한 신형 맥북 에어가 인텔 CPU를 탑재한 전 세대 모델보다 CPU 성능은 3.5배, GPU 성능은 5배 뛰어나다는 주장은 좀 더 엄밀한 검증이 필요합니다. 맥북 에어에 사용된 코어 i7-1060NG7 프로세서(1.2-3.8GHz 쿼드코어 CPU + 아이리스 프로 그래픽)의 성능 역시 만만치 않기 때문입니다. 코어 i7-1060NG7의 CPU 성능은 패스마크 (PassMark) 기준 6,234점으로 이보다 3배 이상 빠른 CPU는 노트북에서는 라이젠 7 4800H (8코어, 2.9-4.2GHz) 정도만 있을 뿐입니다. 솔직히 라이젠 7 4800H도 패스마크 기준 19,206점으로 3.5배가 안 됩니다. 인텔 CPU의 3.5배에 달하는 놀라운 성능의 비밀은 작은 숫자로 표시된 각주에 있습니다. 애플 공식 사이트에는 '배포 전 단계의 Final Cut Pro 10.5에서 4096x2160 해상도 및 초당 59.94 프레임의 4K Apple ProRes RAW 미디어로 구성된 55초 분량의 영상을 Apple ProRes 422로 인코딩 변환하여 테스트'한 결과라고 되어 있습니다. 쉽게 말해 CPU의 전반적인 성능이 아니라 M1에서 특별히 빠른 어플리케이션에서의 성능 비교입니다. 물론 GPU 역시 파이널 컷 프로에서의 비교 수치로 게임에서 평균 5배 빠르다는 의미는 아닙니다. 하지만 그렇다고 M1의 성능이 인텔 CPU보다 낮다는 것은 아닙니다. IT 전문 사이트인 아난드텍에서는 A14 바이오닉 CPU의 싱글 코어 성능이 SPEC2006 종합 비교 결과 인텔 i9-10900K와 AMD 라이젠 9 5950X의 중간 정도라고 평가했습니다. 파이어스톰 코어의 성능이 최신 x86 코어와도 겨룰 수 있는 수준이라는 것입니다. 출시 후 정확한 비교 벤치마크 결과를 봐야 알겠지만, 노트북용으로 성능을 높인 M1의 종합 성능은 적어도 A14보다 우수할 것입니다. 하지만 성능보다 더 중요한 강점은 저전력입니다.애플은 A 시리즈 프로세서에서 저전력 기술을 갈고 닦았습니다. M1은 애플이 오랜 세월 연마한 전력 관리 기술과 TSMC의 최신 5nm 공정 덕분에 전력 대 성능비가 인텔 칩보다 훨씬 높을 것으로 예상됩니다. 애플은 10W 전력 소모에서 M1의 성능이 인텔 칩보다 2배 뛰어나거나 혹은 최고 성능에서 전력 소모량이 1/4에 불과하다고 주장했습니다. 덕분에 신형 맥북 에어는 성능을 높이면서도 조용한 팬리스 디자인으로 돌아왔습니다. 배터리 용량 증가 없이도 배터리 사용 시간이 18시간까지 늘어난 것 역시 전기를 적게 먹는 M1 덕분입니다. 노트북에서 저소음, 저발열, 배터리 사용 시간이 중요한 점을 생각하면 저전력이 M1의 가장 큰 혁신이라고 할 수 있습니다. M1을 탑재한 1세대 모델은 이전 모델과 외형상 차이가 없지만, 결국은 더 얇고 가벼운 맥 제품군이 나올 수 있음을 시사하는 부분이기도 합니다. M1의 또 다른 장점은 애플 생태계의 통합입니다. 현재 애플 기기의 대부분은 자체 ARM 프로세서와 iOS 기반의 OS에서 돌아가고 있습니다. 맥만 x86 기반인데, 이것까지 자체 프로세서로 통합하면 애플 생태계의 마지막 퍼즐을 완성하는 셈입니다. 개발자들이 모든 애플 기기에서 돌아갈 수 있는 어플리케이션을 만들기 쉬워지고 프로세서 역시 애플 운영체제와 자주 쓰는 어플리케이션에 최적화해 성능을 최대한 활용할 수 있게 됩니다. 여러 하드웨어와 OS에서 돌아가야 하는 x86 프로세서에서는 누릴 수 없는 이점입니다. 애플은 앞으로 2년간 하나씩 맥 제품군 전체를 ARM 기반 자체 프로세서로 변경할 계획입니다. 따라서 맥 프로 같은 고성능 PC를 위한 자체 프로세서 역시 준비 중일 것입니다. 어쩌면 아마존처럼 서버용으로 쓸 수 있는 고성능 ARM 프로세서를 선보일지도 모릅니다. 이렇게 ARM 기반 자체 프로세서를 사용하면 클라우드와 다른 인터넷 서비스까지 애플 맞춤형 하드웨어가 가능하고 비용도 절감할 수 있다는 장점이 있습니다. 인텔 미세공정에 의존할 필요 없이 TSMC든 삼성이든 최신 미세공정을 입맛 대로 고를 수 있다는 것도 큰 장점입니다. 그런데 앞으로 애플의 사업 모델을 따라 하는 기업이 늘어나게 되면 인텔 입장에서는 큰 부담이 아닐 수 없습니다. 애플이 행보와 함께 고객을 잃게 된 인텔의 대응에도 눈길이 가는 이유입니다. 결국 인텔이 이 위기를 극복하려면 더 고성능 프로세서를 개발할 수밖에 없습니다. 몇 년 후 인텔이 ARM 경쟁자를 따돌릴 수 있는 신제품을 들고나올지 아니면 시장에서 입지가 축소될지도 궁금해집니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • [고든 정의 TECH+] 새 술을 헌 부대에? 로켓 레이크 CPU에 담긴 인텔의 고민

    [고든 정의 TECH+] 새 술을 헌 부대에? 로켓 레이크 CPU에 담긴 인텔의 고민

    AMD가 Zen 아키텍처의 메이저 업그레이드인 젠 3(Zen 3)를 발표하기에 직전 인텔의 존 보니니 (John Bonini) 부사장은 블로그를 통해 차기 데스크톱 프로세서인 로켓 레이크 (Rocket Lake)가 2021년 1분기에 출시된다는 글을 올렸습니다. AMD의 라이젠 5000 시리즈 출시에 맞서 인텔도 대응할 카드가 있다는 이야기를 하고 싶었겠지만, 일반적인 시각은 기대보다는 우려입니다. 아무리 신기술을 담아서 출시하더라도 2015년에 적용된 14nm 미세 공정을 2021년까지 사용하기 때문입니다. 14nm 공정을 아무리 개선했다고 해도 최신 아키텍처를 담기에는 너무나 오래된 헌 부대입니다. 인텔은 앞서 공개한 노트북용 10세대 코어 프로세서인 아이스 레이크(Ice Lake)와 11세대 코어 프로세서인 타이거 레이크(Tiger Lake)를 10nm 공정으로 제조했습니다. 하지만 10세대와 마찬가지로 11세대 코어 프로세서 역시 10nm 공정 생산 능력 부족으로 상당 부분은 14nm 공정 제품으로 채워야 하는 상황입니다. 인텔의 10nm 팹은 이스라엘과 미국 오레곤 주에 있는데, 점점 늘어나는 10nm 제품 수요를 감당하기에는 역부족입니다. 다행한 일은 최근 애리조나에 있는 팹(Fab) 42가 가동에 들어갔다는 것입니다. 팹 42는 230억 달러 (약 27조원)이라는 천문학적인 거금을 들여 건설한 10nm 팹으로 450mm 웨이퍼 호환설비를 지닌 최신 반도체 생산 시설입니다. 450mm 웨이퍼는 일반적으로 사용되는 300mm 웨이퍼보다 제품 생산량이 훨씬 많기 때문에 10nm 공정 제품 생산량을 획기적으로 늘려줄 것으로 기대됩니다. 하지만 아직도 모든 제품군을 10nm로 이전하기에는 생산량이 부족한 상황입니다. 노트북에 이어 데스크톱 CPU 주력 제품군을 10nm 공정으로 출시하는 것은 2021년 말이나 가능할 예정입니다. 로켓 레이크는 그 사이 공백을 메꾸기 위한 임시방편인 셈입니다. 로켓 레이크에 대해서는 사실 정식으로 공개된 정보가 거의 없습니다. 확실한 것은 14nm 공정의 마지막 데스크톱 CPU이자 인텔의 최신 아키텍처를 적용한 첫 번째 데스크톱 CPU라는 것입니다. 현재 인텔 노트북/데스크톱 CPU의 주력 아키텍처는 2015년에 등장한 스카이레이크 (Skylake) 아키텍처에 기반을 두고 있습니다. 오래된 아키텍처이지만, 성능이 우수해 아직도 싱글 코어 성능에서는 경쟁자인 AMD의 라이젠 프로세서를 앞서고 있습니다. 그러나 AMD도 젠 아키텍처를 업그레이드하면서 성능상의 우위를 빼앗길 상황입니다. 여기에 보안 취약점 문제까지 겹치면서 인텔은 새로운 아키텍처인 서니 코브 (아이스 레이크) /윌로우 코브(타이거 레이크)를 개발하기에 이릅니다. 문제는 이 아키텍처가 10nm를 염두에 두고 설계되었으나 인텔의 10nm 생산 능력이 아직도 수요에 한참 미치지 못한다는 것입니다. 로켓 레이크는 이런 상황에서 어쩔 수 없이 14nm 공정을 사용한 고육지책입니다. 인텔은 로켓 레이크의 구체적인 아키텍처를 공개하지 않았지만, 11세대 타이거 레이크에 사용된 윌로우 코브 아키텍처와 Xe GPU를 사용할 가능성이 큽니다. 윌로우 코브 아키텍처는 서니 코브 아키텍처의 개선판으로 클럭을 더 높인 것이 특징입니다. 같은 클럭에서는 서니 코브 아키텍처가 전 세대 아키텍처 대비 18%나 성능이 높아 클럭만 낮아지지 않는다면 10세대 데스크톱 코어 프로세서인 코멧 레이크 (Comet Lake)보다 높은 성능을 보여줄 것으로 기대됩니다. 그래픽 성능은 Xe가 워낙 이전 세대 인텔 내장 그래픽보다 성능이 높아 상당한 성능 향상을 기대할 수 있습니다. 다만 서니/월로우 코브 아키텍처의 경우 성능이 높아진 만큼 트랜지스터 집적도 역시 높아져 14nm 공정을 사용할 경우 발열량과 전력 소모가 높아질 수 있습니다. 여기에 더 커진 Xe 그래픽까지 합쳐지면 지금도 큰 발열량이 더 감당하기 어려운 수준까지 커질 수 있습니다. 따라서 Xe GPU만 10nm 칩렛 (Chiplet) 디자인으로 만들 수도 있다는 루머도 있습니다. 이 경우 순수한 14nm 공정이 아니라 10/14nm 혼용으로도 볼 수 있습니다. 이미 AMD도 14nm 다이(die)와 7nm 다이를 혼용하는 만큼 인텔 역시 그렇게 하지 못할 이유가 없습니다. 그러나 아직 확실한 내용은 밝혀진 바가 없습니다. 지금 단계에서 확실한 것은 로켓 레이크가 최소한 CPU 코어는 14nm 공정이고 새로운 아키텍처를 적용했으며 PCIe 4.0을 지원한다는 것입니다. 아무튼 2021년에도 14nm 공정 기반이라는 사실은 솔직히 실망스러운 일입니다. 이런 식으로 새 술을 헌 부대에 담는 것도 문제지만, 2021년 말에 10nm 공정의 최신 CPU인 앨더 레이크 (Alder Lake)가 출시된다는 것도 문제입니다. 2021년 초에 11세대 코어 프로세서를 구매하면 1년도 되지 않아 구형 제품이 되는 셈입니다. 새 컴퓨터가 급하지 않은 소비자라면 구매를 꺼릴 수밖에 없는 상황입니다. 하지만 인텔의 결정에도 나름대로 이유가 있습니다. 라이젠 5000 시리즈에 맞서기 위해서는 14nm 공정에 구형 아키텍처를 지닌 코멧 레이크보다 아키텍처라도 개선한 로켓 레이크가 훨씬 유리합니다. 또 벤치마크 결과를 봐야 알겠지만, 의외로 싱글 코어 성능에서 로켓 레이크가 라이젠 5000을 앞설지도 모릅니다. 그렇다면 게임처럼 싱글 코어 성능이 중요한 분야에서 수요가 생길 수 있습니다. 10nm 및 7nm 공정 지연으로 어려운 상황이지만, 인텔 나름의 자구책을 마련한 것입니다. 이 자구책이 얼마나 효과가 있을지 궁금합니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • “스마트그린 산단 육성… 선도형 경제로 거듭나 제조업 부활을”

    “스마트그린 산단 육성… 선도형 경제로 거듭나 제조업 부활을”

    산업단지는 제조업의 근간이며 중소기업의 요람으로 지역경제 발전의 중추적인 역할을 해 오고 있다. 하지만 전국 대부분의 산업단지는 노후화되거나 가동률 저하와 고용 감소가 이어지고 있으며, 경쟁력 감소가 가속화되고 있다. 산단의 경쟁력 저하는 제조업 경쟁력 저하로 끝나지 않고 다시 제조업에 기반한 지방의 쇠퇴와 몰락으로 이어지는 핵심적인 요인이기도 하다. 문재인 대통령이 지난 17일 경남 창원 국가산업단지를 찾아 스마트그린 산단 육성 의지를 강조하면서 스마트그린 산단에 대한 관심이 높아지고 있다. 이에 산단이 해결할 문제를 점검해 보고자 한다. 제조업을 둘러싼 환경은 급변하지만 이에 대한 대응과 적응은 제대로 이루어지지 못했다. ●스마트산단은 데이터 공유체계 형성이 핵심 문 대통령은 이날 ‘스마트그린 산단 보고대회’에서 “데이터, 네트워크, 인공지능(AI) 기술로 생산성을 높이면서 깨끗한 에너지로 환경오염을 줄일 수 있다면 그야말로 산업단지의 대혁신”임을 강조하며 ‘스마트그린 산단 실행전략’을 발표했다. 전국 7개 국가산단에 추진 중인 스마트산단을 디지털 뉴딜과 그린 뉴딜을 융합한 스마트그린 산단으로 조성하고 2025년까지 15개로 확충한다는 전략은 추격형 경제에서 선도형 경제로 거듭나는 제조업 혁신전략으로 제시됐다. 제조업은 과거 노동자의 노하우와 개별 기업이 보유한 장비의 성능에 따라 좌우됐으나 최근 급속히 자동화하고 있다. 서로 연관성이 없다고 생각되던 다양한 부문들이 디지털과 인터넷으로 통합되거나 융합되고 있다. 또한 하드웨어가 아닌 소프트웨어가 중심이 되는 변화도 급속히 진전되고 있다. 기존의 산업단지는 여러 가지 문제가 있지만, 대표적인 것은 기존의 산단이 단순히 다수의 생산시설이 집적돼 있을 뿐 상호연계 및 네트워크 형성에는 관심을 두지 않았다는 점이다. 생산에 필요한 용수 및 폐기물처리시설 등 기본적인 생산기반시설 공유는 물론 기업과 산업 간 상호연계, 상호 경험의 공유와 효율화를 통한 고도화 등이 필요한 시점이다. 창원, 구미 및 반월시화 등은 80% 이상 업체가 특정 업종으로 분류되는 집적도를 보이지만, 막상 집적에 따른 생산 효과의 증대는 두드러지지 않는다. 주변의 도시와 분리돼 고립된, 공장들의 수용소 같은 공간으로 인식되고 있는 것이 현실이다. 최근 대기업을 중심으로 한 일부 사업장에서 정보기술(IT)을 적극적으로 활용해 제조공정의 생산성 향상과 비용절감을 도모하는 ‘스마트 공장’이 도입되고 있다. 스마트 공장으로의 전환이 이루어진 사업장은 생산성 30% 향상과 더불어 불량률 43%, 원가 15% 감소의 효과를 거둔다고 분석된다. 하지만 이와 같은 스마트 공장으로의 전환은 느리고, 특히 산업단지 내 공장이 스마트 공장으로 분류되는 경우는 2018년 기준 5% 수준에 불과하다. 2018년부터 정부는 이러한 문제를 인식하고 개별 공장의 스마트화를 넘어 산업단지 내에 위치한 기업들이 상호 데이터를 공유하고 연결됨으로써 동일 업종과 밸류체인에 속해 있는 기업들이 스스로 연계되는 ‘스마트 산업단지’로의 전환을 추진해 왔다. 스마트 산업단지는 제조공정과 관련한 다양한 데이터를 산업단지 내의 기업들이 자발적으로 상호 연결·공유하는 것에서 출발한다. 데이터를 활용해 생산성을 향상시키고 새로운 산업을 창출하도록 하는 것이 스마트 산업단지의 핵심이다. 산업단지 내 사업장 간에 원료와 부품이 오가는 것이 아니라 데이터를 공유하는 체계를 산업단지에 형성하는 것이다. 스마트 산업단지라는 개념은 훌륭하고 추구해야 할 방향으로 인식되고 있지만, 정작 그 구체적인 모델은 제대로 제시되고 있지 않다. 실시간으로 제조 데이터를 공유하는 머신 러닝에 기반한 플랫폼을 구축하고 이를 토대로 공정상 문제점을 선제적으로 보완한다는 개념은 훌륭하다. 하지만 이렇게 하기 위해 무엇을 해야 할지는 불분명하다. 스마트 산업단지로의 전환이 방향이지만, 그것이 현실의 사업장, 그리고 산업단지라는 공간 내에서 어떻게 구체화할 것인지, 발생이득이 있다면 어떻게 배분될지에 대해서는 여전히 모호한 상황이다. ●2022년까지 스마트그린 산단 10곳 조성 추진 최근 본격화되고 있는 한국판 뉴딜은 스마트 산업단지를 다시 한번 더 높은 차원으로 끌어올리는 것을 목적으로 하고 있다. 디지털에 기반한 스마트 산업단지로의 전환에 더해 ‘에너지 고효율’과 ‘저오염’이라는 친환경 요소가 더해지는 산업단지, 즉 ‘스마트그린 산업단지’로 변모하도록 하는 것이다. 산업단지의 관점에서 보면 스마트그린 산단으로의 전환은 거대한 도전이다. 당장 2022년까지 총사업비 2조 1000억원(국비 1조 6000억원)을 투자해 전국적으로 10개 산업단지를 스마트그린 산단으로 전환하며 이를 통해 일자리 1만 7000개를 창출하는 과제가 눈앞에 있다. ‘스마트그린 산단’은 디지털을 기반으로 에너지 절약에 초점을 맞추고 있으며 동시에 원료물질의 효율적 사용 및 절감을 통해 오염물질을 덜 배출하는 산업단지다. 실제 한국판 뉴딜에서 제시되고 있는 관련 사업 내용을 보면 ▲산업단지의 에너지 발전·소비에 대한 실시간 모니터링과 제어를 담당하는 스마트 에너지 플랫폼(10곳) ▲폐열·폐기물 재사용 및 재생에너지를 사용하는 스마트 생태공장(100곳) ▲기업 간 폐기물 재활용 연계(81개) 등으로 디지털 기술과 환경·에너지의 결합을 추진하도록 하고 있다. 사실 스마트그린 산단의 개념은 2003년에 추진됐던 ‘생태산업단지’와 유사하다. 생산현장에서 발생하는 폐기물을 인근의 업체가 원료로 이용하는 구조를 의미하는 생태산업단지는 폐기물 발생을 최소화하며 비용 상승을 억제하는 방안으로 각광을 받았다. 그러나 생태산업단지는 실제 적용 과정에서 많은 한계를 드러냈다. 특정 물질을 중심으로 공정이 연속적으로 이어져야 하지만 해당 산업단지에서 이를 담당할 기업이 없는 경우 연결고리가 끊어지기 때문이다. 특정 공정을 담당할 업체를 유치하는 것도 어려울 뿐만 아니라 일부 업체의 배출량이나 수요 감소, 공정변화에 따른 타 원료로의 전환 발생 등 많은 변수가 존재하지만 이를 종합적으로 통제·관리하는 주체가 없었기 때문이었다. 상대적으로 에너지 효율 향상은 물질순환에 비해 상대적으로 용이하다. 고효율 에너지 기기의 보급을 위한 제도적 장치는 이미 상당 부분 마련돼 있으며 태양광·풍력 및 연료전지 등 재생에너지 활용 역시 기술적·제도적으로 잘 갖춰지고 있기 때문이다. 재생에너지 발전사업자가 한전을 거치지 않고 별도의 계약을 통해 전력을 판매할 수 있도록 하는 전기사업법 개정안이 올해 안에 처리될 가능성이 높아지고 있어 이를 잘 활용할 경우 큰 변화를 이끌어 낼 수 있을 것이다. 스마트그린 산단의 조성에는 많은 과제가 있다. 그 첫 번째 과제는 ‘모니터링’이다. 산업단지의 다양한 활동들을 실시간으로 모니터링하면서 각종 정보를 취합하는 것이 스마트그린 산단의 첫 번째 단계이지만 현실화는 쉽지 않다. AI와 드론에 기반한 유해화학물질 원격 모니터링 체계 구축, 에너지 발전·소비를 실시간 모니터링·제어하는 스마트 에너지 플랫폼 구성 등은 모두 사물인터넷(IoT)을 통한 데이터 수집, 그리고 이를 관제하는 통합관제센터의 설치·운영을 전제로 하고 있다. 실시간으로 대규모 데이터를 저렴하면서도 정확·신속하게 획득할 수 있는 센서의 개발과 보급, 이를 종합한 모니터링 체계의 구축은 만만치 않은 도전이다. 두 번째 과제는 ‘데이터의 관리주체’이다. 수집된 데이터들을 누가, 어떻게 관리·운영할 것인지, 그리고 이러한 데이터를 통해 얻어지는 이익은 누구의 것인지 등에 관한 사항이다. 국가산업단지는 산단공단이 이와 같은 업무를 담당할 주체로 고려될 수 있지만, 과연 이에 필요한 기술 및 인력 등을 확보하고 있는지는 불확실하다. 지자체가 관리하는 일반산단은 문제가 더욱 심각하다. 정부는 ‘제조데이터 공유 가이드라인’ 제정 등을 통해 기준을 제시하고 정보유출 우려 해소 등을 위해 노력하고 있지만 데이터의 생산과 공유에 대한 경험이 부족한 제조업체들로서는 선뜻 참여하기가 곤란한 상황이다. 세 번째 과제는 산단 내 데이터에 기반한 신산업과 기업들을 어떻게 육성할 것인가이다. 단기적으로 가시적인 성과를 내기 위해 관련 기업을 유치하거나 별도의 기관을 설립하는 방안이 논의되고 있지만 지속가능성 측면에서 뚜렷한 전망을 제시하지는 못하고 있다. 사실 데이터를 활용한 산업은 이용자가 이용하기 편리하도록 표준화된 데이터들이 일정 수준 이상 축적되면 자연스럽게 형성된다. 충분히 축적된 양질의 데이터를 분석하고 이를 토대로 특정 분야에 필요한 AI를 개발해 적용하는 것은 지금의 기술로도 어려운 일이 아니다. 정작 문제는 다종다양한 데이터의 표준화, 데이터의 품질관리가 문제인 것이다. ●다종다양한 데이터 표준화·품질관리 해결해야 코로나19로 인한 충격은 당초 예상을 뛰어넘어 장기화되고 있다. 그 과정에서 기존의 변화를 가속화한다. 제조업과 산단이 그 대상에서 제외될 수는 없다. 끊임없이 치열한 경쟁이 이루어지고 있는 현실에서 산단은 가장 빠르게 변화에 적응하고 실험해야 하지만, 한국의 산단은 그러지 못했다. 한국 산단은 국가와 공공부문의 주도로 형성됐다. 스마트그린 산단 역시 정부의 역할이 중요하다. 그렇다 해도 정부가 직접 뛰어들어 변화를 만들기보다 새로운, 다양한 주체들이 산단에 공간적 단위로 참여해 다양한 시도를 하도록 제도적 틀과 기반을 만들어 주는 데 집중할 필요가 있다. 무엇보다 데이터 관리가 중요하다. 각종 센서를 이용한 데이터의 수집과 이용, 그리고 이를 활용해 창출되는 이익의 배분 등에 대한 다양한 차원의 제도적 뒷받침이 필요하다. 즉 다양한 부문의 민간이 산업단지의 데이터에 관심을 가지고 참여할 수 있도록 기반을 구축하는 것이 스마트그린 산단 조성의 가장 기본적이면서도 핵심적인 전제조건이라고 볼 수 있다. 스마트그린 산단은 단순히 산단과 제조업의 경쟁력 강화를 넘어서 산단에 기반한 제조업, 그리고 제조업에 기반한 지방의 부활을 가져올 수 있는 핵심적인 사업이다. 산업단지를 스마트 산업단지로, 그리고 이를 넘어선 스마트그린 산업단지로 전환하는 것은 우리 제조업 정책에서 큰 도전이다. 개별 사업장 차원을 넘어 산업단지라는 공간적 단위에서의 디지털화, 그리고 부품과 원료가 아닌 데이터의 공유를 통해 생산성과 에너지 효율을 높인다는 것은 산단과 제조업, 대한민국의 기업이 21세기에 추구해야 할 목표이기 때문이다.최준영 법무법인 율촌 전문위원
  • [고든 정의 TECH+] 애플 A14 바이오닉에서 보이는 애플의 미래

    [고든 정의 TECH+] 애플 A14 바이오닉에서 보이는 애플의 미래

    미국 현지 시각으로 9월 15일에 진행된 애플의 신제품 공개 행사는 매해 가을 신제품 행사의 주역인 아이폰은 빠졌지만, 그 모습을 짐작하게 만드는 신기술은 먼저 공개되었습니다. 바로 신형 아이패드 에어에 사용된 A14 바이오닉 (Bionic) 칩입니다. 5nm 공정이 적용된 애플 A14 바이오닉 칩은 별다른 이변이 없다면 조만간 공개될 아이폰 12의 두뇌가 될 것입니다. 그런 만큼 A14 바이오닉 칩을 통해 아이폰 12의 성능은 물론 애플이 생각하는 미래 전략을 엿볼 수 있습니다. 애플이 공개한 내용에 따르면 A14 바이오닉 칩은 A13 바이오닉 칩보다 38%나 늘어난 118억 개의 트랜지스터를 집적했습니다. 모바일 AP 가운데 역대 최대 수준입니다. 8코어 라이젠 7 3700X CPU의 경우 트랜지스터 집적도가 59.9억 개로 절반 정도에 불과합니다. A14 바이오닉 칩이 복잡도에서 고성능 데스크톱 CPU에 못지않은 수준이라는 점을 짐작할 수 있습니다. 물론 A14 바이오닉 칩은 CPU만 있는 게 아니라 GPU와 인공지능 연산을 위한 뉴럴 엔진 (Neural Engine) 등 여러 가지 부분을 포함하고 있어 일반적인 CPU와 1:1 비교는 무의미하지만, 최신 5nm 공정으로 얼마나 많은 트랜지스터를 집적했는지 짐작할 수는 있는 대목입니다. 하지만 진짜 흥미로운 부분은 트랜지스터 증가 폭에 비해 미미한 성능 향상입니다. 애플은 아이패드 에어의 두뇌를 A12에서 A14로 바꾸면서 CPU와 GPU 성능이 각각 40%와 30% 향상되었다고 발표했습니다. 이 주장이 사실이라면 A13 바이오닉 칩과 비교 시 A14 바이오닉 칩의 CPU, GPU 성능 향상은 겨우 16%와 8.3%에 불과합니다. 값비싼 최신 미세 공정을 이용해서 트랜지스터 집적도를 85억 개에서 118억 개로 끌어올린 것치곤 초라한 수치입니다. 그런데 여기에는 그럴 만한 이유가 있어 보입니다. 바로 훨씬 커진 뉴럴 엔진입니다.애플이 공개한 프로세서 다이어그램에서 16코어 뉴럴 엔진의 크기는 6코어 (2코어 파이어스톰 (고성능) + 4코어 아이스스톰 (저전력)) CPU 블록보다 더 커졌습니다. 과거 반도체 다이 블록 (die block)을 분석한 결과에 따르면 A13 바이오닉 칩에서 CPU의 면적은 13.47㎟이지만 뉴럴 엔진의 크기는 4.64㎟로 절반에도 못 미쳤습니다. 그런데 A14 바이오닉 칩에서는 반대로 뉴럴 엔진 부분이 대폭 커진 것입니다. 정확한 크기는 반도체 다이를 직접 분석해봐야 알 수 있지만, 애플은 뉴럴 엔진이 8코어에서 16코어로 두 배 늘어났고 연산 능력도 6TOPs에서 11TOPs로 거의 두 배 늘어났다고 발표했습니다. 따라서 A14 바이오닉 칩에서 늘어난 트랜지스터의 상당 부분은 뉴럴 엔진에 할당되었을 가능성이 큽니다. 애플은 CPU나 GPU가 아니라 인공지능이 미래라고 본 것입니다. 그렇게 생각하는 이유는 또 있습니다. 애플은 오래된 A10을 사용한 아이패드를 A12 바이오닉 칩으로 업그레이드했습니다. 이미 A12 바이오닉 칩으로 업그레이드한 아이패드 미니와 A13 바이오닉 칩을 사용한 아이폰 SE, 그리고 A14 바이오닉 칩을 사용할 것으로 예상되는 아이폰 12까지 전 제품 라인업에 적어도 5-11TOPs급 인공지능 칩을 사용한 것입니다. 애플이 인공지능에 초점을 맞춰 제품 라인업을 재정비했다는 사실을 알 수 있는 대목입니다. 이미 인공지능은 스마트폰과 태블릿에서 성능을 높이는 데 큰 역할을 하고 있습니다. 따라서 애플은 물론이고 인텔, 퀄컴, 삼성전자, 엔비디아 등 여러 IT 기업들이 더 강력한 인공지능 하드웨어를 개발하는데 투자를 아끼지 않고 있습니다. 그런데 애플의 강점은 하드웨어 자체보다 이와 연결된 독자적인 생태계와 사용자 경험, 그리고 서비스에 있습니다. 모든 제품에 인공지능 강력한 하드웨어를 장착한 것은 앞으로 이를 위한 기초 공사일 것입니다. 애플이 앞으로 인공지능을 어떻게 활용할지 궁금합니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • [고든 정의 TECH+] 엔비디아 RTX 3000 시리즈 공개에 더 주목받는 삼성 파운드리

    [고든 정의 TECH+] 엔비디아 RTX 3000 시리즈 공개에 더 주목받는 삼성 파운드리

    엔비디아가 튜링 아키텍처 기반의 RTX 2000 시리즈를 공개한 지 2년 만에 암페어(Ampere) 아키텍처 기반의 RTX 3000 시리즈를 공개했습니다. RTX 3000 시리즈는 진짜 물체처럼 빛을 반사하는 실시간 레이 트레이싱(Ray tracing) 기술을 강조한 RTX 시리즈의 두 번째 GPU로 전 세대보다 성능을 두 배 정도 끌어올렸습니다. 좀 더 구체적으로 말하면 RTX 3000 시리즈 최상위 그래픽 카드인 RTX 3090은 35.7테라플롭스(TFLOPs, 단정밀도 기준) 연산 능력을 지니고 있는데, 이는 전 세대 최상위 그래픽 카드인 RTX 2080 Ti의 13.4테라플롭스의 2.7배에 달합니다. 인공지능 관련 성능 척도인 텐서(Tensor) 연산 능력도 114테라플롭스에서 285테라플롭스로 역시 2.5배 정도 증가했습니다. 이런 성능 향상이 가능한 비결은 연산 유닛인 쿠다(CUDA) 코어 숫자를 두 배가 넘는 1만496개로 늘리고 동작 클럭도 높인데 있습니다. 흥미로운 부분은 트랜지스터 집적도는 186억 개에서 280억 개로 두 배 증가하지 않았다는 것입니다. 암페어 아키텍처에서 튜링 아키텍처보다 작고 효율적인 연산 유닛을 적용하고 클럭을 높였다는 해석이 가능합니다. 하지만 최상위 모델인 RTX 3090의 경우 성능만큼이나 가격도 범접하기 어려운 수준으로 올라갔습니다. RTX 2080 Ti의 출시 권장소비자가격(MSRP)은 999달러였으나 RTX 3090은 1499달러로 1.5배 정도 더 비싼 편입니다. 게임 용도로는 사실 선뜻 지불하기 어려운 가격입니다. 하지만 인공지능 연산 등 특수 목적에 사용할 때는 오히려 가성비가 우수한 제품으로 극소수의 하이엔드 게이머나 전문 작업용으로 수요가 있을 것으로 예상됩니다. RTX 3090보다 더 현실적인 게임용 그래픽 카드는 RTX 3080입니다. 699달러의 가격 역시 절대 저렴한 건 아니지만, RTX 3090과 같은 GA102 GPU를 사용하면서도 가격은 절반 이하 수준입니다. 상대적으로 저렴한 가격의 비결은 GPU 일부를 잘라낸 컷 칩을 사용해 가격을 낮췄을 뿐 아니라 그래픽 메모리를 24GB에서 10GB로 줄였기 때문입니다. 하지만 아무리 컷 칩을 사용하고 메모리를 줄여도 제조 비용에서 가장 큰 비중을 차지하는 GPU 자체의 가격을 낮추지 못하면 전체 비용을 낮추기 어렵습니다. 바로 이 대목에서 삼성의 8N 공정이 해결책으로 등장했습니다. 2년 전 엔비디아는 RTX 2000 시리즈에 TSMC의 12nm (FFN) 공정을 채택했습니다. 당시 10nm 이하의 미세 공정을 채택하지 않은 이유는 비용 문제 때문이었습니다. 반도체 웨이퍼 제조 단가는 미세 공정일수록 급격히 높아집니다. 만약 186억 개의 트랜지스터를 지닌 거대 GPU를 10nm 이하 미세 공정으로 제조했다면 제조 단가가 비싸 많은 이윤을 남기기 어렵습니다. 따라서 엔비디아는 경쟁사인 AMD가 7nm 공정을 채택할 때도 꿋꿋이 12nm 공정으로 2년을 버틴 것입니다. 물론 그래도 성능으로 밀리지 않고 앞서 나갔기에 가능한 일이었습니다. 삼성의 8nm(8N) 공정은 10nm 공정의 개량형으로 알려져 있습니다. 따라서 삼성 파운드리나 TSMC의 최신 7nm 공정에 비해 성능은 낮지만, 제조 비용은 저렴합니다. 엔비디아가 542억 개의 트랜지스터를 집적한 고성능 인공지능 가속기인 A100 GPU에는 TSMC의 7nm (7N) 공정을 사용한 반면 RTX 3000 시리즈에는 삼성 8N 공정을 사용한 것은 게임용 그래픽 카드가 A100처럼 엄청나게 비싼 가격에도 판매할 수 있는 제품이 아니기 때문입니다. 280억 개의 트랜지스터를 집적해도 현실적인 가격에 판매할 수 있으려면 그만큼 타협이 필요합니다. 물론 비용만 낮추면 되는 것이 아니라 적어도 1-2년 정도 그래픽 카드 시장을 석권할 수 있는 강력한 제품도 만들 수 있어야 합니다. 엔비디아는 고심 끝에 삼성 파운드리가 최적의 조건이란 결론을 내렸을 것입니다. 삼성 파운드리가 적어도 600㎟가 넘는 대형 GPU 시장에 본격 진입했다는 것은 적지 않은 의미를 지닙니다. 이 분야에서 TSMC의 독점 구조가 깨진 것이기 때문입니다. 삼성은 GA102 칩 이외에도 RTX 3070에 사용된 좀 더 작은 GPU의 위탁 생산도 맡고 있습니다. 앞으로 등장할 RTX 3060/3050 같은 보급형 GPU 역시 삼성 8N 공정을 사용할 가능성이 큰 셈입니다. 역사적으로 엔비디아는 대부분의 물량을 TSMC에 의존해 왔지만, 이번에는 다른 선택도 가능하다는 것을 보여줬습니다. 당연히 TSMC에 생산을 의뢰했던 AMD 같은 다른 제조사나 인텔처럼 외부 파운드리를 고민하는 제조사의 선택에도 큰 영향을 줄 것으로 예상됩니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • [고든 정의 TECH+] 인공지능 시장 정조준한 엔비디아의 인공지능 가속기 A100

    [고든 정의 TECH+] 인공지능 시장 정조준한 엔비디아의 인공지능 가속기 A100

    엔비디아가 코로나19로 인해 사상 최초로 온라인으로 진행된 GTC 2020 컨퍼런스에서 차세대 아키텍처인 암페어(Ampere)와 이를 적용한 고성능 GPU인 A100을 공개했습니다. A100의 첫인상은 한마디로 ‘거대하다’입니다. 12nm 공정에서 더 미세한 7nm 공정으로 이전하면 트랜지스터 집적도가 증가하는 게 당연하지만, 전 세대의 2.5배가 넘는 542억 개는 예상을 뛰어넘는 수준입니다. GPU 다이 크기는 826㎟인데 이전 세대인 볼타(Volta) GV100이 815㎟ 크기의 다이에 211억 개의 트랜지스터를 집적한 것과 비교하면 정말 빽빽하게 트랜지스터를 담아 넣은 셈입니다. 하지만 이렇게 늘어난 크기에도 불구하고 A100의 배정밀도 연산 능력은 9.7 TFLOPs로 GV100의 7.8 TFLOPs과 비교해 큰 차이가 없습니다. 그 이유는 시대의 요구에 따라 고성능 컴퓨팅보다 인공지능에 관련 연산 유닛을 대거 집어넣었기 때문입니다. 사실 엔비디아는 2017년에 나온 볼타 GV100부터 GPU에 인공지능 기술을 대거 도입해 이 시장에서 승승장구했습니다. 암페어 A100은 아예 올인했다고 해도 좋을 정도로 인공 신경망 관련 신기술에 집중했습니다. 암페어 A100은 인공지능과 관련된 특수 연산인 텐서 연산을 가속하기 위해 3세대 텐서 코어를 탑재했습니다. 3세대 텐서 코어는 TensorFloat-32 (TF32) 텐서 연산 유닛을 새로 탑재해 FP32 데이터 연산과 입출력 속도를 10배 정도 끌어올렸습니다. 기존의 볼타에서도 지원했던 FP16 연산 속도도 2.5배 빨라졌습니다. 이것만으로도 인공지능 관련 연산 속도를 크게 높일 수 있지만, 엔비디아는 희소성 가속(Sparsity Acceleration)이라는 신기술을 도입해 인공 신경망 연산 속도를 다시 두 배 높였습니다. 따라서 실제 체감 속도는 최대 20배 빨라졌습니다. 엔비디아가 공개한 벤치마크 결과에 의하면 암페어 A100은 일반적으로 많이 사용되는 고성능 컴퓨팅 (HPC) 연산에서는 볼타 대비 1.5-2.1배 정도 빠르며 인공지능 연산은 방식에 따라 3-7배 정도 더 빠릅니다.(그래프 참조) 고성능 컴퓨팅 분야에서도 더 빨라지긴 했지만, 인공지능 관련 기능을 대폭 강화해 AI에 대한 요구가 많아지는 데이터 센터 및 기업 시장을 정조준한 것으로 풀이될 수 있습니다.암페어 아키텍처의 또 다른 장점은 인공지능 연산에서도 학습(training)에 특화된 볼타 아키텍처와 추론(inference)에 특화된 튜링 아키텍처의 장점을 포괄해 학습과 추론 모두에 사용할 수 있다는 것입니다. 볼타 아키텍처에서는 FP16 텐서 연산만 지원했고 나중에 등장한 튜링 아키텍처에서는 추론 연산에 중요한 INT4/8을 지원해 두 가지 제품이 각각의 용도에 사용되었습니다.(후자는 T4 가속기) 기업 입장에서는 작업에 따라 두 가지 인공지능 가속기를 도입해야 하는 문제점이 있었습니다. 암페어 A100에서는 300억 개 이상 늘어난 트랜지스터에 이 기능을 집중적으로 할당해 통합 인공지능 가속기로 거듭났습니다. 엔비디아가 같이 공개한 A100의 재미있는 부가 기능 중 하나는 하나의 GPU를 7개의 가상 GPU로 활용할 수 있는 Multi-Instance GPU(MIG) 기술입니다. A100처럼 큰 자원을 지닌 GPU를 모두 사용하는 인공지능 작업도 있을 수 있지만, 사실 전체가 필요하지 않을 수도 있습니다. 이 경우 GPU의 자원을 쪼개 여러 사용자가 같이 쓰거나 한 사용자라도 여러 작업을 동시에 수행할 수 있다면 작업 효율을 높일 수 있습니다.A100은 공개와 더불어 이미 고객에서 첫 제품이 인도된 상태입니다. 8개의 A100이 사용된 DGX A100은 미국 아르곤 국립 연구소에서 설치가 시작되었습니다. 19만9000달러의 가격표를 달고 나온 DGX A100은 두 개의 64코어 AMD 에픽 CPU와 1TB 메모리, 15TB 스토리지를 탑재했습니다. 전 세대와 달리 인텔 제온 대신 AMD 에픽 CPU를 채택한 점이 눈에 띄는데, 그만큼 에픽 CPU의 성능이 좋아졌기 때문으로 풀이됩니다. 두 회사가 라이벌 관계라는 점을 생각하면 재미있지만, 에픽 CPU의 성능도 좋고 PCIe 4.0도 지원하니까 사실 합리적인 선택입니다. 본래 엔비디아는 게임용 그래픽 카드인 지포스 제조사로 시작해서 전문가용 그래픽 카드인 쿼드로와 고성능 컴퓨팅 GPU인 테슬라로 영역을 점점 넓혀왔습니다. 최근에는 GPU 기반 인공지능 가속기로 IT 업계를 선도한다는 평가를 받고 있습니다. 물론 그와 동시에 엔비디아가 공개하는 최신 기술과 고성능 GPU는 일반 소비자에게 점점 더 생소한 물건이 되고 있습니다. 본체 가격만 수억 원에 달하는 DGX A100 서버를 집에 구비할 개인 소비자는 극히 드물 것입니다. 그러나 점점 발전하는 인공지능 기술은 이미 우리 삶에 큰 영향을 주고 있고 앞으로는 그 영향력이 더 커질 것입니다. 역사상 가장 큰 프로세서로 등장한 A100은 더 강력한 인공지능에 대한 기업들의 수요가 얼마나 큰지 보여주는 증거입니다. 하지만 인공지능을 비즈니스에 접목한 기업이나 연구에 활용하는 과학자 모두 여기에 만족하지 않을 것입니다. 분명 몇 년 안에 이보다 더 강력한 인공지능 하드웨어가 탄생하게 될 것입니다. 이렇게 발전한 인공지능이 인간을 위협하지 않고 인간을 위해서만 사용되기를 기대합니다. 고든 정 칼럼니스트 jjy0501@naver.com
  • 1조원 방사광 가속기 청주에 건립된다

    1조원 방사광 가속기 청주에 건립된다

    1조원이 투입되는 다목적 방사광 가속기가 충북 청주에 건립된다. 과학기술정보통신부는 8일 오전 충북 청주를 가속기 구축사업 우선협상 대상자로 발표했다. 과기부는 지질·지반구조 안정성과 교통 편의성, 가속기를 활용할 대학·연구기관·산업체 집적도 등을 평가해 청주를 최적의 부지로 평가했다. 청주는 특히 지리적 여건과 발전 가능성에서 높은 점수를 받은 것으로 전해졌다. 과기부는 유치신청서를 제출한 청주, 강원 춘천, 전남 나주, 경북 포항 등 4곳을 대상으로 심사를 벌여왔다. 후보지를 결정한 과기부는 올해 안에 예비타당성 조사를 신청하고, 늦어도 2022년 사업에 착수할 계획이다. 계획대로 진행되면 2027년 가속기가 준공되고 2028년 운영에 들어간다. 충북은 그동안 청주의 뛰어난 입지, 안정성 등을 장점으로 내세우며 유치경쟁을 벌여왔다. 청주와 가까운 수도권과 중부권에 방사광 가속기 연관 기업이 집적돼 있어 활용도가 높은 점, 청주가 국토 중심부에 자리잡고 있는데다 KTX오송역과 경부·중부·중부내륙·중앙고속도로, 청주공항 등 교통인프라가 우수한 점, 자연재해 위험이 없는 화강암, 편마암 등 단단한 암석의 지질구조라는 점 등을 강조해왔다. 충북도는 가속기가 완공되면 연구시설, 기업들이 들어서고 도시인프라가 확대되면서 청주가 대한민국을 대표하는 과학도시가 될 것으로 전망하고 있다. 한국기초과학지원연구원은 가속기 구축시 고용 13만7000명, 생산 6조7000억원, 부가가치 2조4000억원의 효과를 기대하고 있다. 가속기는 전자를 빛의 속도로 가속시킬 때 발생하는 ‘방사광’이란 빛으로 물질의 미세구조를 관찰하는 초정밀 거대현미경이다. 신약, 차세대 신소재, 초소형 기계부품 등 다양한 분야에서 활용돼 ‘기초과학의 꽃’으로 불린다. 신규 가속기는 둘레길이 800m규모의 원형으로 건립될 예정이다. 이시종 충북지사는 “청주 오창 테크노폴리스 산업단지에 건립되는 가속기의 연구성과가 전국에 골고루 확산되도록 모든 지원을 다하겠다”고 밝혔다. 청주 남인우 기자 niw7263@seoul.co.kr
  • [요즘 과학 따라잡기] 대기방사선과 반도체와의 싸움/김한성 한국원자력연구원 가속기개발운영부장

    2008년 10월 7일 싱가포르에서 호주로 향하던 QF72편에 탑승한 승객들은 아찔한 경험을 했다. 11㎞ 상공에서 순항하던 비행기가 갑자기 320m를 급강하한 것이다. 비행기는 무사히 비상착륙했지만 탑승객 3분의1 이상이 크고 작은 부상을 입었다. 이후 자동항법장치와 관련된 데이터 오류가 원인으로 밝혀졌지만 데이터 오류를 일으킨 근본 원인은 명확히 밝혀내지 못했다. 유력한 원인 중 하나가 대기방사선에 의한 반도체 소자의 작동 오류였다. 반도체는 전자를 이용해 정보를 저장한다. 대기방사선은 반도체의 전자를 교란해 반도체 속 정보를 뒤죽박죽으로 만든다. 반도체가 소형화되고 집적도가 높아질수록 대기방사선에 의한 오작동 가능성도 커지고 있다. 자율주행차, 항공기, 대규모 전산망에 쓰이는 반도체 소자의 오동작은 경제적 손실뿐 아니라 사람의 생명에 직결되는 문제다. 반도체 오동작을 막는 기술을 개발하려면 인공적으로 대기방사선을 만들어 반도체 소자에 주는 영향을 평가하고, 새로운 기술을 시험해 봐야 한다. 고에너지 양성자가속기는 대기방사선을 만들어 낼 수 있다. 그래서 주요 선진국들은 경쟁적으로 고에너지 양성자가속기를 구축해 활용하고 있다. 국내에서도 양성자가속기를 개발해 2013년부터 운영 중이다. 다만 현재까지는 가속에너지가 부족한 편이라 에너지 업그레이드를 계획하고 있다. 양성자가속기가 한국 반도체산업에 든든한 지원군이 될 것이다.
  • [고든 정의 TECH+] 새 아키텍처로 부활 꿈꾸는 인텔 아톰 프로세서

    [고든 정의 TECH+] 새 아키텍처로 부활 꿈꾸는 인텔 아톰 프로세서

    2008년, 인텔은 기존의 x86 CPU보다 훨씬 낮은 전력을 소모하는 소형 CPU인 아톰 (Atom)을 공개했습니다. 인텔이 앞서 내놓은 코어 프로세서의 저가형 버전을 내놓는 대신 아톰 프로세서를 내놓은 이유는 비용 때문이었습니다. 코어 프로세서는 당시 문제가 많았던 펜티엄 4 프로세서의 한계를 극복하고 경쟁자인 AMD를 넘어서기 위해 인텔의 기술력을 집약해서 만들어졌습니다. 그런 만큼 성능이 뛰어났지만, 구조가 복잡하고 크기도 컸습니다. 당연히 비용을 낮추는 데 한계가 있었습니다. 반면 보넬(Bonnell) 아키텍처 기반의 1세대 아톰 프로세서는 구조를 대폭 단순화해 크기를 줄이고 비용을 낮췄습니다. 1세대 아톰 프로세서는 지금 기준으로 생각하면 엄청나게 작은 4700만 개의 트랜지스터 집적도와 26㎟에 불과한 다이(die) 면적을 갖고 있었습니다. 덕분에 제작 비용이 저렴해 싸게 판매해도 이윤을 남길 수 있었습니다. 아톰 프로세서는 개도국 교육 시장을 겨냥한 클래스메이트 PC나 저가형 노트북인 넷북 등에 탑재되었는데, 저렴한 가격 덕분에 큰 인기를 끌었습니다. 비록 성능은 낮았지만, 30만 원 이내의 비용으로 휴대가 간편한 소형 노트북을 살 수 있다는 점 때문에 간단한 문서 작업과 웹서핑만 하려는 소비자에게 합리적인 선택이었습니다. 하지만 IT 세상이 스마트폰 중심으로 빠르게 변하면서 아톰 프로세서의 입지는 좁아집니다. 스마트폰과 태블릿의 성능이 1년이 다르게 좋아지고 휴대성도 넷북보다 우수했기 때문에 저전력 PC 시장이 크게 위축된 것입니다. 여기에 ARM 기반 프로세서와 달리 성능 향상이 더딘 아톰 프로세서 자체의 문제도 있었습니다. 인텔은 2013년 22㎚ 공정 기반의 실버몬트(Silvermont) 아키텍처 아톰 프로세서를 내놓으면서 반전을 꾀했습니다. 2013년 말에 등장한 베이 트레일 같은 실버몬트 기반 아톰 프로세서는 상당한 성능 향상을 통해 저가형 윈도우 태블릿과 노트북에 널리 탑재되었습니다. 특히 이 시기에는 x86용 안드로이드 OS가 출시되면서 윈도우와 안드로이드 듀얼 부팅을 지원하는 저가형 태블릿 PC가 잠시 인기를 얻기도 했습니다. 그러나 이 역시 대화면 스마트폰이 늘어나고 태블릿 시장이 고급형 중심으로 재편되면서 설 자리를 잃게 됩니다. 아톰 프로세서의 입자가 좁아진 것은 인텔의 정책 역시 한몫했습니다. 판매량은 적어도 큰 이익을 남길 수 있는 서버용 CPU 수요에 집중하면서 많이 팔아도 수익을 남기기 어려운 아톰 제품군은 자연스럽게 소홀해진 것입니다. 인텔은 2015년에 14㎚ 공정의 에어몬트(Airmont), 2016년에 골드몬트(goldmont) 아톰 프로세서를 내놓기는 했지만, 전체적인 성능 향상은 미미했습니다. 심지어 2017년에 마이너 업그레이드 모델인 골드몬트를 내놓고는 더 이상 모델 업데이트도 없었습니다. 반면 코어 프로세서는 계속해서 전력 대 성능비를 높여 태블릿 PC 및 초경량 PC에 탑재되는데 문제없는 수준까지 발전했습니다. 더구나 x86 태블릿 PC 시장도 서피스나 갤럭시 북처럼 생산성이 높은 고성능 제품 위주로 흘러가고 있습니다. 저가형 저전력 CPU인 아톰의 입지가 줄어들 수밖에 없는 이유입니다. 하지만 인텔은 2019년 3분기 실적 발표와 더불어 트레몬트 (Tremont) 기반 아톰 CPU에서 새로운 가능성을 제시했습니다. 트레몬트는 전 세대인 골드몬트 대비 평균 30% 정도 성능을 높였으며 10㎚+ 공정에서 생산되어 전력 대 성능비를 높였습니다. 하지만 트레몬트와 기존의 아톰 CPU의 가장 큰 차이점은 고성능 코어와 함께 사용할 수 있다는 점입니다. CPU의 성능이 전반적으로 상향 평준화된 지금 저전력 CPU 단독으로는 한계가 있을 수밖에 없습니다. 따라서 인텔은 애플 A 시리즈나 퀄컴 스냅드래곤, 삼성 엑시노스에서 볼 수 있는 고성능 + 저전력 CPU 조합을 x86 CPU에 도입할 계획입니다. 올해 말 출시를 준비 중인 레이크필드(Lakefield) 하이브리드 CPU가 그것으로 고성능 서니 코브(Sunny Cove) 코어와 저전력 트레몬트 코어, 그리고 Gen 11 GPU를 혼합해 만든 새로운 CPU입니다.레이크필드는 여러 가지 신기술이 도입된 새로운 모바일 CPU입니다. 레이크필드는 이미 10세대 코어 마이크로프로세서에서 선보인 서니 코브 아키텍처 기반의 고성능 코어와 새로 개발한 트레몬트 기반의 저전력 코어가 들어갑니다. 인텔 코어 프로세서는 세대를 거듭하면서 저전력 성능을 높여왔지만, 기본적으로 고성능 x86 코어로 ARM 계열 저전력 코어를 사용하는 모바일 AP와 경쟁하기 어려웠습니다. 트레몬트는 이와 같은 단점을 극복할 새로운 저전력 코어로 매우 얇고 가벼운 태블릿 PC나 컨버터블 노트북에서 진가를 발휘할 것으로 예상됩니다. 윈도우 태블릿 PC의 배터리 성능을 높이거나 더 가벼워질 수 있는 것입니다. 레이크필드의 성공 여부는 실제 제품이 출시되어야 알 수 있지만, 인텔의 방향성 자체는 옳다고 생각됩니다. 1세대 아톰이 등장했던 2008년과 지금의 IT 환경은 너무나 다릅니다. 경쟁자인 ARM 계열 CPU의 성능이 너무 좋아졌고 AMD의 저가형 CPU의 성능도 만만치 않습니다. 저전력이지만 저성능인 아톰 프로세서 단독으로만 제품을 내놓으면 운신의 폭은 계속 좁을 수밖에 없습니다. 만약 레이크필드가 기대처럼 저전력과 고성능의 두 마리 토끼를 잡는다면 아톰 제품군에 새로운 희망이 생길 것입니다. 고든 정 칼럼니스트 jjy0501@naver.com
위로