찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 추론 운영
    2026-05-30
    검색기록 지우기
  • 캡슐레이션
    2026-05-30
    검색기록 지우기
  • 해체철거
    2026-05-30
    검색기록 지우기
  • 2026-05-30
    검색기록 지우기
  • 절주
    2026-05-30
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
244
  • 앤트로픽, 몸값 1440조원 ‘껑충’…삼성전자·SK하이닉스도 전략적 투자

    앤트로픽, 몸값 1440조원 ‘껑충’…삼성전자·SK하이닉스도 전략적 투자

    삼성전자와 SK하이닉스가 인공지능(AI) 모델 ‘클로드’의 개발사인 미국 AI 기업 앤트로픽에 전략적 투자를 단행했다. 국내 반도체 양강 기업의 투자로 글로벌 AI 네트워크가 강화됐다는 분석이다. 28일(현지시간) 앤트로픽은 최근 진행한 시리즈H 투자 라운드에서 650억 달러를 유치하면서 기업 가치가 9650억 달러(약 1440조원)로 평가됐다고 밝혔다. 지난 2월 기업가치 평가액 3800억 달러(약 570조원)에서 3달 만에 2배 이상 증가한 수치다. 앤트로픽이 이번 투자금을 AI 인프라에 집중적으로 투입하겠다고 밝히면서 투자 라운드에 참여한 삼성전자와 SK하이닉스와의 AI 글로벌 동맹이 더 견고해진 것으로 분석된다. 마이크론 역시 전략적 인프라 파트너로 참여했다. 삼성전자와 SK하이닉스는 이번 투자로 AI 에이전트를 둘러싼 AI 생태계에서 전략적 협력 관계를 구축할 수 있는 기반을 다지게 됐다. 앤트로픽을 넘어 연계된 글로벌 AI 파트너들을 고객사로 확보할 기회도 기대할 수 있다. 앤트로픽은 이날 발표문에서 “이들 기업의 기술은 전 세계 메모리, 저장장치, 로직 칩 공급에 핵심 역할을 담당하고 있다”며 “(이들과의) 협력 관계는 고객 요구에 맞춰 컴퓨팅 역량을 안정적으로 확장하는 데 큰 도움이 될 것”이라고 밝혔다. 업계에서는 삼성전자와 앤트로픽이 단순 메모리 차원이 아닌 파운드리 분야까지 협력 범위를 넓힐 것으로 전망하고 있다. 앤트로픽이 언급한 ‘로직 칩’은 파운드리 공정을 통해 만드는데, 전략적 인프라 파트너 3사 중 유일하게 파운드리 사업부를 가진 곳이 삼성전자뿐이기 때문이다. 이에 따라 최근 몇 년간 적자를 이어온 삼성전자 파운드리 사업부에 청신호가 켜졌다는 분석도 나온다. 앞서 삼성전자는 테슬라의 차세대 AI 칩인 ‘AI5’와 ‘AI6’ 칩 수주를 따냈다. 엔비디아의 추론 전용 언어처리장치(LPU) 칩인 ‘그록3’의 역시 삼성전자 파운드리를 통해 생산되고 있다. SK하이닉스는 앤트로픽이 최근 AI 에이전트를 운영하기 위해 구축 중인 신규 데이터센터 인프라에 필요한 HBM을 공급할 것으로 보인다. 앤트로픽은 최근 아마존과 최대 5GW(기가와트) 규모 신규 데이터센터 용량 확보 계약을 체결하기도 했다.
  • 오케스트로, GPU 활용률 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공개

    오케스트로, GPU 활용률 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공개

    - 분산 서빙 기반 추론 최적화… 보유 GPU 인프라 활용 효율 높여- 고부하 환경서 토큰 출력 속도 2.2배 향상… AI 서비스 응답 지연 완화- 국내 유일 GPU·국산 NPU 이기종 가속기 지원… 소버린 AI 인프라 선택권 확대 AI·클라우드 소프트웨어 전문 기업 오케스트로(대표 김범재, 김영광)는 보유 GPU 인프라의 활용 효율을 높여 기업 AI 서비스의 추론 병목을 줄이는 AI 추론 운영 플랫폼 ‘콘체르토 AI(CONCERTO A.I.)’를 선보였다고 29일 밝혔다. 생성형 AI 도입이 확산되면서 기업 AI 인프라의 핵심 과제는 GPU 확보에서 추론 운영 효율화로 전환되고 있다. AI 챗봇, 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 등 상시 운영 AI 서비스가 늘어나면서 모델 호출과 추론 연산 수요도 함께 증가하고 있다. 에이전트형 AI 환경에서는 단일 요청이 복수의 모델 호출과 반복 연산으로 이어져 추론 작업량이 단기간에 급증할 수 있다. GPU를 보유하더라도 추론 요청이 특정 자원에 집중되면 병목으로 인한 응답 지연과 자원 낭비가 동시에 발생하는 구조적 문제가 따른다. 콘체르토 AI는 분산 서빙 기반의 추론 최적화를 핵심 기술로 채택했다. 기존 단일 처리 방식은 질문 분석과 답변 생성을 동일 GPU 자원에서 처리해 요청 집중 시 전체 응답 속도가 저하된다. 콘체르토 AI는 두 작업을 분리해 각각에 적합한 자원을 배치함으로써 병목을 줄인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선하고, 실시간 대기열·자원 상태 기반 지능형 라우팅 기능을 결합해 고부하 환경에서도 응답 성능을 유지한다. 오케스트로가 자체 온프레미스 AI 인프라 환경에서 수행한 벤치마크 테스트에 따르면, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 높게 유지한 것으로 나타났다. 운영 자동화 기능도 탑재됐다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 LLMOps에 필요한 기능을 단일 플랫폼에서 제공한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 파드(Pod) 생성부터 엔드포인트 연결까지 배포 과정을 자동화하며, 배포 이후에는 초기 응답 시간·토큰 처리 속도·자원 사용량 등 주요 지표를 통합 모니터링 환경에서 확인할 수 있다. 인프라 호환성 측면에서는 엔비디아 GPU 외에 리벨리온·퓨리오사AI 등 국산 NPU 환경까지 지원하는 이기종 가속기 구조를 채택했다. 오케스트로 측은 GPU와 국산 NPU를 아우르는 상용화 수준의 AI 추론 운영 플랫폼은 국내에서 콘체르토 AI가 유일하다고 밝혔다. 이를 통해 기업·기관은 프라이빗 AI 및 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 서비스 특성과 보유 인프라에 맞춰 추론 자원을 구성할 수 있다. 김범재 오케스트로 대표는 “기업 AI 인프라의 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다”며 “콘체르토 AI를 기반으로 기업이 보유한 AI 인프라의 활용 효율을 높이고, 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다”고 밝혔다.
  • [기고] AI 3강 도약의 관건, AI 풀스택에서 SW 주권 확보 필요

    [기고] AI 3강 도약의 관건, AI 풀스택에서 SW 주권 확보 필요

    ChatGPT 출시 이후 인공지능(AI)은 일상생활의 필수 도구로 자리 잡고 있으며 국민의 생활 방식과 근로자의 작업 방식에 혁신적 변화를 가져오고 있다. 최근 ChatGPT를 능가하는 제미나이, 클로드의 출시로 AI에 대한 사회적, 경제적 의존도는 더욱 심화하고 있다. AI 기술은 미국이 주요 생성형 AI 서비스와 핵심 기술을 중심으로 주도하고 있으나 중국도 딥시크, 큐원 등 막대한 인구가 제공하는 데이터와 자체 기술을 기반으로 미국의 AI를 급속히 추격하고 있다. 현 정부에서 AI 3강 실현을 선언하며 국내 AI 기술의 경쟁력을 미국, 중국 수준으로 높일 필요성이 절실한 상태다. AI 실현에 필요한 AI 풀스택은 미국 국립표준기술연구소(NIST)의 클라우드 컴퓨팅 참조구조(CCRA)를 기반으로 보면 피지컬 AI, LLM과 같은 ‘서비스 계층’, 운영체제(OS), 가상화, 클라우드 관리 플랫폼(CMP), 미들웨어 플랫폼, 재해복구(DR) 등의 기능을 수행하는 ‘자원 추상화 제어 계층’, GPU, 네트워크, 데이터센터와 같은 ‘물리자원 계층’의 3계층으로 크게 구분할 수 있다. 관점에 따라 약간의 차이는 있지만 아마존웹서비스(AWS)는 이를 AI 스택, 엔비디아는 AI 팩토리를 위한 풀스택이라고 부른다. 정부는 AI 기술 강화를 목표로 그랜드 AI 챌린지, 독자 파운데이션 모델 개발 사업 등을 통해 LG AI연구원 엑사원, 업스테이지 솔라 등의 국산 LLM을 글로벌 수준으로 도약시키기 위해 집중적으로 지원하고 있는데 이는 AI 서비스 계층에 해당한다. 퓨리오사AI, 리벨리온을 통한 NPU 개발, 엔비디아의 GPU 확보 및 지원은 물리자원 계층에 해당한다. 대통령 공약 사항인 “AI는 게임 체인저, 100조 원 규모 투자와 국가 AI 인프라 구축 추진” 선언에 따라 국가AI데이터센터(AIDC) 추진, 지자체‧공공기관‧민간의 적극적 AIDC 구축 추진, AIDC 진흥을 위한 특별법 제정 등이 급물살을 타고 있는데 이 또한 물리자원 계층에 해당한다. 이러한 사항들을 기반으로 보면 한국은 AI 3강을 향해 필요한 물리적 기반을 빠르게 갖춰가고 있다. 그러나 GPU와 데이터센터를 대규모로 확보하더라도 이를 충분히 활용하지 못하면 AI 경쟁력으로 이어지기 어렵다. 확보한 GPU를 실제 서비스와 산업 현장에서 충분히 활용하려면 자원을 효율적으로 묶고 배분하며 격리하고 복구해 서비스 형태로 제공하는 소프트웨어 역량이 함께 뒷받침돼야 한다. 특히 AI 활용이 학습을 넘어 대규모 추론으로 확산하면서 GPU를 무작정 증설하기보다 이미 보유한 자원의 처리 효율을 높이는 추론 운영 플랫폼의 중요성도 커지고 있다. 분산 서빙 기반의 추론 최적화 소프트웨어는 낮은 GPU 활용률 문제를 완화하고 AI 서비스 효율을 높이는 핵심 기술이다. 이 계층이 약하면 고가의 GPU와 데이터센터는 온전히 국가 경쟁력으로 전환되기 어렵다. 문제는 이러한 역할을 담당하는 자원 추상화 제어 계층, 즉 AI 인프라 소프트웨어에 대한 지원이 빠져 있다는 점이다. 비유하자면 머리와 하체는 튼튼해지고 있는데 허리가 부실해 상하체가 끊겨 있어 제대로 능력을 발휘할 수 없는 셈이다. 주요국은 이미 이 지점에 주목하고 있다. AI 기술 주권의 완성을 위해서는 AI 풀스택 전반, 즉 서비스 계층, 자원 추상화 제어 계층, 물리자원 계층 모두에 걸친 균형 잡힌 기술 발전이 필요하다. 특히 물리자원과 AI 서비스를 안정적으로 운영하고 제어하는 클라우드·엣지 인프라 SW는 AI 시대의 기술 자립을 뒷받침할 핵심 전략 영역이다. 유럽 역시 이러한 관점에서 IPCEI-CIS 프로젝트를 추진하며 최대 12억 유로의 공공 지원과 약 14억 유로의 민간 투자를 바탕으로 차세대 클라우드·엣지 인프라와 서비스 기술을 개발하고 있다. 이는 단순한 인프라 구축을 넘어 멀티클라우드·엣지 환경의 근간이 되는 데이터 처리·공유 SW 등 인프라 SW 역량 강화에 중점을 두고 있다. 일본은 경제산업성을 중심으로 AI 개발에 필요한 컴퓨팅 자원 정비를 지원하고 있다. 경제안전보장추진법에 따라 5개 사업계획에 최대 725억 엔을 지원하며 AI 개발에 필요한 연산 자원을 국내에서 안정적으로 공급할 기반을 확충하고 있다. 이는 GPU 서버 확보에 그치지 않고 개발자와 기업이 필요한 자원을 클라우드 방식으로 활용할 수 있게 하는 인프라 SW 역량을 함께 키우려는 접근이다. 중국도 신창 정책을 바탕으로 핵심 IT 스택의 자립을 추진하고 있다. 반도체와 장비뿐 아니라 AI 시스템 SW 분야에서도 자국 SW 사용을 확대하고 외산 의존도를 낮추려는 움직임이 이어지고 있다. 이는 기술 자립의 범위가 물리자원 계층을 넘어 인프라 SW 계층까지 확장되고 있음을 보여준다. 즉 주요국의 AI 시대 육성 정책은 주권 회복 및 자립을 위해 AI 풀스택 전층에 걸쳐 기술 자립화를 추진하는 방향으로 가고 있다. 그에 비해 우리나라는 SW가 AI를 탄생시킨 핵심 기술이고 클라우드와 같은 자원 추상화 기술이 AI 풀스택의 중간 허리 위치의 핵심 기술임에도 불구하고 AI 관련 예산 지원을 서비스 계층과 물리자원 계층에 집중하고 있다. 자원 추상화 제어 계층에 해당하는 인프라 SW와 클라우드 분야의 지원은 일부는 이미 익숙한 오래된 단어라 유행이 지나갔다고 생각하고 있고 일부는 우리가 할 수 없는 영역이라고 생각하며 포기하고 있다. AI 인프라 SW 육성을 간과한 결과 최근 AIDC 구축 과정에서 수백 대~수천 대의 GPU 서버를 하나의 자원처럼 연결하고 운영할 클러스터 관리 SW가 없어 고가의 외산 솔루션에 의존해야 하는 상황이 발생하고 있다. 문제의 본질은 GPU와 데이터센터를 얼마나 많이 확보하느냐가 아니라 이를 갖추고도 자원 배분과 운영 최적화의 주도권을 우리 기술로 확보하지 못한다는 데 있다. AI 강국으로 가기 위해서는 장비를 들여오는 데 그치지 않고 이를 실제 서비스로 전환할 인프라 SW 역량을 축적해야 한다. AI는 컴퓨터 과학 또는 SW의 한 분야로 학습과 추론을 풀기 위한 알고리즘과 데이터로 구성되는 분야다. 그동안 정부는 SW 강국, 인재 양성을 강조하며 이를 실현하기 위해 많은 노력을 기울여왔다. SW가 AI를 탄생시킨 핵심 기술임에도 AI와 AX 시대가 도래하면서 그 원천인 SW 기술을 외면하는 모순적 현상이 발생하고 있다. 클라우드 컴퓨팅 기술도 이미 완성된 기술 또는 글로벌 빅테크가 주도하는 분야로 간주해 AI 클라우드 분야 외에는 정부 투자가 축소되고 있고 SW 분야의 정부 투자도 거의 사라지고 있는 상황이다. 서비스 계층과 물리자원 계층에 몸담고 있는 전문가나 기업들은 전혀 관심을 보이지도 않고 무시하고 있지만 외산이 장악했던 영역에서 국산 SW로 자립 기반을 다져 온 경험이 있는 한국 SW 업계는 충분한 성공 잠재력을 가지고 있다. 실제 공공뿐 아니라 제조‧통신‧금융 등 주요 산업 현장에서 서버 가상화와 AI 클라우드 SW의 국산 전환이 본격화되고 있다. 대규모 데이터센터와 핵심 업무 시스템에서 외산 인프라 SW 환경을 국산 SW로 전환해 운영하는 사례는 국내 인프라 SW가 물리자원의 활용 효율을 높이고 성능을 극대화하며 안정적인 서비스 운영을 뒷받침할 수 있음을 보여준다. 이는 AI 인프라 SW 역시 우리가 주도적으로 키워갈 수 있는 전략 영역임을 시사한다. 그럼에도 한국의 AI 인프라 SW 시장이 브이엠웨어(VMware), AWS, 애저(Azure)와 같은 글로벌 솔루션의 거대한 파도에 노출되어 있는 현실에 국내 SW 업계는 노심초사할 수밖에 없다. 유럽, 중국, 일본은 빅테크의 쓰나미에 대비해 열심히 둑을 쌓고 체질을 강화하고 있는데 우리는 너무나 방심하고 있어 풍전등화 상황이다. 지금이라도 서비스 계층과 물리자원 계층을 연결하는 자원 추상화 제어 계층, 즉 AI 인프라 SW 관련 산업과 기술 자립화에 대한 과감한 투자를 통해 AI 3강과 AI 자주권 실현의 필수 조건인 AI 풀스택의 균형적인 발전을 반드시 이루어야 한다. 나연묵 단국대학교 AI융합연구원 원장
  • STEG, LG AI연구원과 B2B AI 사업 협력 파트너십 체결하고 AI SM 강화

    STEG, LG AI연구원과 B2B AI 사업 협력 파트너십 체결하고 AI SM 강화

    • STEG의 플랫폼과 솔루션에 LG AI연구원의 엑사원 결합해 AI 전환 선도• 공공·금융·엔터프라이즈 환경에서 즉시 활용 가능한 AI SM(자율형 운영) 제공 계획 IT서비스관리(ITSM) 전문기업 에스티이지(대표 임현길, 이하 STEG)는 LG AI연구원과 B2B 인공지능(AI) 사업 협력을 위한 전략적 파트너십을 체결했다고 27일 밝혔다. 이번 협력은 기업 및 기관의 AI 활용도를 제고하고 국내 AI 생태계를 확대하기 위해 추진됐다. 양사는 STEG의 플랫폼과 솔루션에 LG AI연구원의 초거대 모델 ‘엑사원 4.0’을 결합해 AI 전환을 진행할 방침이다. 엑사원 4.0은 빠른 답변에 강점이 있는 언어 모델(LLM)과 문제 해결 능력을 갖춘 추론 AI 모델을 융합한 하이브리드 AI 모델이다. 해당 모델은 글로벌 AI 지수 평가에서 전 세계 11위, 국내 1위의 순위를 기록한 바 있다. STEG는 먼저 ITSM 솔루션 ‘E-GENE™ ITSM’에 엑사원을 적용해 서비스 요청(SR) 처리, 장애 대응 등 워크플로우 전반에 걸쳐 AI SM(Service Management)을 강화한다. 특히 자연어 이해, 지식 기반 응답, 문제 해결 등 엑사원의 강점을 살려 공공·금융·엔터프라이즈 환경에서 즉시 활용 가능한 자율형 운영을 제공한다는 계획이다. 나아가 노코드 워크플로우 플랫폼 ‘E-GENE™’은 물론, 인사·총무·재무·영업 등 비 IT 업무를 포괄하는 ESM(엔터프라이즈 서비스 관리)까지 AI SM 운영을 단계적으로 확장한다. 임현길 STEG 대표는 “STEG의 AI SM은 AI 도입률과 생산성을 측정할 수 있으며, 데이터와 인사이트를 바탕으로 실질적 AI 전환을 가능하게 한다”며 “LG AI연구원의 독보적인 AI 기술과 결합해 기업의 IT 운영 지능을 고도화할 것”이라고 밝혔다.
  • KDD 2026서 웹3 AI 성능 평가 논문 채택…‘디마인드 벤치마크’ 공개

    KDD 2026서 웹3 AI 성능 평가 논문 채택…‘디마인드 벤치마크’ 공개

    블록체인 특화 LLM 평가 체계 제시...“범용 AI 고성능에도 Web3 전문 추론은 과제로 남아”싱가포르 오픈소스 AI 연구기관 DMind AI가 아시아 연구진과 공동으로 개발한 ‘디마인드 벤치마크(DMind Benchmark)’ 논문이 국제 학술대회 ‘KDD 2026(ACM SIGKDD)’의 데이터셋 및 벤치마크(Datasets & Benchmarks) 트랙에 채택됐다고 26일 밝혔다. 본 학술대회는 오는 8월 9일부터 13일까지 제주에서 개최된다. 이번 연구는 웹3(Web3) 및 블록체인 분야에서 대형언어모델(LLM)의 성능을 정량적으로 측정하기 위한 평가 체계를 제안한 것이 핵심이다. 연구팀은 기존의 범용 AI 평가 방식에서 벗어나 블록체인 산업 특화 과제를 중심으로 모델의 실무 활용성과 전문 추론 능력을 검증하는 데 중점을 두었다고 설명했다. 최근 글로벌 AI 업계에서는 특정 산업 분야에 최적화된 도메인 특화 AI 개발 경쟁이 확대되는 흐름이다. 특히 금융·보안 분야에서는 단순 언어 생성 능력보다 정확한 추론과 안정성이 중요해지면서 전문 벤치마크 구축 필요성도 커지고 있다. 디마인드 벤치마크는 블록체인 기초 개념, 인프라, 스마트 컨트랙트, 탈중앙화 금융(DeFi), 탈중앙화 자율조직(DAO), 대체불가토큰(NFT), 토큰 이코노믹스, 밈코인, 보안 취약점 등 총 9개 도메인을 평가 범주로 설정했다. 단순 객관식 형태를 넘어 스마트 컨트랙트 디버깅, 온체인 수치 추론 등 실제 환경 기반 문제도 포함한 점이 특징이다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 주요 AI 모델을 대상으로 성능을 비교 평가했다. 평가 결과 GPT-5 Medium이 전체 평균 77.63점으로 가장 높은 점수를 기록했지만, 토큰 이코노믹스와 보안 취약점 분야에서는 다수 모델이 낮은 성능을 보였다고 밝혔다. 연구진은 현재 상용화된 주요 AI 모델들도 Web3 전문 추론 영역에서는 여전히 한계를 드러내고 있다고 분석했다. 특히 복잡한 토큰 구조 해석이나 스마트 컨트랙트 보안 관련 문제에서는 모델 간 성능 편차가 크게 나타났다고 설명했다. 비용 대비 성능 측면에서는 일부 오픈소스 모델의 경쟁력도 확인됐다는 평가다. 연구에 따르면 DMind의 32B 파라미터 오픈소스 모델은 Web3 특화 과제에서 제한된 비용으로도 높은 성능을 기록했다. 특히 토큰 이코노믹스와 보안 영역에서는 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였다고 연구팀은 밝혔다. 업계에서는 생성형 AI가 금융·디지털 자산 분야로 확대 적용되면서 스마트 컨트랙트 검증이나 온체인 데이터 분석 자동화 수요도 증가하는 추세다. 이에 따라 산업 특화 AI 모델의 신뢰성과 검증 체계 중요성도 함께 커지고 있다는 분석이 나온다. 싱가포르 경영대학교 정보시스템학과 주페이다(ZHU Feida) 교수는 “이번 연구는 Web3 AI 분야에서 측정 가능한 평가 기준을 제시했다는 점에서 의미가 있다”며 “향후 해당 분야 AI 기술의 성능과 안정성 검증 체계 구축에도 활용될 수 있을 것”이라고 말했다. 한편 DMind 모델은 현재 AI 금융 플랫폼 ‘Minara(미나라)’에 적용돼 운영 중이다. 연구팀은 개인 투자자와 디지털 자산 보유자를 위한 재무 비서 기능 등에 해당 기술이 활용되고 있다고 설명했다.
  • 비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

    비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

    GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 달성 국내 인공지능(AI) 스타트업 비드래프트(VIDraft Inc.·대표 김민식)가 추가 GPU 학습 과정을 거치지 않고도 최상위권 추론 성능을 도출하는 대형언어모델(LLM) 프레임워크 기술을 공개했다. 비드래프트는 자사가 개발한 ‘Darwin Family’ 계열 모델의 핵심 기술을 담은 연구 논문을 공개하고, 관련 핵심 기술 3건에 대한 국내 특허를 출원했다고 밝혔다. 이번에 등록된 논문은 「Darwin Family: MRI Trust Weighted Evolutionary Merging for Training Free Scaling of Language Model Reasoning」으로, 현재 Hugging Face Papers와 오픈소스 아카이브 arXiv(등록번호 2605.14386)에 게재된 상태다. 본 연구에는 비드래프트 소속 연구원 7명이 공동 저자로 참여 명단을 올렸다. Darwin Family는 기존 AI 개발 과정에서 필수로 여겨졌던 추가 학습(Post training) 없이 모델 병합만으로 고성능 추론 능력을 구현하는 새로운 방식의 AI 모델 프레임워크다. 핵심 기술은 MRI Trust Fusion, 14차원 적응형 병합 게놈(Merge Genome), 아키텍처 매퍼(Architecture Mapper) 등 세 가지로 구성된다. MRI Trust Fusion은 모델 각 레이어의 기능적 중요도를 분석한 뒤 신뢰 파라미터를 기반으로 동적 융합을 수행하는 기술이다. 이를 통해 GPQA 정확도를 기존 방식 대비 2.5%포인트 향상시켰다는 설명이다. 또한 14차원 병합 게놈 기술은 어텐션과 FFN, 임베딩 등 모델 내부 구성 요소를 세밀하게 제어하며 경사하강법 없이 진화 탐색만으로 최적 병합 전략을 자동 탐색한다. 아키텍처 매퍼는 Transformer와 Mamba 등 서로 다른 AI 구조 간 결합을 가능하게 하는 기술로, 추가 재학습 없이 이종 모델 교배를 구현한다. Darwin Family는 Hugging Face가 주관하는 AI 성능 벤치마크인 ‘GPQA Diamond(Graduate Level Google Proof Q&A)’ 평가에서 글로벌 3위를 기록했다. 해당 지표는 박사 학위 소지자 수준의 과학적 추론 능력을 평가하는 대표적 기술 지표다. 비드래프트는 별도의 파인튜닝이나 사후 학습을 거치지 않고도 수백억 파라미터 규모의 Fully Trained 모델들의 성능 데이터 수준을 상회했으며, 최소 4B부터 최대 35B 규모에 이르기까지 다양한 모델 세그먼트 구간에서 부모 모델 대비 실질적 성능 향상 수치를 검증했다고 밝혔다. 국내 정량 평가 지표에서도 상위 순위를 점유하고 있다. 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관·운영하는 ‘K-AI 리더보드’에서는 Darwin 기반 모델들이 2위, 3위, 4위, 5위, 7위, 8위를 동시에 기록 중인 것으로 집계됐다. 특히 현재 1위 모델과의 데이터 점수 격차는 0.001점 범위 내에 있는 것으로 확인됐다. 비드래프트에 따르면 공식 모델 공개 이후 45일 만에 파생·양자화 레포지터리 88개와 개별 모델 파일 473개가 생성됐다. GGUF 양자화 분야 개발자 bartowski와 mradermacher 등 글로벌 오픈소스 커뮤니티 개발자들도 Darwin 모델군 배포와 최적화 작업에 참여하고 있다. 현재 Darwin 모델은 Windows·Linux·Mac 환경의 GGUF 포맷을 비롯해 Apple MLX, AWQ, NVIDIA Blackwell 전용 NVfp4 등 다양한 플랫폼을 지원한다. 김민식 비드래프트 대표는 “Darwin 생태계의 확산 속도와 규모는 국내 AI 모델 역사에서도 보기 드문 수준”이라며 “세계 최상위권 양자화 개발자들의 자발적 참여와 폭넓은 플랫폼 지원 체계를 기반으로 글로벌 AI 표준 생태계로 진입하고 있다”고 밝혔다. 한편, 이번 연구는 과학기술정보통신부 재원으로 수행된 ‘AI컴퓨팅자원활용기반강화(GPU 임차 지원) 사용자 지원사업’의 지원을 받아 진행됐다.
  • 오케스트로, 국방 AI 핵심기술 개발 참여… 유·무인체계 자율협업 지능체계 구축

    오케스트로, 국방 AI 핵심기술 개발 참여… 유·무인체계 자율협업 지능체계 구축

    - 통신 단절·저대역폭 환경에서도 임무 지속… DIL 환경 대응 자율협업 지능체계 개발- 오케스트로, 계층형 멀티에이전트 기반 이동형 엣지 운용구조 개발 전담- 분산 지휘형 유·무인 복합체계 구현 기반 마련… 군 실증·후속 사업 연계 기대 AI·클라우드 소프트웨어 기업 오케스트로(대표 김범재, 김영광)가 과학기술정보통신부와 정보통신기획평가원(IITP) 주관 국방인공지능핵심기술개발사업의 공동연구기관으로 참여한다고 14일 밝혔다. 과제명은 ‘불안정한 네트워크(DIL) 환경에서 강건한 이동형 엣지-클라우드 기반 유·무인체계 자율협업 지능체계 개발’이다. 이번 사업은 안보 위협과 급변하는 미래 전장 환경에 대응하기 위한 국방 ICT R&D 사업의 일환으로 추진된다. 해당 과제는 통신 인프라가 열악하거나 네트워크 단절과 지연이 반복되는 전술 환경(DIL, Disconnected, Intermittent, Low-bandwidth)에서도 유·무인 복합전투체계(MUM-T)의 자율협업을 지원하는 지능체계 개발을 목표로 한다. 중앙집중형 지휘통제 방식에서 벗어나 전술 현장 중심의 분산형 엣지 지능체계로 전환하고, 통신이 끊긴 상황에서도 임무를 지속하며 복구 이후에는 중단된 임무를 재개할 수 있도록 하는 데 초점을 두고 있다. 최근 미국을 비롯한 주요국이 전장 AI와 엣지 기반 전술 체계 도입을 확대하면서 팔란티어 등 글로벌 국방 AI·데이터 소프트웨어 기업의 역할도 커지고 있다. 이번 과제는 오케스트로의 클라우드·엣지 운용 기술을 미래 전장 환경에 적용하고, 유·무인 복합체계의 자율협업을 뒷받침하는 국산 소프트웨어 기반을 마련한다는 점에서 의미가 있다. 오케스트로는 이번 과제에서 ‘계층형 멀티에이전트 기반 이동형 엣지 운용구조 개발’을 전담한다. 쿠버네티스(Kubernetes, K8s) 기반 오케스트레이션 기술로 클라우드와 엣지 환경을 통합 관리하고, EdgeMesh와 CloudCore를 활용해 엣지 노드 간 P2P 통신과 서비스 디스커버리를 구현할 계획이다. 이어 AI·ML 모델을 엣지에 배포·실행해 실시간 추론이 가능한 지능형 운용체계 고도화도 함께 추진한다. 오케스트로의 이동형 엣지 운용 기술과 책임연구기관인 ETRI의 분산·연합학습, 증분학습, 네트워크 대응 기술이 결합되면 통신 불능 상태에서도 체계 운영의 복원력을 높일 수 있을 것으로 기대된다. 중앙 클라우드 지원 없이도 엣지 클라우드와 이기종 전장 자산을 연계해 유·무인 복합체계의 자율협업과 분산 지휘형 임무 수행을 지원하는 데 기여할 전망이다. 개발된 기술은 군 실증을 거쳐 후속 국방 사업과 연계될 전망이다. 주요 수요처로는 국방부, 합동참모본부, 육군본부 미래혁신센터, 방위사업청 등이 명시됐으며, 드론봇 전투단, 무인전투차량 시범여단, 차세대 지휘통제체계(NGC2) 개발 사업 등과의 연동이 검토되고 있다. 김범재 오케스트로 대표는 “이번 과제는 통신 단절과 저대역폭 등 제약이 큰 전술 환경에서도 자율협업 체계를 구현할 수 있는 기반을 마련한다는 점에서 의미가 크다”며 “클라우드 네이티브 기술과 엣지 운용 역량을 국방 분야에도 적용해, 국산 소프트웨어가 다양한 현장에서 활용될 수 있도록 기술 경쟁력을 지속적으로 강화할 것”이라고 밝혔다.
  • 한국인공지능협회, 창립 10주년 ‘체인저 시대’ 선언

    한국인공지능협회, 창립 10주년 ‘체인저 시대’ 선언

    (사)한국인공지능협회가 창립 10주년을 맞아 ‘한국형 AI 전략의 방향’을 제시해 눈길을 끌었다. AI협회는 지난 7일 COEX에서 ‘10주년 비전 선포식’을 통해 단순 산업 지원 조직을 넘어 대한민국 AI 생태계의 미래를 설계하는 ‘기술·산업 플랫폼’으로의 전환을 공식 선언했다. 핵심 화두는 ‘체인저(Changer)’와 ‘오픈월드(Open World)’였다. 협회가 새롭게 정의한 체인저는 변화에 적응하는 수동적 존재가 아니다. AI를 활용해 사회적 난제를 해결하고 새로운 시대 질서를 만들어가는 능동적 주체를 의미한다. 여기에는 인간뿐 아니라 기업·기관·AI 에이전트·로봇까지 포함된다. 김현철 AI협회장은 “AI는 이제 단순한 생산성 향상 도구를 넘어 문명의 운영 원리를 다시 쓰는 단계로 진입하고 있다”며 “체인저의 개념 역시 인간 중심을 넘어 지능화된 모든 존재로 확장될 것”이라고 밝혔다. 이번 비전 발표에서 가장 눈길을 끈 대목은 ‘실세계(Real-world) AI’ 전략이다. 김 회장은 ”그동안 글로벌 AI 경쟁은 인터넷 기반 텍스트 데이터와 거대언어모델(LLM)을 중심으로 전개돼 왔다“면서 ”앞으로의 승부처는 공장·도시·물류·에너지·로봇 등 현실 공간에서 발생하는 인과관계와 행동 데이터를 이해하고 연산하는 영역으로 이동할 것이다“고 밝혔다. 김 회장은 특히 ”한국이 이 분야에서 독자적 경쟁력을 확보할 가능성이 높다“며 ”미국 빅테크 기업들이 인터넷 데이터를 사실상 장악한 반면, 한국은 반도체·자동차·조선·철강·배터리 등 세계 최고 수준의 제조 산업 현장에서 축적되는 방대한 실세계 데이터를 보유하고 있기 때문이다“고 강조했다. 김 회장은 이어 “인터넷 데이터는 글로벌 플랫폼 기업 중심으로 재편됐지만 제조 공정과 산업 현장에서 발생하는 행동 데이터는 한국이 세계적 우위를 가진 영역”이라며 “실세계 AI 시대에는 제조 강국의 경쟁력이 AI 경쟁력으로 직결될 가능성이 크다”고 설명했다. AI협회는 이를 기반으로 현실 세계의 물리 법칙과 인과 구조를 학습하는 ‘월드모델(World Model)’ 개발에 본격 착수할 계획이다. 월드모델은 로봇·자율주행·산업 자동화 등 차세대 피지컬 AI의 핵심 기술로 꼽힌다. 이를 실행하기 위한 조직 개편도 병행된다. 우선 새롭게 출범하는 ‘오픈월드 인텔리전스 연구소’는 실세계 행동 데이터와 월드모델, 피지컬 AI 연구를 총괄하는 핵심 조직 역할을 맡는다. 협회는 이를 통해 특정 빅테크 기업에 종속되지 않는 ‘인류에 의한 AGI(일반인공지능)’ 기반을 구축하겠다는 구상이다. ‘AIDC 추진위원회’는 분산형 데이터센터와 추론 인프라 구축을 담당한다. 지역 산업과 AI 연산 자원을 연결해 ‘지역의 문제를 지역의 지능으로 해결하는 구조’를 만드는 것이 목표다. 또 ‘AGSF’는 산업·안보·외교를 아우르는 국가 AI 전략 싱크탱크 역할을 수행하고, ‘CAIO 포럼’은 기업의 AI 전환(AX)을 이끄는 실행 리더 조직으로 운영된다. 협회는 이와 함께 DID(탈중앙화 신원증명) 기반의 ‘체인저 DID’, 온라인 문제 해결 플랫폼 ‘체인저스(Changers)’, 글로벌 문제 해결 프로젝트인 ‘AI 올림픽’ 등도 병행 추진할 예정이다. AI협회가 최종적으로 제시한 ‘오픈월드’는 AI로 증강된 개인들이 사회 문제 해결에 참여하고, 그 기여가 데이터 자산으로 축적되는 새로운 문명 체제를 뜻한다. 지능을 소수 플랫폼 기업의 독점 자산이 아니라 인류 전체의 공공 역량으로 확장하겠다는 구상이다.
  • 오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    - 112.5억 원 규모 연구개발 착수… 국산 AI 반도체 생태계 확산 주도- 국산 NPU·PIM 기반 클라우드 SW 스택 개발… GPU 중심 인프라 한계 극복- AI 모델 허브 구축… 최적화 모델 1,000개 이상 확보 목표 AI·클라우드 소프트웨어 전문 기업 오케스트로(대표 김범재, 김영광)는 과학기술정보통신부와 정보통신기획평가원(IITP)이 주관하는 ‘AI 반도체 특화 클라우드 네이티브 SW 스택 및 모델 허브 기술 개발’ 과제의 주관기관으로 선정됐다고 8일 밝혔다. 이번 연구개발 사업의 총규모는 112억 5000만원으로, 2026년부터 2029년까지 4년간 수행될 예정이다. 본 과제는 국산 NPU(신경망처리장치)와 PIM(지능형 메모리) 등 차세대 AI 가속기가 범용 클라우드 환경에서 기능할 수 있도록 클라우드 기반 운영 체계를 구축하는 것이 목적이다. 이를 통해 국산 AI 반도체의 생태계를 확장하고 활용도를 높이는 체계를 마련할 방침이다. 오케스트로는 이번 과제를 수행하며 AI 반도체 전용 클라우드 네이티브 SW 스택의 기술 수준을 높인다. 세부 개발 항목에는 ▲컨테이너 런타임 인터페이스(CRI) 호환 기술 ▲가속기 자원의 직접 접근을 지원하는 패스스루(Pass-through) 기술 ▲마이크로서비스 아키텍처(MSA) 프레임워크 등이 포함된다. 이는 기존 GPU 중심 인프라의 구조적 특성을 보완하고, 국산 NPU 자원을 유연하게 할당·운영할 수 있는 표준 체계를 수립하기 위함이다. 이와 함께 국산 AI 반도체 기반 서비스 확산을 위해 학습·추론 모델을 손쉽게 등록·배포할 수 있는 ‘AI 모델 허브’ 플랫폼도 구축한다. 모델 컨테이너화 자동화 기술과 메타데이터 관리 체계를 기반으로 운영될 예정이며, 과제 종료 시점까지 1000개 이상의 최적화 모델 확보를 목표로 한다. 특히 최근 수요가 빠르게 증가하고 있는 초거대 언어 모델(LLM) 실증 사례를 확보해 상용화 가능성을 검증한다. 국내 중소·벤처기업이 고가의 외산 GPU 의존도를 낮추고, 국산 AI 반도체 기반의 고성능 서비스를 보다 신속하게 개발·출시할 수 있도록 지원할 방침이다. 이번 연구 성과는 정부가 추진 중인 ‘K-클라우드 프로젝트’와 2026년부터 본격화되는 ‘국가 AI 컴퓨팅 인프라’ 구축 사업과 연계돼 실제 데이터센터 운영 환경에 적용될 예정이다. 오케스트로는 커널 레벨의 정밀 모니터링과 분산 추적 기술을 통합해 AI 워크로드 예측 정확도를 글로벌 최고 수준인 99%까지 끌어올리고, 대규모 AI 서비스 운영에 필요한 안정성과 신뢰성을 입증할 계획이다. 김범재 오케스트로 대표는 “이번 과제는 국산 AI 반도체가 글로벌 시장에서 경쟁력을 확보하는 데 필요한 핵심 소프트웨어 기반을 마련한다는 점에서 의미가 크다”며 “하드웨어와 소프트웨어가 유기적으로 결합되는 AI 컴퓨팅 환경을 구현해 국내 AI 인프라 자립도를 높이고, 국산 AI 반도체 생태계 확산에 기여하겠다”고 밝혔다.
  • “침투해” 한마디에 다 뚫었다… AI보안 판 뒤엎은 미토스 쇼크

    “침투해” 한마디에 다 뚫었다… AI보안 판 뒤엎은 미토스 쇼크

    스스로 허점 찾아 침투하는 AI‘최강 보안’ OS 27년 된 버그 찾아내기존 500만번 놓친 취약점도 포착해킹 재현 평가서도 압도적 성적글로벌 금융 안보 위기美 재무부·연준, 월가와 긴급회의영국·캐나다 등도 대책 마련 나서금감원, 금융사들과 대응 방안 점검 전세계 최상위 테크 전문가들이 철통 보안이라 자부하며 27년 동안 검증해온 운영체제(OS)의 방어선이 인공지능(AI) 앞에서 단 몇 시간 만에 무너졌다. 난공불락의 성벽을 무너뜨린 주인공은 AI 스타트업 앤스로픽이 최근 공개한 차세대 모델 ‘미토스’(Mythos)다. 보안 체계의 붕괴를 우려한 미국, 캐나다, 영국 등은 금융기관들과 보안 점검 및 긴급 협의에 나섰고 우리나라 금융감독원도 대응 방안을 점검했다. 13일 AI 업계에 따르면 미토스는 복잡한 소프트웨어의 설계 구조를 인간 전문가 수준으로 추론해 보안 취약점을 스스로 찾아내고 침투 경로까지 설계하는 이른바 ‘자율형 보안 지능’이다. 미토스의 위력은 보안 결함을 즉각 해킹 도구로 무기화하는 자율성에 있다. 사람이 침투 경로를 지시해야 했던 과거 모델과 달리, 미토스는 “약점을 찾아 침투하라”는 단 한 줄의 명령만으로 취약점 분석부터 실제 공격 코드(익스플로잇) 제작까지 전 과정을 스스로 완수한다. 앤스로픽에 따르면 미토스는 보안이 강력하기로 유명한 ‘오픈BSD’에서 27년 된 버그를 찾아냈고, 기존 도구가 500만 번 넘게 놓쳤던 취약점까지 단번에 포착했다. 특히 격리된 가상 환경을 스스로 탈출해 활동 흔적을 지우는 등 통제를 벗어난 지능을 보이기도 했다. 이런 파괴력의 본질은 AI가 단순히 데이터를 찾는 수준을 넘어 스스로 허점을 찾아 ‘사고’하고 ‘침투’하는 단계에 진입했음을 의미한다. 미토스는 박사급 전문가용 추론 시험인 ‘인류의 마지막 시험’(HLE)에서 사상 최초로 50%의 벽을 넘긴 56.8%를 기록했으며, 해킹 재현 평가에서도 83.1%라는 압도적 성적을 거뒀다. 소프트웨어 설계 구조를 꿰뚫어 보고 파괴적인 결함을 스스로 추론해낼 수 있는 ‘지능형 저격수’로 진화한 것이다. 글로벌 금융계는 안보 위기에 직면하게 됐다. 한 곳의 구멍만 뚫려도 결제와 송금이 얽힌 거대한 인프라 전체가 마비될 위험이 크기 때문이다. 미국 재무부와 연준(Fed) 수뇌부는 지난 7일(현지시간) 월가 주요 은행 최고경영자(CEO)들을 긴급 소집해 금융 시스템 방어를 위해 미토스를 활용하라고 강력 권고했다. 해커들이 미토스급 AI를 확보하기 전에 금융권이 먼저 ‘지능형 방패’를 구축하라는 취지다. JD 밴스 미 부통령과 스콧 베센트 재무장관은 주요 AI 기업 CEO들과 비공개 회의를 열어 사이버 공격 대응책을 점검했고, 백악관은 국가 핵심 시설의 보안 취약성에 대해 전수 조사에 착수했다. 12일에는 ‘프로젝트 글래스윙’이 공식 출범했다. 이는 글로벌 빅테크 및 금융사 50여개가 참여해 해커보다 먼저 시스템의 구멍을 찾아 메우겠다는 ‘선제적 방어 카르텔’ 성격이다. 파이낸셜타임스는 영국 금융 규제 당국이 정부 보안 기관 및 주요 은행들과 긴급 회담을 열었다고 보도했고 블룸버그통신은 캐나다에서도 중앙은행과 금융사들이 관련 문제로 회동했다고 전했다. 글로벌 안보 지형이 급변하자 금융감독원은 이날 국내 은행 등 주요 금융사 정보보안 담당 실무자들을 긴급 소집해 AI발 보안 위협과 대응 방안을 점검했다. 글로벌 금융 시스템이 촘촘히 연결된 만큼, 미토스가 발견한 수천 개의 결함이 국내 금융망으로 전이되어 예금 인출 사태(뱅크런)나 유동성 위기를 초래할 시나리오를 선제적으로 살피기 위한 행보로 풀이된다. 전문가들은 AI 정책의 무게중심을 ‘산업 육성’에서 ‘국가 리스크 관리’로 즉시 재정립해야 한다고 조언했다. 한 보안 전문가는 “AI가 취약점 탐지와 공격 자동화를 동시에 수행하면서 보안 정책은 활용 전략보다 우선순위에 놓여야 하는 항목이 됐다”며 “금융권 대상 AI 공격 시나리오 구축과 범정부 차원의 통합 대응 체계 마련이 시급하다”고 강조했다.
  • SKT·Arm·리벨리온, ‘AI 동맹’ 결성…“추론 최적화 데이터센터 잡는다”

    SKT·Arm·리벨리온, ‘AI 동맹’ 결성…“추론 최적화 데이터센터 잡는다”

    ‘전기 먹는 하마’ GPU 대신 NPU ‘관제탑 CPU-타격대 NPU’ 원팀 구축 글로벌 ‘소버린 AI’ 시장 정조준 SK텔레콤과 영국 반도체 설계회사 Arm, 국내 인공지능(AI) 반도체 선두주자 리벨리온이 차세대 AI 데이터센터(AIDC) 시장 선점을 위해 손을 맞잡았다. AI 산업의 무게중심이 대규모 학습에서 실제 서비스 단계인 ‘추론’으로 급격히 이동함에 따라, 저전력·고효율 인프라를 무기로 글로벌 시장을 공략하겠다는 포석이다. SK텔레콤과 Arm, 리벨리온 3사는 차세대 AI 인프라 혁신을 위한 전략적 파트너십(MOU)을 체결했다고 10일 밝혔다. 이번 협력의 핵심은 Arm의 데이터센터용 중앙처리장치(CPU)인 ‘Arm AGI CPU’와 리벨리온이 오는 3분기 출시 예정인 차세대 신경망처리장치(NPU) ‘리벨카드(RebelCard™)’를 하나의 서버에 통합하는 것이다. 그동안 AI 연산은 그래픽처리장치(GPU)가 주도해왔으나, 365일 24시간 가동되는 AI 추론 서비스 특성상 GPU의 막대한 전력 소모와 비용은 데이터센터 운영의 최대 걸림돌로 지목되어 왔다. 3사가 내놓은 해법은 ‘이종 컴퓨팅’(Heterogeneous Computing)이다. 시스템 운영과 데이터 관리를 총괄하는 ‘관제탑’ 역할의 CPU와, 실제 AI 추론 연산을 전담하는 ‘타격대’ 역할의 리벨리온 NPU를 결합해 효율을 극대화한다는 전략이다. 특히 리벨카드는 한국 최초로 서버급 고성능 AI 반도체인 ‘리벨100’을 탑재해 아시아 유일의 페타플롭스(PetaFLOPS)급 연산 능력을 갖췄다. 이번 연합은 단순히 기술 협력에 그치지 않고 데이터 주권 확보를 위한 독자 AI인 ‘소버린 AI’ 및 글로벌 통신사 특화 인프라 시장을 정조준한다. 국가나 기업이 독자적인 AI 인프라를 구축할 때, 성능과 가성비를 동시에 잡은 ‘검증된 패키지’를 공급해 표준을 선점하겠다는 구상이다. 이미 Arm과 리벨리온은 지난 3월 ‘Arm 에브리웨어’ 행사에서 양측의 칩을 결합해 오픈AI의 대규모 언어모델(GPT OSS 120B) 기반 에이전틱 AI 서비스를 실시간 시연하며 상용화 가능성을 입증한 바 있다. SK텔레콤은 이렇게 개발된 서버 설루션을 자사 AIDC에 도입해 실전 검증에 나선다. 특히 SKT가 독자 개발한 AI 파운데이션 모델 ‘에이닷엑스 케이원(A.X K1)’을 해당 인프라에서 직접 운영하며 안정성을 테스트할 계획이다. 이러한 협력 체계는 각 분야의 ‘정점’이 만나 하나의 완성된 설루션을 제안한다는 점에서 시장의 주목을 받고 있다. 오진욱 리벨리온 최고기술책임자(CTO)는 “압도적 성능과 전력 효율을 갖춘 리벨카드가 차세대 AIDC를 지탱하는 핵심 축이 될 것”이라며 “각 분야 전문가들이 ‘원팀’으로 뭉친 이번 사례는 업계에서도 유의미한 이정표”라고 자신감을 내비쳤다. Arm은 범용 인프라로서의 확장성을 강조했다. 에디 라미레즈 Arm 부사장은 “Arm 네오버스 기반 CPU는 대규모 AI 구축에 필수적인 성능을 갖췄다”며 “리벨리온, SKT와 함께 소버린 AI 및 통신 시장에서 실제 작동하는 확장성 있는 인프라를 실현할 것”이라고 말했다. 이재신 SK텔레콤 AI 사업개발 담당은 “추론 최적화 인프라에 독자 파운데이션 모델인 ‘A.X K1’을 얹은 ‘풀 패키지’를 제공할 것”이라며 “이를 통해 글로벌 AIDC 시장에서의 주도권을 확실히 쥐겠다”고 강조했다.
  • 삼성전자 ‘유럽판 챗GPT’ 미스트랄과 협력 나서나

    유럽의 오픈AI로 불리는 프랑스 인공지능(AI) 스타트업 ‘미스트랄 AI’가 삼성전자와 메모리 반도체 협력 방안을 논의했다. 5일 업계에 따르면 에마뉘엘 마크롱 프랑스 대통령의 국빈 방한을 계기로 한국을 찾은 아르튀르 멘슈 최고경영자(CEO) 등 미스트랄 AI 경영진은 지난 2일 삼성전자 화성캠퍼스에서 전영현 삼성전자 대표이사 겸 디바이스솔루션(DS) 부문장(부회장) 등을 만났다. 미스트랄 AI는 구글 딥마인드와 메타 출신 인력들이 2023년 설립했다. 오픈AI의 GPT-4에 필적하는 성능을 갖춘 대형언어모델(LLM) ‘미스트랄 라지(Large)’ 및 챗봇 ‘르 샤(Le Chat)’를 선보였다. 미스트랄 AI는 미국·중국 테크 기업에 의존하지 않는 유럽의 ‘소버린 AI(기술 주권)’를 추구한다. 미스트랄 AI는 프랑스 파리 인근에 건설 중인 신규 데이터센터를 통해 AI 모델 학습 및 추론 서비스를 제공할 예정인데, 삼성전자가 여기에 탑재될 고성능 메모리를 공급할 것이라는 관측이 나온다. 업계 관계자는 “이번 삼성전자 방문은 자사 모델 운영 및 AI 인프라 구축에 필요한 반도체 경쟁력을 강화하려는 행보”라고 말했다.
  • ‘2026년 지속가능한 AI 전환 전략’ 발표

    ‘2026년 지속가능한 AI 전환 전략’ 발표

    AI·데이터 인프라 솔루션 전문기업 HS효성인포메이션시스템이 기업 환경 변화에 대응하기 위한 ‘2026년 지속가능한 AI 전환 전략’을 발표했다. 25일 HS효성인포메이션시스템에 따르면 이번 전략의 핵심은 크게 네 가지로 구성된다. ‘파트너 에코시스템 강화’, ‘프라이빗 클라우드(Private Cloud) AI 인프라 확대’, ‘HS효성 AI 플랫폼 고도화’, ‘VSP One 데이터 플랫폼 강화’ 등이다. HS효성인포메이션시스템은 GPU 서버, 고성능 스토리지, 저전력 Arm 서버, 데이터 레이크, AIOps 등을 통합한 ‘HS효성 AI 플랫폼’을 통해 구축부터 운영까지 AI 인프라 전 과정을 지원하고 있다. 향후 DataOps, MLOps, LLMOps, AI 에이전트 등 활용 고도화 영역까지 포트폴리오를 확대한다는 계획이다. 또한 AI 연산 최적화를 중심으로 빠르게 진화하는 클라우드 환경에 맞춰 프라이빗 클라우드 기반 AI 인프라 수요에도 대응하고 있다. GPU 자원 관리와 AI 워크로드 운영을 통합한 ‘UCP 프라이빗 클라우드 AI’ 솔루션을 통해 모델 학습부터 추론, 운영까지 지원하는 풀스택 환경을 제공한다. 데이터 인프라 부문에서는 스토리지와 소프트웨어 정의 스토리지를 통합한 ‘VSP One’ 포트폴리오를 중심으로 랜섬웨어 대응과 재해복구 역량을 강화하고 있다.
  • [노명우의 알고리즘 밖에서] AI, 미래의 셜록 홈스가 될 수 있을까

    [노명우의 알고리즘 밖에서] AI, 미래의 셜록 홈스가 될 수 있을까

    영국 런던의 베이커스트리트 221B번지에 다녀온 후 글을 쓴다. 셜록 홈스가 살았다는 이곳은, ‘죄와 벌’ 속 라스콜리니코프가 전당포 노파를 살해할 궁리에 빠져 있던 상트페테르부르크 스톨랴르니 골목 5번지만큼이나 문학적 상상력이 집약된 장소다. 현재 그곳은 셜록 홈스 박물관으로 운영되고 있다. 박물관을 둘러본 후 베이커스트리트 주변을 어슬렁거리며 지하철역 입구의 거대한 홈스 동상을 사진에 담고, 그의 이름을 내건 펍에서 불멸의 인기를 실감했다. 그는 실존하지 않았던 가상의 인물이다. 작가 코넌 도일은 환자가 문을 열고 들어오는 모습만 보고도 병력을 추론해 내던 에든버러대학 시절의 스승 조지프 벨을 모델 삼아 홈스를 형상화했다. 상상의 인물을 빅토리아 시대의 런던이라는 공간 속에 정교하게 배치했기에 팬들은 그가 실존 인물이라 여기기에 이르렀다. 도일이 소설 속에서 홈스를 죽은 것으로 묘사하자, 검은 리본을 달고 그의 죽음을 추모하는 사람이 등장할 정도였다. 21세기에 베이커스트리트를 배회하는 홈스의 팬에게 그는 여전히 탐정 영웅이다. 원작의 지속적 인기로 인해 홈스 시리즈는 수차례 영상화됐다. 드라마 속 홈스는 M60 기관총을 든 근육질 람보와는 사뭇 다르다. 메마른 듯한 몸매에 움푹 파인 볼. 이는 그의 무기가 물리력이 아니라 지성임을 보여 준다. 그를 빅토리아 시대의 영웅으로 만들어 준 요소는 신체적 능력이 아닌 탁월한 추론 능력이기에, 홈스는 ‘미션 임파서블’ 시리즈의 톰 크루즈를 닮은 몸매일 필요가 없다. 고대 헬라스 비극에서 극 전개의 꼬인 매듭을 풀기 위해 기계 장치를 타고 내려오는 신에게 전적으로 의존하는 연출기법을 ‘데우스 엑스 마키나’(Deus Ex Machina)라 한다. 홈스는 기계 장치를 타고 내려온 신처럼 익명성이라는 안개 속에 숨어 있는 범인을 추론으로 색출해 사건을 종결시키는 19세기의 ‘데우스 엑스 마키나’였다. 세월이 한참 흘러 추론이 인간이 아니라 기계의 몫이 된 시대가 됐다. 확률적 추론기계인 인공지능(AI)이 전방위적으로 그것도 예상보다 빠른 속도로 인간 고유의 영역을 대체하자, 등장한 지 몇 년도 지나지 않아 AI는 기계에 대한 인간의 기대와 태도를 바꿔 놓았다. 19세기의 런던 사람들이 경찰이 풀지 못한 사건을 ‘데우스 엑스 마키나’ 홈스에게 의뢰했듯이, 21세기의 인간은 풀지 못하는 과제에 직면하면 추론 기계(Machina) AI에 궁금증 해결과 까다로운 과제 처리를 의뢰한다. 추론의 영웅 홈스의 불멸의 인기에 데이터 기반 추론 기계 AI가 도전장을 던진 셈이다. AI는 인간 홈스를 대신해 미래의 ‘데우스 엑스 마키나’가 될 수 있을까? 하지만 AI가 현실의 모든 질문에 데이터 기반 추론의 힘으로 답을 내려줄 수 있는 전지전능한, 하늘에서 내려온 신(Deus)이 될 수 있는지 여부까지 추론기계에 물을 순 없다. 그 답은 당연히 인간의 몫이다. 이 칼럼은 AI가 당연한 미래라고 주장되는 시대에 인간의 몫을 하려는 시도다. 노명우 아주대 경제정치사회융합학부 교수
  • 엔비디아 천하 끝낸다… MS도 AI칩 독립선언

    엔비디아 천하 끝낸다… MS도 AI칩 독립선언

    구글·아마존도 자체 칩 본격화삼성·SK, HBM 다변화 기회로 글로벌 인공지능(AI) 반도체 시장이 범용 성능을 앞세운 ‘엔비디아 표준’과 비용·전력 효율을 극대화한 ‘빅테크 전용 칩’ 간에 2차 경쟁 국면으로 진입했다. 구글과 아마존에 이어 마이크로소프트(MS)까지 독자 AI 가속기를 공개하며 자체 칩 생태계를 확대한 가운데, SK하이닉스가 MS의 신규 가속기에 고대역폭메모리(HBM)를 단독 공급하는 등 우리나라 반도체 산업의 선전은 계속될 전망된다. MS는 26일(현지시간) 자체 개발한 AI 가속기 ‘마이아 200’을 공개하고 “MS가 지금까지 배포한 추론 시스템 가운데 가장 효율적이며, 현재 운영 중인 최신 시스템 대비 달러당 성능이 30% 더 좋다”고 밝혔다. 마이아200은 대만 TSMC의 3나노 공정을 적용한 주문형 반도체(ASIC) 기반 칩으로, 대규모 AI 추론 작업의 효율을 극대화한다. 마이아 200에는 총 216GB의 5세대 고대역폭 메모리(HBM3E)가 탑재됐고, SK하이닉스가 12단 HBM3E를 단독 공급하는 것으로 알려졌다. 구글과 아마존웹서비스(AWS) 역시 엔비디아 의존도를 낮추기 위한 행보를 이어가고 있다. 구글은 브로드컴과 공동 설계한 텐서처리장치(TPU) ‘트릴리움’을 고도화해 자사 AI 서비스 전반에 적용 중이며, AWS는 AI 학습에 특화된 전용 칩 ‘트레이니엄’을 중심으로 자체 칩 전략을 확대하고 있다. 이들 전용 칩은 범용 연산에 강점을 지닌 GPU와 달리, AI 연산의 핵심인 행렬 계산에 자원을 집중하는 구조로 설계돼 비용과 전력 효율을 크게 끌어올린 것이 특징이다. 엔비디아는 이에 맞서 차세대 플랫폼 ‘루빈(Rubin)’을 통해 기술 격차를 다시 벌리겠다는 전략을 내세우고 있다. 루빈은 차세대 고대역폭 메모리인 HBM4를 기반으로 성능과 확장성을 동시에 강화하는 것이 핵심으로, 자체 AI 칩 확산에 ‘절대 성능’으로 대응하겠다는 구상으로 해석된다. 이 같은 ‘탈 엔비디아’ 흐름은 국내 메모리 반도체 업계에는 오히려 기회로 작용하고 있다. SK하이닉스는 MS의 마이아 200을 비롯해 구글, AWS 등 글로벌 빅테크의 자체 AI 전용 칩으로 HBM 공급처를 빠르게 넓히며 시장 1위의 입지를 공고히 하고 있다. AI 학습에서 추론으로 무게중심이 이동하는 2차 경쟁 국면 역시 고성능 메모리 수요를 확대하는 요인으로 작용하고 있다. 삼성전자는 최근 엔비디아와 AMD가 진행한 HBM4 관련 품질 테스트에서 긍정적인 평가를 받은 것으로 전해졌고, 차세대 제품 양산을 목표로 준비에 속도를 내고 있다.
  • 부산시교육청 10개 공공도서관 학생 문해력·수리력 향상 추진

    부산시교육청 10개 공공도서관 학생 문해력·수리력 향상 추진

    부산시교육청 산하 10개 공공도서관이 학생들의 올바른 독서습관 형성과 문해력·수리력을 향상에 힘을 모은다. 시교육청은 학생 독서 습관 형성과 기초 문해력·수리력 향상을 통한 문제 해결 능력 함양을 위해 10개 공공도서관이 ‘문해력·수리력 읽음 채움 프로젝트’, ‘학생 읽기 다짐 프로젝트’를 추진한다고 14일 밝혔다. ‘문해력·수리력 읽음 채움 프로젝트’는 올해 처음 추진하는 사업으로, 독서 습관 형성 사업과 연계해 학생의 사고력·추론력, 문제해결 능력 향상을 목표로 한다. 이 프로젝트는 ‘읽음’(독서 활동 지원)과 ‘채움’(문해력·수리력 프로그램 지원)으로 운영된다. ‘읽음’을 통해 유아와 학생을 대상으로 하는 문해력·수시력 자료 코너를 운영하고, 북큐레이션·독서토론·체험형 독서 행사 등 다양한 활동을 지원한다. ‘채움’으로는 기초 문해력·수리력 향상을 위한 방과 후·주말 프로그램, 학부모를 대상으로 하는 자녀 교육 특강 등을 오는 3월부터 운영한다 학생 읽기 다짐 프로젝트는 2024년부터 운영 중인 독서 진흥 사업으로 유아부터 중·고교생까지 전 학령을 대상으로 독서 습관 형성을 지원한다. 올해는 운영 기간과 횟수를 확대해 더 많은 학생이 참여할 수 있도록 할 방침이다. 이 프로젝트는 각 가정으로 매월 도서와 접이식 서가를 대여하는 ‘우리 집으로 도서관이 왔어요’, 연 2회 학교급별 목표 권수에 도전하는 ‘도전, 책 읽기’로 구성된다. 도전 책 읽기 1기 참여자 모집은 오는 20일부터 각 도서관별로 진행한다. 부산시교육청 관계자는 “문해력과 수리력은 모든 학습의 출발점이며, 미래 사회를 살아가기 위한 핵심 역량이다. 이번 프로젝트가 학생들이 스스로 생각하고 문제를 해결하는 힘을 기르는 데 실질적 도움이 되길 바란다”라고 말했다.
  • 젠슨 황 “첫 자율주행차 1분기에 출시” 리사 수 “GPU 연산 능력 10배로 향상”

    젠슨 황 “첫 자율주행차 1분기에 출시” 리사 수 “GPU 연산 능력 10배로 향상”

    엔비디아 내년 로보택시 서비스차세대 슈퍼칩 ‘베라 루빈’도 공개AMD 새 GPU ‘MI455X’로 맞불 세계 최대 인공지능(AI) 반도체 기업인 엔비디아가 메르세데스 벤츠와 손잡고 올해 1분기 자율주행차를 출시한다. 또 내년에는 로보택시 서비스를 개시한다. 자율주행차를 앞세워 피지컬 AI의 본격 상용화를 선언한 것이다. 젠슨 황 엔비디아 최고경영자(CEO)는 5일(현지시간) 미국 라스베이거스 퐁텐블로 호텔에서 열린 ‘CES 2026 특별 연설’을 통해 자율주행 차량 플랫폼 ‘알파마요’를 공개한 뒤 “엔비디아가 첫 자율주행 차량을 출시한다. 미국은 1분기, 유럽은 2분기, 아시아는 3~4분기로 예정됐다”고 말했다. 알파마요는 카메라와 각종 센서 입력을 종합해 주변 상황을 이해한 뒤 적합한 운전 결정을 내리는 AI로 신형 메르세데스 벤츠 CLA에 우선 적용된다. 엔비디아는 내년부터 파트너사들과 함께 운전자 개입이 필요하지 않은 레벨4 수준의 자율주행 로보택시도 시험 운영할 계획이다. 황 CEO는 이와 함께 현재 ‘그레이스 블랙웰’(GB)을 잇는 차세대 슈퍼칩 ‘베라 루빈’(VR)을 전격 공개하며 이르면 올해 하반기에 출시한다고 예고했다. ‘베라 루빈 NVL72’는 기존 GB 기반 제품 대비 추론 성능이 5배 뛰어나며, AI 모델이 데이터를 처리하는 토큰당 비용을 10분의1 수준으로 낮췄다. 미국 반도체 기업 AMD의 리사 수 CEO도 이날 라스베이거스 베네시안 호텔에서 기조연설을 통해 신형 GPU ‘인스팅트 MI455X’ 등을 공개하며 엔비디아에 맞불을 놨다. 인스팅트 MI455X GPU는 오픈AI를 비롯한 AI 기업의 데이터 서버를 구축하는 데 사용된다. 수 CEO는 “이전 모델(MI335X)보다 연산 성능이 10배 이상 좋아졌다”고 말했다.
  • 미스터 ‘아틀라스’… “저 공장에 붙었대요”

    미스터 ‘아틀라스’… “저 공장에 붙었대요”

    관절 360도 꺾고, 손엔 촉각 센서… “인간처럼 인간과 일해요”구글 손잡고 제미나이 두뇌 장착2028년 현대차 미국 공장에 투입 현대자동차그룹이 구글의 인공지능(AI) 조직 딥마인드와 손잡고 인간과 로봇이 협업하는 ‘차세대 로보틱스 생태계’를 구축하겠다고 선언했다. 최대 50㎏의 짐을 들고, 손을 뻗으면 2.3m 높이까지 도달하는 AI 로봇 ‘아틀라스’가 2028년부터 현대차 공장에서 직원들과 함께 일한다. 완성차 업체에서 ‘인간·로봇 협업 사회’를 이끌 피지컬 AI 선도기업으로 변신하겠다는 것이다. 현대차그룹은 5일(현지시간) 미국 라스베이거스 만달레이베이 컨벤션센터에서 ‘CES 2026 미디어데이’를 열고 미국 내 로보틱스 계열사 보스턴다이내믹스와 구글 딥마인드가 ‘미래 휴머노이드 기술 개발 가속화를 위한 전략적 파트너십’을 맺었다고 밝혔다. 운동 능력을 가진 보스턴다이내믹스 아틀라스에 지능을 보유한 딥마인드의 AI 모델 제미나이를 결합해 로봇이 인지·추론하고 인간과 자연스럽게 상호작용하도록 하는 구상이다. 현대차그룹은 이를 위해 올해 미국 내에 ‘로봇 메타플랜트 응용센터’(RMAC)를 개소한다. 지난해 세계 최대 반도체 기업 엔비디아와 피지컬 AI 역량 고도화를 위한 업무협약을 체결한 데 이어 글로벌 선도 기업들과 협력 체제를 가속하는 모습이다. 현대차그룹이 이날 최초로 공개한 휴머노이드 로봇 아틀라스는 제조 현장에 투입되는 ‘개발형 모델’과 핵심 기능을 테스트하는 ‘연구형 모델’로 나뉜다. 이날 아틀라스 연구형 모델은 컨벤션센터 무대 왼쪽에서 누웠다가 일어서 중앙으로 걸어 나온 뒤 청중들에게 손을 흔들었다. 이어 무대 앞으로 걸어가 목, 어깨, 허리, 손목 등 여러 관절을 360도로 회전시켰다. 곧바로 바닥에 떨어진 물건을 줍는 시늉을 하고 손을 뻗어 물건을 꺼내는 듯 섬세한 손놀림도 보였다. 무대 오른편으로 걸어가 멈춰 서더니 두 손을 뻗어 무대 끝에 등장한 아틀라스 개발형 모델을 손으로 가리키기도 했다. 가장 구현이 어렵다는 손가락의 섬세한 동작들도 자연스러운 구도로 완벽하게 보여 줬다. 아틀라스 연구형 모델은 360도 회전하는 관절을 갖췄다. 개발형 모델도 56개의 자유도(DoF·독립적으로 움직일 수 있는 방향의 수)를 갖춰 대부분의 관절이 완전히 회전할 수 있고 사람과 유사한 크기의 손에 촉각 센서를 탑재했다. 또 360도 카메라를 통해 모든 방향을 인식할 수 있다. 사람과 비슷한 키 1.9m에 무게 90㎏으로 최대 50㎏의 무게를 들 수 있고 손을 뻗으면 2.3m 높이까지 도달할 수 있다. 내구성이 뛰어나 섭씨 영하 20도에서 영상 40도 환경에서도 완전한 성능을 발휘하고 방수 기능을 갖춰 세척이 가능하다. 대부분의 작업을 하루 이내에 학습하는 능력을 갖췄고, 배터리가 부족해지면 스스로 충전소로 이동해 배터리를 교체하고 즉시 작업을 재개할 수 있도록 설계됐다. 아틀라스는 현대차그룹의 RMAC에서 로봇이 최적의 행동을 자체 설계하는 ‘매핑 기반 학습’을 통해 사전 훈련을 거친 뒤 실제 생산 현장인 미국 조지아주 메타플랜트 아메리카(HMGMA) 공장에 투입돼 실전 데이터를 쌓는다. 로봇이 RMAC에서 학습한 훈련 데이터와 HMGMA에서 학습한 실전 데이터가 순환적 시너지 구조를 거듭해 사람과 함께 일하는 법을 배우고 진화하는 식이다. 현대차그룹은 2028년부터 아틀라스를 HMGMA에서 부품 분류와 같은 쉬운 작업에 투입하고, 2030년부터는 부품 조립까지 작업 범위를 넓혀 단계적으로 국내외 생산 현장 전반으로 확대한다는 방침이다. 아울러 축적된 데이터는 로봇을 넘어 자율주행 기술에도 이식돼 테슬라 등 선두 주자와의 격차를 좁힐 동력이 될 전망이다. 현대차그룹은 내부 계열사 역량을 총결집해 AI 로보틱스 생태계를 조성해 나가겠다는 계획이다. 연구개발, 학습·검증, 양산, 서비스 운영에 이르는 통합 관리 체제를 마련하고 2028년까지 연간 3만대의 로봇 생산 시스템을 구축하겠다는 목표다. 이를 위해 현대차·기아는 제조 인프라, 공정 제어, 생산 데이터 등을 제공하고 현대모비스는 정밀 액추에이터 개발, 현대글로비스는 물류·공급망 흐름 최적화를 담당한다. 현대차그룹은 로봇에 대한 구독 서비스 ‘원스톱 RaaS’도 도입할 계획이다. 장재훈 현대차그룹 부회장은 산업 현장의 로봇 도입으로 인한 일자리 축소 우려에 대해 “로봇은 단순히 노동을 대체하는 것이 아니다”라며 “단순 반복적이거나 위험해서 기피하는 노동에 대해 생산성 있는 로봇을 투입하고 그 로봇과 관련된 새로운 노동이 생겨나는 것이 중요하다”고 설명했다. 경쟁사에 비해 뒤진다고 평가받는 자율주행차 기술과 관련해서는 “글로벌 업체들과 함께함으로써 시장에 확신을 줄 수 있는 부분을 조만간 말씀드릴 수 있고 절대 늦지 않을 것이라고 생각한다”고 했다.
  • 2026 Tech Trend

    2026 Tech Trend

    2026년에는 실험단계였던 첨단기술이 일상 속에서 공존할 전망이다. 인공지능(AI)은 기존의 모델 경쟁을 넘어 인프라 전쟁으로 확대하고, 스마트폰 영역에선 글로벌 ‘접기 대전’이 예상된다. 연이은 개인정보유출 사태로 위기감이 커진 보안 분야에서는 ‘AI 창’ 대 ‘AI 방패’의 승부가 펼쳐질 전망이다. 이런 변화를 감지할 첫 무대는 오는 6일(현지시간) 미국 라스베이거스에서 열리는 CES다. AI 인프라 전쟁뭉쳐라!… 전력부터 칩까지 AI 한꺼번에글로벌 빅테크의 AI 경쟁은 더 이상 모델 성능 향상에만 머물지 않는다. 실제 서비스를 얼마나 안정적으로, 장기간 운영할 수 있냐가 경쟁의 새로운 축이다. 따라서 전력·데이터센터·반도체 등 기초 인프라 구축이 핵심으로 떠오르고 있다. 월스트리트저널(WSJ)은 “AI 투자 경쟁은 소프트웨어를 넘어 데이터센터와 반도체, 전력 인프라로 옮겨가고 있다”며 “추론 비용을 낮추지 못하는 기업은 장기 경쟁에서 밀릴 수밖에 없다”고 짚었다. 영상 생성, 로봇 제어 등 연산량과 전력 소모가 큰 서비스가 상용화 단계에 접어들면서 기존의 전력망과 범용 서버 등으로는 수요를 감당하기 어렵다는 것이다. 이에 구글은 최근 약 7조원을 투입해 에너지 인프라 기업 ‘인터섹트’를 인수했다. 데이터센터 전력을 외부망에만 의존하지 않고, 발전 설비와 데이터센터를 한 부지에 통합해 장기적으로 전력 수급 안정성을 꾀하려는 것이다. 오픈AI 진영이 공공 전력망과 분리된 초대형 데이터센터 프로젝트 ‘스타게이트’를 추진하고, 아마존웹서비스(AWS)가 원전 및 소형모듈원자(SMR) 협력으로 독자적인 전력 공급망 구축에 나선 것도 같은 맥락이다. 삼성전자와 SK하이닉스는 글로벌 AI 인프라 경쟁의 핵심 축으로 부상하고 있다. 양사는 올해 6세대 고대역폭 메모리(HBM4) 양산에 본격 돌입하며, AI 서버의 연산 병목을 해소할 핵심 공급사로 주목받고 있다. 업계에서는 HBM을 포함한 AI 특화 메모리 수요가 가파르게 늘어나면서 범용 D램 중심이던 메모리 시장의 수익 구조가 재편될 것으로 보고 있다. 피지컬 AI붙여라!… 자율주행 등 AI 제품 결합 가속지난해까지 AI가 모니터 속 학습·추론 경쟁에 몰두했다면 올해는 자동차·로봇·생활용품 등과 결합하는 ‘피지컬 AI’가 구체화할 전망이다. 삼정KPMG 경제연구원은 세계 최대 가전·정보기술(IT) 박람회 ‘CES 2026’의 첫 번째 키워드로 ‘피지컬 AI’를 꼽으며 “단순 자동화를 넘어 물리적 환경을 이해·판단·조작하는 AI 디바이스가 다수 공개되고, 제조·건설·물류·서비스 등 다양한 분야에서의 실질적 적용 가능성이 구체적으로 제시될 것”이라고 예상했다. 대표적으로 모빌리티에선 실험 단계였던 자율주행 시장이 올해 크게 확대될 전망이다. 지난해 미국에서 무인 로보택시를 운영한 구글의 자율주행 자회사 ‘웨이모’는 올해 차량 호출 앱 ‘웨이모 원’을 내놓으며 대중을 상대로 서비스를 확대할 예정이다. 중국에선 바이두의 자율주행 자회사 ‘아폴로 고’가 자율주행 레벨4(고도자동화) 수준의 로보택시를 상용화하며 웨이모를 바짝 추격하고 있다. 우리나라의 경우 현대차그룹의 자회사 ‘포티투닷’이 오는 8월 첫 자율주행 실험차 ‘SDV 페이스카’를 공개할 예정이다. 지난해 스마트홈 각축전을 벌였던 가전 분야와 단순 자동화 극복이 과제인 산업 분야에서 기업들은 올해 AI를 탑재한 휴머노이드를 앞다퉈 내놓을 예정이다. LG전자는 CES 2026에서 다섯 손가락을 갖춰 집안일에 최적화된 가전용 휴머노이드 ‘클로이드’를 공개한다. 보스턴다이내믹스도 휴머노이드 ‘아틀라스’를 처음 선보인다. AI가 접목된 웨어러블 기기도 경쟁이 치열할 전망이다. 메타가 지난해 선보인 스마트 안경 ‘레이밴 메타’로 시장을 선점하는 가운데 구글은 올해 중 자사 AI인 ‘제미나이’가 탑재된 스마트 안경을 출시한다. 스마트폰접어라!… 몇 번이든, 차세대 폴더블폰 전쟁스마트폰 시장에서는 대형 화면을 접는 ‘폴더블폰’이 주류 프리미엄 폼팩터(기기 형태)로 자리매김하며 글로벌 싸움이 치열해질 것으로 보인다. 지난해 삼성전자는 두 번 접히는 ‘갤럭시 트라이폴드’를 선보이며 중국 화웨이가 독점하던 트라이폴드 경쟁에 뛰어들었다. 갤럭시 트라이폴드는 360만원이라는 초고가에다 한정된 물량만 시중에 푸는 ‘플래그십’을 펼쳤지만 연일 완판 행진을 했다. 올해는 중국 샤오미와 미국 애플이 트라이폴드 시장에 진입할 것으로 보인다. 샤오미타임 등 외신에 따르면 샤오미는 지난해 세계이동통신사업자연합회(GSMA)에 신제품을 등록했는데, 태블릿 사이즈로 펼쳐지는 트라이폴드형일 가능성이 거론된다. 애플 역시 아이폰18 시리즈와 함께 자사 첫 폴더블폰인 ‘아이폰 폴드’ 모델을 준비 중이다. 양산 막바지인 세부 디자인 조정 단계에 진입한 것으로 전해지면서 출시가 임박한 것으로 예측된다. 아이폰 팬층의 탄탄한 수요를 고려하면 아이폰 폴드 출시와 함께 폴더블폰 시장이 요동칠 수 있다. 시장 조사 기관인 IDC는 아이폰 폴드의 출시로 세계 폴더블폰 시장이 올해 30% 성장할 것으로 예측했다. 해킹막아라!… 뚫리면 끝장, 보안 단속에 사활안랩은 지난해 말 발간한 ‘2025년 사이버 위협 동향 및 2026년 전망’ 보고서에서 첫 번째 보안 위협으로 ‘AI 기반 공격의 전방위 확산’을 꼽았다. 안랩은 “AI가 피해자의 환경을 분석하고 표적을 정확하게 타격할 수 있는 ‘적응형 공격’이 확대될 것”이라고 분석했다. 또 개인이 AI를 식별하기 어려울 정도로 기술이 발전하면서 딥페이크 등 AI를 악용한 정교한 피싱이 증가하고, AI를 활용한 해킹 신기술이 급속도로 발전하며 해킹의 진입 장벽을 낮출 것이라고 우려했다. 다만 AI에 따른 보안 위협에 대응하는 도구로도 AI가 부상할 전망이다. 보안업체 ‘시큐아이’는 ‘2026년 보안 트렌드’ 보고서에서 “공격과 방어 전반에 AI가 확산하며 사이버 보안이 본격적인 ‘AI 대 AI’의 경쟁 구도로 전환 될 것”이라고 분석했다. 김명주 AI안전연구소장은 “지난해보다 올해 생성형 AI로 만든 사진·영상을 식별하기가 훨씬 어려워졌고, 지방선거 등 큰 행사가 있는 만큼 AI 악용이 본격화될 것”이라며 “AI기본법이 시행되면 정부 차원에서도 AI 부작용에 대비하는 체계를 마련해야 한다”고 지적했다.
  • 초대규모·고난도 추론도…한국형 ‘소버린 AI’ 전쟁

    초대규모·고난도 추론도…한국형 ‘소버린 AI’ 전쟁

    SKT, 매개변수 500B AI 모델 발표네이버클라우드, 옴니모달 AI 2종LG, 엑사원 통한 품질·추론력 강조글로벌 선두와 격차 속 기반 구축 국가 주도의 ‘소버린 AI’를 둘러싼 기업 간 경쟁이 본격화됐다. 국가대표 인공지능(AI) 자리를 두고 각축전에 돌입한 5개 정예팀(네이버클라우드·SK텔레콤·LG AI연구원·업스테이지·NC AI)은 30일 서울 강남 코엑스 오디토리움에서 열린 ‘독자 AI 파운데이션 모델’ 1차 발표회에서 초대규모 모델, 효율 중심 설계, 산업 현장 적용 등 서로 다른 전략을 앞세워 한국형 AI 모델을 제시했고 1000여명의 관람객은 연신 탄성을 내뱉었다. 시선이 가장 집중된 발표는 SK텔레콤이었다. 도입 영상에 ‘페이커’가 등장하자 객석은 환호했다. 이어 공개된 ‘A.X K1’이 매개변수 500B(5000억개) 규모라는 설명이 나오자 분위기는 한층 달아올랐다. 발표 말미에는 최태원 SK그룹 회장이 영상 메시지로 “우리말 모델이 없으면 주도권을 가질 수 없다”며 독자 AI의 필요성을 강조했다. 네이버클라우드는 옴니모달 AI 모델 2종을 공개했다. 국내 최초로 텍스트·이미지·음성을 하나의 구조에서 함께 학습한 8B 규모의 네이티브 옴니모달 모델과 여기에 추론 및 도구 활용을 결합한 32B 모델이다. 네이버클라우드는 이들 모델을 토대로 추후 ‘초대규모 옴니모달 파운데이션 모델’을 선보인 뒤 산업·서비스별로 특화된 버티컬 AI로 확장한다는 계획이다. LG AI연구원은 규모보다 ‘질’을 내세웠다. 236B급 ‘K-엑사원’을 통해 고난도 추론과 판단 능력을 강조하며, 개발 목표로 잡았던 모델과 대비해 평균 성능이 웃돌았다는 수치를 제시했다. 단순한 크기 경쟁이 아니라 실제 운영 가능한 프런티어 AI를 지향한다는 메시지다. 유일한 스타트업인 업스테이지는 효율과 책임을 강조했다. 김성훈 업스테이지 대표는 “이건 투자 실험이 아니라 여러분들의 세금으로 하는 일”이라며 “목표는 분명하다. 글로벌 3강에 들어가는 것”이라고 밝혔다. 100B급 ‘솔라 오픈’을 출발점으로 단계적 확장을 예고했다. 산업 현장성을 전면에 내세운 NC AI는 이연수 대표가 직접 나서 제조·국방·게임 등 실제 현장 적용을 전제로 한 100B급 ‘VAETKI’와 단계적 고도화 로드맵을 제시하며 도메인 중심 전략을 분명히 했다. 이날 공개된 국내 모델들의 성과는 글로벌 AI 평가지표에서도 일부 확인됐다. 글로벌 AI 성능 평가기관 ‘아티피셜 애널리시스’의 인텔리전스 지수에 따르면 네이버클라우드가 이날 공개한 고성능 추론 모델은 44점을 기록했다. LG AI연구원과 업스테이지의 기존 모델은 각각 43점, 38점이었고 이날 공개된 최신 모델은 더 높은 점수를 기록할 것으로 보인다. 최상위권에는 각각 73점을 기록한 구글의 ‘제미나이 3 프로’와 오픈AI의 ‘챗GPT 5’가 자리하고 있다. 이런 격차에도 이번 프로젝트는 단기 순위 경쟁이 아니라 데이터 주권과 산업 적용력을 포함한 소버린 AI의 기반을 쌓는 과정에 가깝다는 게 중론이다. 과기정통부는 1차 평가 결과를 내년 1월 중 발표할 예정이다. 5개 정예팀 가운데 한 곳이 1차 평가에서 탈락하며, 이후 최종 1~2개 팀이 남을 때까지 약 6개월 주기로 경쟁이 이어진다.
위로