찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 추론 성능
    2026-06-12
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
172
  • 비드래프트 DARWIN 기반 한국어 LLM, K-AI 리더보드 종합 1위 기록

    비드래프트 DARWIN 기반 한국어 LLM, K-AI 리더보드 종합 1위 기록

    AI 기술기업 비드래프트는 자체 개발한 AI 모델 진화 플랫폼 기술 ‘DARWIN’을 기반으로 한 한국어 거대언어모델 ‘JGOS-31B-Citizen’이 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 운영하는 K-AI 리더보드에서 종합 평균 0.621을 기록하며 1위를 차지했다고 6월 9일 밝혔다. 해당 수치는 2026년 6월 7일 측정치를 기준으로 한다. 이번 리더보드 측정 결과, 상위 12개 모델 가운데 8개 모델이 비드래프트의 DARWIN 기술을 기반으로 생성된 것으로 나타났다. 세부적으로는 1위 ‘JGOS-31B-Citizen’, 2위 ‘AWAXIS-KR-31B-v5’, 6위 ‘Rogue-28B-MIX’, 7위 ‘AWAXIS-Hybrid-28B’, 8위 ‘Warecube-KO-27B-v3’, 9위 ‘Rogue-27B-KR’, 11위 ‘AWAXIS-Think-28B’, 12위 ‘TenOS-Ko-28B-v3’가 해당 기술 계보에 포함됐다. 단일 기술 기반 모델이 상위 12개 중 3분의 2를 차지한 셈이다. DARWIN 기술은 정보통신산업진흥원(NIPA)의 ‘AI컴퓨팅활용’ 지원 연구과제 수행 과정에서 도출된 산출물이다. 오픈 거대언어모델(LLM) 내부의 지식 및 기능 배치 상태를 신경망 계층 단위로 분석한 뒤, 모델별로 특정 기능이 우수한 구간을 선별해 재조합하는 방식으로 작동한다. 이는 기존 LLM 개발에 활용돼 온 대규모 추가학습 방식과 차별화되는 접근이다. 추가학습 방식이 연산 자원과 데이터 소모를 수반하는 반면, DARWIN은 기존 모델의 특성을 분석하고 결합해 성능을 확보하는 구조다. 비드래프트는 이 방식을 통해 시간과 비용을 줄이면서도 한국어 전문지식, 문화적 맥락 이해, 추론 등 목적별 연산에 맞춤화된 모델을 도출할 수 있다고 설명했다. 현재 해당 기술은 행정, 산업, 교육, 연구지원 등 도입 기관의 목적에 맞는 특화 모델을 구축하는 알고리즘으로 고도화가 진행 중이다. 1위를 기록한 ‘JGOS-31B-Citizen’은 공공 및 행정 서비스 분야 적용을 목표로 설계된 한국어 특화 모델이다. 일반 시민의 한국어 질의 분석과 공공 서식 등 행정적 맥락 처리에 중점을 두고 개발됐다. 세부 평가 지표를 보면, 한국 문화와 상식 이해도를 평가하는 CLIcK 항목에서 0.987을 기록했으며, 한국어 전문지식 평가인 KMMLU-Pro에서 0.725, 일상추론 평가인 Com2-main 항목에서 0.742를 나타냈다. 비드래프트는 해당 모델이 한국의 제도적 용어 이해와 행정 문서 처리 지원 등 공공 서비스 영역의 요구에 맞춰 민원 안내, 복지 상담, 문서 작성 등 다양한 실무 분야에 활용될 수 있다고 밝혔다. 이와 함께 비드래프트는 JGOS-31B-Citizen의 한국어 처리 및 추론 성능을 자체 인공사회 운영체제 ‘내셔널OS(NationalOS)’의 기본 언어모델로 연계할 계획이다. 내셔널OS는 도시 환경을 디지털 공간에 모의 구현하고, 가상 시민 기반 시뮬레이션을 통해 정책 효과를 사전에 검증하는 시스템이다. 회사 측은 한국 제도에 특화된 언어모델이 결합될 경우 정책 질의 해석과 시뮬레이션 결과 도출 과정의 정확도를 더욱 높일 수 있을 것으로 보고 있다. 비드래프트 관계자는 “이번 K-AI 리더보드 성과는 NIPA ‘AI컴퓨팅활용’ 지원 연구과제 산출물인 DARWIN이 고성능 한국어 모델을 반복적으로 만들어낼 수 있는 AI 모델 진화 플랫폼 기술임을 보여준 결과”라며 “특히 공공·행정 서비스 적용 가능성을 갖춘 JGOS-31B-Citizen을 내셔널OS와 결합해 시민과 공공행정을 위한 실질적 AI 서비스로 발전시켜 나가겠다”고 밝혔다. 비드래프트는 DARWIN 기술을 기반으로 한국어 특화 LLM, 산업별 전문 모델, 공공 서비스형 AI 모델, 경량화 모델 등으로 적용 범위를 확대하는 한편, 내셔널OS 등과의 결합을 통해 한국어 기반 AI 연구·산업 생태계 전반으로 활용 범위를 넓혀 나갈 계획이다.
  • SWM.AI, 레노버와 ‘AP-700’ 공동 개발…강남 로보택시 기반 무인 자율주행 고도화 나선다

    SWM.AI, 레노버와 ‘AP-700’ 공동 개발…강남 로보택시 기반 무인 자율주행 고도화 나선다

    SWM.AI가 레노버와 손잡고 차세대 차량용 AI 컴퓨팅 플랫폼 ‘AP-700’ 공동 개발에 나선다. 서울 강남 도심에서 축적해 온 로보택시 운영 경험과 실주행 데이터를 바탕으로, 무인 자율주행 기술 고도화에 속도를 내겠다는 구상이다. SWM.AI는 8일 글로벌 ICT 기업 레노버와 자율주행용 컴퓨팅 플랫폼 AP-700 공동 개발 계약을 체결했다고 밝혔다. 회사는 이번 협력을 통해 자율주행 소프트웨어와 실주행 데이터, AI 추론 모델, 차량용 고성능 컴퓨팅 플랫폼을 결합하는 기술 기반을 한층 강화하게 됐다고 설명했다. 최근 기술 업계에서는 현실 공간에서 직접 인지하고 판단하며 행동하는 ‘피지컬 AI’가 핵심 키워드로 떠오르고 있다. 자율주행차는 그 대표적인 사례로 꼽힌다. 도로 위에서 센서로 주변 상황을 파악하고, AI 모델로 주행 판단을 내린 뒤, 실제 차량 제어까지 수행하기 때문이다. SWM.AI는 자사의 로보택시가 이러한 피지컬 AI 개념을 실제 도심 환경에서 구현하는 사례라고 보고 있다. 차량은 카메라, 라이다, 레이더 등을 통해 주변 360도 환경을 인식하고, VLA 기반 AI 모델을 활용해 주행 상황을 해석한 뒤 가감속과 조향을 제어하는 방식으로 운행된다. 회사는 2024년 9월부터 서울 강남권에서 로보택시 운행 경험과 실주행 데이터를 축적해 왔다고 밝혔다. 강남은 복잡한 교차로와 높은 교통 밀도, 다양한 돌발 변수가 공존하는 도심 지역인 만큼 자율주행 기술을 검증하고 고도화하는 데 의미 있는 환경이라는 설명이다. 이 과정에서 확보한 데이터는 다시 AI 모델 개선에 활용되며 기술 고도화의 기반이 되고 있다. 이번에 공동 개발하는 AP-700은 자율주행 AI 연산을 지원하기 위한 고성능 차량용 컴퓨팅 플랫폼이다. 엔비디아 드라이브 토르-X SoC를 듀얼로 탑재하는 구조를 바탕으로 대규모 센서 데이터와 AI 연산을 실시간 처리할 수 있도록 설계될 예정이다. 여기에 인피니언 TC397 MCU를 이중 적용하고, 수랭식 냉각 시스템을 도입해 장시간 운행 환경에서의 안정성도 고려했다. SWM.AI는 이번 협력을 통해 실주행 데이터와 AI 모델에 더해 차량 내 연산 플랫폼까지 확보하며 자율주행 기술 경쟁력을 높일 수 있을 것으로 기대하고 있다. 김기혁 SWM.AI 대표는 “실제 도심에서 축적한 주행 데이터와 차량용 AI 컴퓨팅 플랫폼이 결합되면 무인 자율주행 기술 상용화 기반을 한층 강화할 수 있다”며 “앞으로도 실제 운행 환경에서 검증을 이어가며 자율주행 기술 고도화에 힘쓰겠다”고 말했다. SWM.AI와 레노버는 이번 협력을 계기로 차세대 로보택시 플랫폼 개발과 관련 기술 고도화를 지속 추진할 계획이다. 업계에서는 실제 도심 주행 데이터와 고성능 차량용 AI 플랫폼의 결합이 향후 무인 이동 서비스 확산에 중요한 역할을 할 것으로 보고 있다.
  • 젠슨 황, 한국·영국만 두 번 방문… K로봇·피지컬 AI ‘콕’ 찍었다

    젠슨 황, 한국·영국만 두 번 방문… K로봇·피지컬 AI ‘콕’ 찍었다

    황 “엔비디아도 기여하길 바란다”LG·네이버·두산 등 새 파트너와피지컬 AI 생태계 구축 속도낼 듯김택진 엔씨 대표와의 만남도 눈길성수동서 총수들과 삼겹살 회동두산 베어스 시구… 유퀴즈 출연도 젠슨 황 엔비디아 최고경영자(CEO)가 한국 로보틱스 산업에 대한 기대감을 직접 드러내면서 국내 산업계와의 협력 확대에 관심이 쏠린다. 엔비디아가 삼성전자 및 SK하이닉스와 협력한 생성형 인공지능(AI)을 넘어, 로봇·자율주행·스마트팩토리 등 ‘피지컬 AI’의 주요 협력 파트너로 우리나라를 점찍으면서 LG·네이버·두산 등이 신규 협력 파트너로 부상하고 있다. 황 CEO는 지난 1일(현지시간) 대만 타이베이에서 열린 국내 기업 관계자들과의 만찬에서 “한국에 로보틱스는 매우 중요하다. 엔비디아도 한국 로보틱스 발전에 기여할 수 있길 바란다”고 밝혔다. 이어 “AI와 로봇이 한국의 잠재력을 극대화할 것”이라고 강조했다. 엔비디아는 AI 인프라와 첨단 제조 역량을 동시에 갖춘 핵심 거점으로 한국을 주목하는 것으로 보인다. 황 CEO는 지난 1년간 한국과 영국만 두 차례씩 방문했다. 이외 프랑스, 독일, 스위스, 중국, 대만 등을 찾았다. 유럽에서 국가 단위 AI 인프라 구축과 소버린 AI 전략 확산에 집중했다면, 한국에서는 고대역폭메모리(HBM)와 첨단 제조 역량, 로보틱스 생태계를 결합하려는 움직임이 뚜렷하다. 현대차는 보스턴다이내믹스를 중심으로 휴머노이드 로봇과 자율주행 기술 고도화에 속도를 내고 있고, LG전자는 엔비디아의 휴머노이드 AI 모델 ‘아이작 GR00T’를 기반으로 자체 피지컬 AI 모델을 개발 중이다. 두산로보틱스도 엔비디아 AI·로보틱스 인프라를 활용한 산업용 로봇 플랫폼 구축을 추진하고 있다. 네이버는 로봇과 디지털트윈 기술을 실제 업무 환경에 적용해왔다. 제2사옥 ‘1784’는 로봇과 클라우드, 5G 특화망, 디지털트윈 기술이 결합된 테스트베드로 평가받는다. 네이버는 최근 엔비디아와 ‘글로벌 AI 팩토리’ 구축 협력에도 나섰고, 엔비디아의 피지컬 AI 플랫폼 ‘코스모스’를 활용한 ‘서울 월드 모델’ 개발도 진행 중이다. SK텔레콤은 이번 GTC 타이베이에서 엔비디아 옴니버스를 활용해 SK하이닉스 반도체 공장에 적용한 디지털트윈 사례를 공개했다. 황 CEO는 게임업계와 스타트업도 만날 예정이다. 김택진 엔씨 대표와 만나 AI 및 게임 기술 협력 방안을 논의할 것으로 알려졌다. 또 방한 마지막 일정으로 국내 로봇·AI 스타트업과 연구진 등을 초청한 비공개 간담회를 열고 피지컬 AI 협력 방안을 논의할 예정이다. 삼성전자와 SK하이닉스는 피지컬 AI 확산 과정에서도 GPU와 HBM 공급망의 핵심 축을 맡고 있다. 업계에서는 로봇과 자율주행 산업이 확대될수록 AI 학습·추론용 반도체와 고성능 메모리 수요 역시 빠르게 늘어날 것으로 보고 있다. 이외 황 CEO는 서울 성수동에서 주요 그룹 총수들과 이른바 ‘삼겹살 회동’을 하고, 두산 베어스 경기에서 시구도 할 계획이다. tvN 예능 프로그램 ‘유 퀴즈 온 더 블럭’ 출연 소식도 전해졌다. 황 CEO의 다양한 일정은 엔비디아의 AI 생태계를 정부, 투자자, 기업, 개발자, 소비자 등에게 전방위적으로 알리려는 커뮤니케이션 전략으로 읽힌다.
  • 젠슨 황 “베라 루빈 본격 양산”… 삼전·닉스 콕 집어 탑재 선언

    젠슨 황 “베라 루빈 본격 양산”… 삼전·닉스 콕 집어 탑재 선언

    AI PC·피지컬 AI 등 청사진 제시삼성전자·SK하이닉스 수혜자로“미래 PC는 나 대신 일하는 AI비서”이번 주 방한해 CEO와 연쇄 미팅‘삼겹살 회동’ ‘1784 방문’ 등 추진 “과거의 모든 중앙처리장치(CPU)는 인간을 위해 만들어졌지만, 베라(Vera)는 인공지능(AI) 에이전트를 위해 설계됐다.” 젠슨 황 엔비디아 최고경영자(CEO)가 1일(현지시간) 대만 타이베이에서 열린 ‘GTC 타이베이 2026’에서 차세대 AI 플랫폼 ‘베라 루빈’의 본격 생산 돌입을 선언했다. 엔비디아는 이날 AI PC와 피지컬 AI 전략도 함께 공개하며 데이터센터에서 개인용 기기, 로봇에 이르는 AI 컴퓨팅 생태계 확장 청사진을 제시했다. 베라 루빈은 그래픽처리장치(GPU)와 CPU, 네트워크, 메모리, 소프트웨어를 통합한 AI 인프라 플랫폼으로, 엔비디아는 이를 기반으로 AI 학습을 넘어 추론 시장 공략에 속도를 낼 계획이다. 황 CEO는 미래 데이터센터를 ‘AI 팩토리’로 규정하며 “컴퓨팅이 곧 매출이고 와트당 성능이 곧 수익”이라고 강조했다. 황 CEO는 이날 차세대 고대역폭메모리(HBM4) 공급사로 SK하이닉스와 삼성전자, 마이크론을 직접 언급했다. 베라 루빈 플랫폼에는 HBM4가 탑재될 예정으로 업계에서는 차세대 AI 서버 투자 확대에 따른 수혜가 삼성전자와 SK하이닉스로 이어질 것으로 보고 있다. 엔비디아는 이날 AI PC 시장 진출도 공식화했다. 미디어텍과 공동 개발한 PC용 시스템온칩(SoC) ‘N1 X’를 기반으로 한 AI PC 플랫폼 ‘RTX Spark’를 처음 공개한 것이다. CPU와 GPU, 메모리를 하나로 통합한 구조로 설계돼 인터넷 연결 없이도 대규모 AI 모델과 AI 에이전트를 기기 내부에서 실행할 수 있다. 황 CEO는 “10년 뒤 PC는 사용자의 명령을 기다리는 기기가 아니라 사용자를 대신해 일하는 AI 비서가 될 것”이라며 “우리는 창작을 위해, 게이밍을 위해, 그리고 AI 에이전트를 위해 PC를 다시 발명하고 있다”고 말했다. 업계에서는 엔비디아가 GPU를 넘어 CPU와 PC 시장까지 영향력을 확대하며 AI 컴퓨팅 생태계 전반을 자사 플랫폼 중심으로 재편하려는 전략을 본격화한 것으로 보고 있다. N1 X에는 삼성전자와 SK하이닉스의 LPDDR5X 메모리가 탑재될 가능성이 거론된다. AI 서버용 HBM에 이어 AI PC용 고성능 메모리 수요까지 본격화될 경우 양사에 새로운 성장 동력이 될 수 있다. 엔비디아는 생성형 AI와 에이전틱 AI를 넘어 ‘피지컬 AI’를 차세대 성장축으로 제시했다. 피지컬 AI는 로봇과 자율주행차, 공장 설비 등 현실 세계의 기계를 AI가 직접 이해하고 제어하는 개념이다. 이날 발표에서는 SK텔레콤이 엔비디아 옴니버스를 활용해 SK하이닉스 반도체 공장에 적용한 디지털트윈 사례가 소개되기도 했다. 엔비디아는 연구용 휴머노이드 로봇 개발을 위해 한국을 포함한 글로벌 로봇 기업들과 협력을 확대할 계획이라고도 밝혔다. 한편 황 CEO는 대만 일정 이후 한국을 찾아 최태원 SK그룹 회장과 구광모 LG그룹 회장, 이해진 네이버 이사회 의장, 정의선 현대차그룹 회장 등과 잇따라 만날 예정이다. 업계에서는 AI 데이터센터와 로보틱스, 자율주행, 디지털트윈 등 차세대 산업 협력을 논의하는 자리가 될 것으로 본다. 회동 장소는 서울 성수동의 한 삼겹살집이 유력하게 거론된다. 지난해 이재용 삼성전자 회장, 정의선 현대차그룹 회장과 삼성동 치킨집에서 만났던 이른바 ‘깐부 회동’에 이은 행보다. 황 CEO는 방한 기간 중 네이버의 미래 기술 집약 공간인 ‘1784’ 방문도 추진 중인 것으로 알려졌다.
  • 오케스트로, GPU 활용률 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공개

    오케스트로, GPU 활용률 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공개

    - 분산 서빙 기반 추론 최적화… 보유 GPU 인프라 활용 효율 높여- 고부하 환경서 토큰 출력 속도 2.2배 향상… AI 서비스 응답 지연 완화- 국내 유일 GPU·국산 NPU 이기종 가속기 지원… 소버린 AI 인프라 선택권 확대 AI·클라우드 소프트웨어 전문 기업 오케스트로(대표 김범재, 김영광)는 보유 GPU 인프라의 활용 효율을 높여 기업 AI 서비스의 추론 병목을 줄이는 AI 추론 운영 플랫폼 ‘콘체르토 AI(CONCERTO A.I.)’를 선보였다고 29일 밝혔다. 생성형 AI 도입이 확산되면서 기업 AI 인프라의 핵심 과제는 GPU 확보에서 추론 운영 효율화로 전환되고 있다. AI 챗봇, 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 등 상시 운영 AI 서비스가 늘어나면서 모델 호출과 추론 연산 수요도 함께 증가하고 있다. 에이전트형 AI 환경에서는 단일 요청이 복수의 모델 호출과 반복 연산으로 이어져 추론 작업량이 단기간에 급증할 수 있다. GPU를 보유하더라도 추론 요청이 특정 자원에 집중되면 병목으로 인한 응답 지연과 자원 낭비가 동시에 발생하는 구조적 문제가 따른다. 콘체르토 AI는 분산 서빙 기반의 추론 최적화를 핵심 기술로 채택했다. 기존 단일 처리 방식은 질문 분석과 답변 생성을 동일 GPU 자원에서 처리해 요청 집중 시 전체 응답 속도가 저하된다. 콘체르토 AI는 두 작업을 분리해 각각에 적합한 자원을 배치함으로써 병목을 줄인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선하고, 실시간 대기열·자원 상태 기반 지능형 라우팅 기능을 결합해 고부하 환경에서도 응답 성능을 유지한다. 오케스트로가 자체 온프레미스 AI 인프라 환경에서 수행한 벤치마크 테스트에 따르면, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 높게 유지한 것으로 나타났다. 운영 자동화 기능도 탑재됐다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 LLMOps에 필요한 기능을 단일 플랫폼에서 제공한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 파드(Pod) 생성부터 엔드포인트 연결까지 배포 과정을 자동화하며, 배포 이후에는 초기 응답 시간·토큰 처리 속도·자원 사용량 등 주요 지표를 통합 모니터링 환경에서 확인할 수 있다. 인프라 호환성 측면에서는 엔비디아 GPU 외에 리벨리온·퓨리오사AI 등 국산 NPU 환경까지 지원하는 이기종 가속기 구조를 채택했다. 오케스트로 측은 GPU와 국산 NPU를 아우르는 상용화 수준의 AI 추론 운영 플랫폼은 국내에서 콘체르토 AI가 유일하다고 밝혔다. 이를 통해 기업·기관은 프라이빗 AI 및 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 서비스 특성과 보유 인프라에 맞춰 추론 자원을 구성할 수 있다. 김범재 오케스트로 대표는 “기업 AI 인프라의 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다”며 “콘체르토 AI를 기반으로 기업이 보유한 AI 인프라의 활용 효율을 높이고, 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다”고 밝혔다.
  • 데이터관계장관회의 신설…“부처 간 장벽 허물고 AI 3대 강국 도약”

    데이터관계장관회의 신설…“부처 간 장벽 허물고 AI 3대 강국 도약”

    데이터 정책을 총괄하는 범부처 기구로 ‘데이터 관계장관 회의체’가 신설된다. 글로벌 인공지능(AI) 시장의 성패를 가를 핵심 자산인 ‘데이터’의 확보와 활용을 위해 범국가적 역량을 투입하겠다는 것으로, 고품질 데이터 공급과 규제 완화를 통해 ‘AI 3대 강국’으로 도약하겠다는 구상이다. 과학기술정보통신부·행정안전부·문화체육관광부·개인정보보호위원회·국가데이터처 등 부처는 28일 정부서울청사에서 열린 데이터관계장관회의에서 이런 내용의 ‘AI 대전환 시대 데이터 정책 추진방향’을 발표했다. 이날 회의는 김민석 국무총리가 주재했다. 정부는 향후 2~3년이 핵심 국정과제인 ‘AI 3대 강국 도약’ 실현 적기라고 진단하고 현장에 필요한 데이터를 적기에 공급할 계획이다. 이에 민간이 자체 확보하기 어려운 고품질 추론데이터(CoT), AI 안전·신뢰성 데이터셋, 성능 벤치마크 평가 데이터를 구축하고, 멀티모달·고난이도 데이터 등 독자 AI 모델 개발에 필요한 핵심 데이터를 확충·지원한다. 부처와 기관이 개별 관리하던 AI 학습용 데이터는 업사이클링을 거쳐 공개할 예정이다. 민간 수요를 기반으로 공공데이터 개방도 확대한다. 민간 수요가 많은 ‘AI·고가치 공공데이터 Top 100’을 선정하고 개방한다는 방침이다. 정책연구 보고서나 국가자격시험 문답 등 비정형 데이터도 AI 활용이 쉬운 형태로 바꾼다. 피지컬 AI·제조, 모빌리티, 바이오·보건의료, 농업, 문화 등 업종·분야별 특성을 반영해 AX(AI 전환) 특화 데이터를 확보하고, 자발적 데이터 공유가 어려운 의료 등의 전략 분야에는 수익 배분을 기반으로 데이터 공유·활성을 촉진하는 ‘데이터 스페이스’를 시범 적용한다. 또 모든 데이터가 모이고 연결되는 ‘데이터 고속도로’를 구축한다. 정부는 국가 데이터 통합플랫폼 ‘원-윈도우’를 중심으로 플랫폼 간 연계를 강화하기로 했다. 또 AI 학습용 데이터를 모은 ‘AI 허브’(aihub.or.kr) 플랫폼은 AI 학습용 데이터 통합제공시스템으로 확대·개편한다. AI 학습용 데이터 개방을 가로막는 제도를 합리적으로 개선하기로 했다. 정부는 AI 학습을 위한 저작물 활용 등을 규정하는 ‘저작권법’ 개정 필요성을 검토한다. 개인정보를 포함하는 데이터를 안전을 전제로 AI 학습에 이용할 수 있도록 ‘개인정보보호법’ 개정도 추진한다. 중소·스타트업의 데이터 활용을 돕기 위해선 데이터와 AI 기술, 인프라를 패키지로 지원하는 ‘AX 원스톱 바우처’를 제공할 방침이다. 민간 데이터 거래 시장을 활성화하기 위해 AI 학습용 데이터 구매 비용에는 세액공제를 적용한다. 이외에도 해외 주요 선도대학과 연계한 데이터 전문인력 양성과 기업 현장 데이터를 교육용으로 가공하는 방안도 검토한다. 배경훈 부총리 겸 과기정통부 장관은 “AI 혁신의 골든타임 내에, 현장에서 필요한 데이터를 적시에 활용할 수 있도록 관계 부처가 힘을 모아 적극 지원하겠다”고 말했다. 김 총리는 “그간에는 영역별 전문성을 축적하는 데 집중했다면, 이제는 부처 간 장벽을 허물고 유기적으로 협업하는 방안을 고민할 시점”이라며 부처 간 협력을 주문했다.
  • [기고] AI 3강 도약의 관건, AI 풀스택에서 SW 주권 확보 필요

    [기고] AI 3강 도약의 관건, AI 풀스택에서 SW 주권 확보 필요

    ChatGPT 출시 이후 인공지능(AI)은 일상생활의 필수 도구로 자리 잡고 있으며 국민의 생활 방식과 근로자의 작업 방식에 혁신적 변화를 가져오고 있다. 최근 ChatGPT를 능가하는 제미나이, 클로드의 출시로 AI에 대한 사회적, 경제적 의존도는 더욱 심화하고 있다. AI 기술은 미국이 주요 생성형 AI 서비스와 핵심 기술을 중심으로 주도하고 있으나 중국도 딥시크, 큐원 등 막대한 인구가 제공하는 데이터와 자체 기술을 기반으로 미국의 AI를 급속히 추격하고 있다. 현 정부에서 AI 3강 실현을 선언하며 국내 AI 기술의 경쟁력을 미국, 중국 수준으로 높일 필요성이 절실한 상태다. AI 실현에 필요한 AI 풀스택은 미국 국립표준기술연구소(NIST)의 클라우드 컴퓨팅 참조구조(CCRA)를 기반으로 보면 피지컬 AI, LLM과 같은 ‘서비스 계층’, 운영체제(OS), 가상화, 클라우드 관리 플랫폼(CMP), 미들웨어 플랫폼, 재해복구(DR) 등의 기능을 수행하는 ‘자원 추상화 제어 계층’, GPU, 네트워크, 데이터센터와 같은 ‘물리자원 계층’의 3계층으로 크게 구분할 수 있다. 관점에 따라 약간의 차이는 있지만 아마존웹서비스(AWS)는 이를 AI 스택, 엔비디아는 AI 팩토리를 위한 풀스택이라고 부른다. 정부는 AI 기술 강화를 목표로 그랜드 AI 챌린지, 독자 파운데이션 모델 개발 사업 등을 통해 LG AI연구원 엑사원, 업스테이지 솔라 등의 국산 LLM을 글로벌 수준으로 도약시키기 위해 집중적으로 지원하고 있는데 이는 AI 서비스 계층에 해당한다. 퓨리오사AI, 리벨리온을 통한 NPU 개발, 엔비디아의 GPU 확보 및 지원은 물리자원 계층에 해당한다. 대통령 공약 사항인 “AI는 게임 체인저, 100조 원 규모 투자와 국가 AI 인프라 구축 추진” 선언에 따라 국가AI데이터센터(AIDC) 추진, 지자체‧공공기관‧민간의 적극적 AIDC 구축 추진, AIDC 진흥을 위한 특별법 제정 등이 급물살을 타고 있는데 이 또한 물리자원 계층에 해당한다. 이러한 사항들을 기반으로 보면 한국은 AI 3강을 향해 필요한 물리적 기반을 빠르게 갖춰가고 있다. 그러나 GPU와 데이터센터를 대규모로 확보하더라도 이를 충분히 활용하지 못하면 AI 경쟁력으로 이어지기 어렵다. 확보한 GPU를 실제 서비스와 산업 현장에서 충분히 활용하려면 자원을 효율적으로 묶고 배분하며 격리하고 복구해 서비스 형태로 제공하는 소프트웨어 역량이 함께 뒷받침돼야 한다. 특히 AI 활용이 학습을 넘어 대규모 추론으로 확산하면서 GPU를 무작정 증설하기보다 이미 보유한 자원의 처리 효율을 높이는 추론 운영 플랫폼의 중요성도 커지고 있다. 분산 서빙 기반의 추론 최적화 소프트웨어는 낮은 GPU 활용률 문제를 완화하고 AI 서비스 효율을 높이는 핵심 기술이다. 이 계층이 약하면 고가의 GPU와 데이터센터는 온전히 국가 경쟁력으로 전환되기 어렵다. 문제는 이러한 역할을 담당하는 자원 추상화 제어 계층, 즉 AI 인프라 소프트웨어에 대한 지원이 빠져 있다는 점이다. 비유하자면 머리와 하체는 튼튼해지고 있는데 허리가 부실해 상하체가 끊겨 있어 제대로 능력을 발휘할 수 없는 셈이다. 주요국은 이미 이 지점에 주목하고 있다. AI 기술 주권의 완성을 위해서는 AI 풀스택 전반, 즉 서비스 계층, 자원 추상화 제어 계층, 물리자원 계층 모두에 걸친 균형 잡힌 기술 발전이 필요하다. 특히 물리자원과 AI 서비스를 안정적으로 운영하고 제어하는 클라우드·엣지 인프라 SW는 AI 시대의 기술 자립을 뒷받침할 핵심 전략 영역이다. 유럽 역시 이러한 관점에서 IPCEI-CIS 프로젝트를 추진하며 최대 12억 유로의 공공 지원과 약 14억 유로의 민간 투자를 바탕으로 차세대 클라우드·엣지 인프라와 서비스 기술을 개발하고 있다. 이는 단순한 인프라 구축을 넘어 멀티클라우드·엣지 환경의 근간이 되는 데이터 처리·공유 SW 등 인프라 SW 역량 강화에 중점을 두고 있다. 일본은 경제산업성을 중심으로 AI 개발에 필요한 컴퓨팅 자원 정비를 지원하고 있다. 경제안전보장추진법에 따라 5개 사업계획에 최대 725억 엔을 지원하며 AI 개발에 필요한 연산 자원을 국내에서 안정적으로 공급할 기반을 확충하고 있다. 이는 GPU 서버 확보에 그치지 않고 개발자와 기업이 필요한 자원을 클라우드 방식으로 활용할 수 있게 하는 인프라 SW 역량을 함께 키우려는 접근이다. 중국도 신창 정책을 바탕으로 핵심 IT 스택의 자립을 추진하고 있다. 반도체와 장비뿐 아니라 AI 시스템 SW 분야에서도 자국 SW 사용을 확대하고 외산 의존도를 낮추려는 움직임이 이어지고 있다. 이는 기술 자립의 범위가 물리자원 계층을 넘어 인프라 SW 계층까지 확장되고 있음을 보여준다. 즉 주요국의 AI 시대 육성 정책은 주권 회복 및 자립을 위해 AI 풀스택 전층에 걸쳐 기술 자립화를 추진하는 방향으로 가고 있다. 그에 비해 우리나라는 SW가 AI를 탄생시킨 핵심 기술이고 클라우드와 같은 자원 추상화 기술이 AI 풀스택의 중간 허리 위치의 핵심 기술임에도 불구하고 AI 관련 예산 지원을 서비스 계층과 물리자원 계층에 집중하고 있다. 자원 추상화 제어 계층에 해당하는 인프라 SW와 클라우드 분야의 지원은 일부는 이미 익숙한 오래된 단어라 유행이 지나갔다고 생각하고 있고 일부는 우리가 할 수 없는 영역이라고 생각하며 포기하고 있다. AI 인프라 SW 육성을 간과한 결과 최근 AIDC 구축 과정에서 수백 대~수천 대의 GPU 서버를 하나의 자원처럼 연결하고 운영할 클러스터 관리 SW가 없어 고가의 외산 솔루션에 의존해야 하는 상황이 발생하고 있다. 문제의 본질은 GPU와 데이터센터를 얼마나 많이 확보하느냐가 아니라 이를 갖추고도 자원 배분과 운영 최적화의 주도권을 우리 기술로 확보하지 못한다는 데 있다. AI 강국으로 가기 위해서는 장비를 들여오는 데 그치지 않고 이를 실제 서비스로 전환할 인프라 SW 역량을 축적해야 한다. AI는 컴퓨터 과학 또는 SW의 한 분야로 학습과 추론을 풀기 위한 알고리즘과 데이터로 구성되는 분야다. 그동안 정부는 SW 강국, 인재 양성을 강조하며 이를 실현하기 위해 많은 노력을 기울여왔다. SW가 AI를 탄생시킨 핵심 기술임에도 AI와 AX 시대가 도래하면서 그 원천인 SW 기술을 외면하는 모순적 현상이 발생하고 있다. 클라우드 컴퓨팅 기술도 이미 완성된 기술 또는 글로벌 빅테크가 주도하는 분야로 간주해 AI 클라우드 분야 외에는 정부 투자가 축소되고 있고 SW 분야의 정부 투자도 거의 사라지고 있는 상황이다. 서비스 계층과 물리자원 계층에 몸담고 있는 전문가나 기업들은 전혀 관심을 보이지도 않고 무시하고 있지만 외산이 장악했던 영역에서 국산 SW로 자립 기반을 다져 온 경험이 있는 한국 SW 업계는 충분한 성공 잠재력을 가지고 있다. 실제 공공뿐 아니라 제조‧통신‧금융 등 주요 산업 현장에서 서버 가상화와 AI 클라우드 SW의 국산 전환이 본격화되고 있다. 대규모 데이터센터와 핵심 업무 시스템에서 외산 인프라 SW 환경을 국산 SW로 전환해 운영하는 사례는 국내 인프라 SW가 물리자원의 활용 효율을 높이고 성능을 극대화하며 안정적인 서비스 운영을 뒷받침할 수 있음을 보여준다. 이는 AI 인프라 SW 역시 우리가 주도적으로 키워갈 수 있는 전략 영역임을 시사한다. 그럼에도 한국의 AI 인프라 SW 시장이 브이엠웨어(VMware), AWS, 애저(Azure)와 같은 글로벌 솔루션의 거대한 파도에 노출되어 있는 현실에 국내 SW 업계는 노심초사할 수밖에 없다. 유럽, 중국, 일본은 빅테크의 쓰나미에 대비해 열심히 둑을 쌓고 체질을 강화하고 있는데 우리는 너무나 방심하고 있어 풍전등화 상황이다. 지금이라도 서비스 계층과 물리자원 계층을 연결하는 자원 추상화 제어 계층, 즉 AI 인프라 SW 관련 산업과 기술 자립화에 대한 과감한 투자를 통해 AI 3강과 AI 자주권 실현의 필수 조건인 AI 풀스택의 균형적인 발전을 반드시 이루어야 한다. 나연묵 단국대학교 AI융합연구원 원장
  • KDD 2026서 웹3 AI 성능 평가 논문 채택…‘디마인드 벤치마크’ 공개

    KDD 2026서 웹3 AI 성능 평가 논문 채택…‘디마인드 벤치마크’ 공개

    블록체인 특화 LLM 평가 체계 제시...“범용 AI 고성능에도 Web3 전문 추론은 과제로 남아”싱가포르 오픈소스 AI 연구기관 DMind AI가 아시아 연구진과 공동으로 개발한 ‘디마인드 벤치마크(DMind Benchmark)’ 논문이 국제 학술대회 ‘KDD 2026(ACM SIGKDD)’의 데이터셋 및 벤치마크(Datasets & Benchmarks) 트랙에 채택됐다고 26일 밝혔다. 본 학술대회는 오는 8월 9일부터 13일까지 제주에서 개최된다. 이번 연구는 웹3(Web3) 및 블록체인 분야에서 대형언어모델(LLM)의 성능을 정량적으로 측정하기 위한 평가 체계를 제안한 것이 핵심이다. 연구팀은 기존의 범용 AI 평가 방식에서 벗어나 블록체인 산업 특화 과제를 중심으로 모델의 실무 활용성과 전문 추론 능력을 검증하는 데 중점을 두었다고 설명했다. 최근 글로벌 AI 업계에서는 특정 산업 분야에 최적화된 도메인 특화 AI 개발 경쟁이 확대되는 흐름이다. 특히 금융·보안 분야에서는 단순 언어 생성 능력보다 정확한 추론과 안정성이 중요해지면서 전문 벤치마크 구축 필요성도 커지고 있다. 디마인드 벤치마크는 블록체인 기초 개념, 인프라, 스마트 컨트랙트, 탈중앙화 금융(DeFi), 탈중앙화 자율조직(DAO), 대체불가토큰(NFT), 토큰 이코노믹스, 밈코인, 보안 취약점 등 총 9개 도메인을 평가 범주로 설정했다. 단순 객관식 형태를 넘어 스마트 컨트랙트 디버깅, 온체인 수치 추론 등 실제 환경 기반 문제도 포함한 점이 특징이다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 주요 AI 모델을 대상으로 성능을 비교 평가했다. 평가 결과 GPT-5 Medium이 전체 평균 77.63점으로 가장 높은 점수를 기록했지만, 토큰 이코노믹스와 보안 취약점 분야에서는 다수 모델이 낮은 성능을 보였다고 밝혔다. 연구진은 현재 상용화된 주요 AI 모델들도 Web3 전문 추론 영역에서는 여전히 한계를 드러내고 있다고 분석했다. 특히 복잡한 토큰 구조 해석이나 스마트 컨트랙트 보안 관련 문제에서는 모델 간 성능 편차가 크게 나타났다고 설명했다. 비용 대비 성능 측면에서는 일부 오픈소스 모델의 경쟁력도 확인됐다는 평가다. 연구에 따르면 DMind의 32B 파라미터 오픈소스 모델은 Web3 특화 과제에서 제한된 비용으로도 높은 성능을 기록했다. 특히 토큰 이코노믹스와 보안 영역에서는 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였다고 연구팀은 밝혔다. 업계에서는 생성형 AI가 금융·디지털 자산 분야로 확대 적용되면서 스마트 컨트랙트 검증이나 온체인 데이터 분석 자동화 수요도 증가하는 추세다. 이에 따라 산업 특화 AI 모델의 신뢰성과 검증 체계 중요성도 함께 커지고 있다는 분석이 나온다. 싱가포르 경영대학교 정보시스템학과 주페이다(ZHU Feida) 교수는 “이번 연구는 Web3 AI 분야에서 측정 가능한 평가 기준을 제시했다는 점에서 의미가 있다”며 “향후 해당 분야 AI 기술의 성능과 안정성 검증 체계 구축에도 활용될 수 있을 것”이라고 말했다. 한편 DMind 모델은 현재 AI 금융 플랫폼 ‘Minara(미나라)’에 적용돼 운영 중이다. 연구팀은 개인 투자자와 디지털 자산 보유자를 위한 재무 비서 기능 등에 해당 기술이 활용되고 있다고 설명했다.
  • 현대차·테슬라 ‘휴머노이드 전쟁’ 불붙었다… 중국은 저가 공세

    현대차·테슬라 ‘휴머노이드 전쟁’ 불붙었다… 중국은 저가 공세

    현대자동차그룹이 자동차 생산 현장에 ‘아틀라스’ 도입을 예고하며 조직 개편을 단행했고, 미국 테슬라는 3세대 ‘옵티머스’ 공개를 예고했다. 한국은 제조 밸류체인, 미국은 인공지능(AI) 기술, 중국은 저가 양산 능력을 각각 내세우며 휴머노이드 패권 경쟁이 달아오르고 있다. 25일 업계에 따르면 현대차그룹은 최근 소프트웨어 중심 공장(SDF) 추진 담당 보직을 신설하고 알페시 파텔 상무를 선임했다. SDF는 공장을 소프트웨어로 통합·제어하는 역할을 한다. 아틀라스의 양산 체제 전환을 위해 부품 공급망을 갖추려는 포석으로 읽힌다. 파텔 상무는 매켄지앤드컴퍼니 출신의 제조 혁신 전문가다. 현대차그룹은 로보틱스 부품 구매실도 신설하고 소현성 전 베이징현대 발전기획본부장(상무)을 실장으로 선임했다. 현대차그룹 계열사 보스턴다이내믹스가 개발한 아틀라스는 360도 회전할 수 있는 관절 구조를 갖췄고, 전신을 제어하면서 45㎏의 물체를 들어 올릴 수 있다. 핵심 구동계인 액추에이터 부품은 현대모비스가 양산하고, 현대글로비스가 조달부터 판매를 잇는다. 현대오토에버는 로봇 지능 업그레이드와 스마트 팩토리 시스템 통합을 담당한다. 수직 계열화 및 제조 밸류체인 구축을 통해 핵심 부품 조달 체계를 내재화하는 것이다. 현대차그룹은 오는 8월부터 미국 조지아주에 ‘로봇 메타플랜트 응용센터(RMAC)’를 가동한다. 2028년 본격 양산에 앞서 아틀라스가 자동차 제조 공장에서 축적된 데이터를 바탕으로 스스로 판단하는 능력을 가르치는 등 완성도를 끌어올릴 계획이다. KB증권은 보스턴다이내믹스가 2035년쯤 한 대당 19만 달러(약 2억 8600만원) 수준의 하이엔드급 휴머노이드를 연간 150만대 판매할 것으로 전망했다. 미국 테슬라는 휴머노이드 옵티머스의 3세대 모델을 7~8월 중 공개할 계획이다. 3세대 옵티머스는 2세대에 비해 손가락 마디 제어 능력이 2배 정밀해져 고난도 조립 작업도 가능해질 전망이다. 테슬라는 내년부터 본격적인 대량 양산에 시도하며 궁극적으로 단가를 2만~3만 달러(약 3000만~4500만원) 수준으로 낮춰 물류 및 제조 시장에 빠르게 확산시키겠다는 구상이다. 특히 테슬라는 최근 자율주행과 로봇 연산을 전담할 차세대 ‘AI5 추론 프로세서’의 최종 칩 설계를 완료했다. 테슬라의 자율주행 시스템처럼 옵티머스가 방대한 데이터를 기반으로 실시간 인지·판단하는 두뇌 능력을 강화하면 사람처럼 동시에 보고 이해하고 동작하는 멀티태스킹이 가능해진다. 중국은 압도적인 국가 주도 보조금과 원가 파괴, 부품 공급망을 무기로 ‘로봇 굴기’를 다지고 있다. 대표 주자인 유니트리 로보틱스가 내놓은 저가형 휴머노이드 ‘R1’은 본토 출시가가 2만 9900위안(약 670만원)이다. R1은 약 120㎝의 키와 무게 25~29㎏의 가벼운 몸체로 성인 남성이 들고 이동할 수 있고, 운동 성능도 민첩하다. 유니트리는 지난해 글로벌 휴머노이드 시장에서 각종 로봇 5500대를 출하해 점유율 32.4%를 기록했다. 유니트리는 상하이 증권거래소 스타마켓에 42억 위안(약 9374억원) 규모의 기업공개(IPO)를 신청하며 글로벌 물량 공세를 예고했다. 이호근 대덕대 미래자동차과 교수는 “아틀라스는 자동차 생산 라인에서 만족도가 높고 옵티머스는 가정용 로봇 등으로 확장성에서 유리해 보이나 완성도 측면에서는 아틀라스가 우위에 있다”며 “중국 휴머노이드도 막대한 자본력과 정부 지원, 내수 시장을 바탕으로 3~5년 안에 기술적으로 따라올 가능성이 있어 안심할 수 없다”고 전망했다.
  • 현대차·테슬라 ‘휴머노이드 전쟁’ 불붙었다…중국은 저가 공세

    현대차·테슬라 ‘휴머노이드 전쟁’ 불붙었다…중국은 저가 공세

    현대자동차그룹이 자동차 생산 현장에 ‘아틀라스’ 도입을 예고하며 조직 개편을 단행했고, 미국 테슬라는 3세대 ‘옵티머스’ 공개를 예고했다. 한국은 제조 밸류체인, 미국은 인공지능(AI) 기술, 중국은 저가 양산 능력을 각각 내세우며 휴머노이드 패권 경쟁이 달아오르고 있다. 25일 업계에 따르면 현대차그룹은 최근 소프트웨어 중심 공장(SDF) 추진 담당 보직을 신설하고 알페시 파텔 상무를 선임했다. SDF는 공장 전체를 소프트웨어로 통합·제어하는 역할을 한다. 아틀라스의 양산 체제 전환을 위해 부품 공급망을 갖추려는 포석으로 읽힌다. 파텔 상무는 매켄지앤드컴퍼니 출신의 제조 혁신 전문가다. 현대차그룹은 로보틱스 부품 구매실도 신설하고 소현성 전 베이징현대 발전기획본부장(상무)을 실장으로 선임했다. 현대차그룹 계열사 보스턴다이내믹스가 개발한 아틀라스는 360도 회전할 수 있는 관절 구조를 갖췄고, 전신을 제어하면서 45㎏의 물체를 들어 올릴 수 있다. 핵심 구동계인 액추에이터 부품은 현대모비스가 양산하고, 현대글로비스가 조달부터 판매를 잇는다. 현대오토에버는 로봇 지능 업그레이드와 스마트 팩토리 시스템 통합을 담당한다. 수직 계열화 및 제조 밸류체인 구축을 통해 핵심 부품 조달 체계를 내재화하는 것이다. 현대차그룹은 오는 8월부터 미국 조지아주에 ‘로봇 메타플랜트 응용센터(RMAC)’를 가동한다. 2028년 본격 양산에 앞서 아틀라스가 자동차 제조 공장에서 축적된 데이터를 바탕으로 스스로 판단하는 능력을 가르치는 등 완성도를 끌어올릴 계획이다. KB증권은 보스턴다이내믹스가 2035년쯤 한 대당 19만 달러(약 2억 8600만원) 수준의 하이엔드급 휴머노이드를 연간 150만대 판매할 것으로 전망했다. 미국 테슬라는 휴머노이드 옵티머스의 3세대 모델을 7~8월 중 공개할 계획이다. 3세대 옵티머스는 2세대에 비해 손가락 마디 제어 능력이 2배 정밀해져 고난도 조립 작업도 가능해질 전망이다. 테슬라는 내년부터 본격적인 대량 양산에 시도하며 궁극적으로 단가를 2만~3만 달러(약 3000만~4500만원) 수준으로 낮춰 물류 및 제조 시장에 빠르게 확산시키겠다는 구상이다. 특히 테슬라는 최근 자율주행과 로봇 연산을 전담할 차세대 ‘AI5 추론 프로세서’의 최종 칩 설계를 완료했다. 테슬라의 자율주행 시스템처럼 옵티머스가 방대한 데이터를 기반으로 실시간 인지·판단하는 두뇌 능력을 강화하면 사람처럼 동시에 보고 이해하고 동작하는 멀티태스킹이 가능해진다. 중국은 압도적인 국가 주도 보조금과 원가 파괴, 부품 공급망을 무기로 ‘로봇 굴기’를 다지고 있다. 대표 주자인 유니트리 로보틱스가 내놓은 저가형 휴머노이드 ‘R1’은 본토 출시가가 2만 9900위안(약 670만원)이다. R1은 약 120cm의 키와 무게 25~29kg의 가벼운 몸체로 성인 남성이 들고 이동할 수 있고, 운동 성능도 민첩하다. 유니트리는 지난해 글로벌 휴머노이드 시장에서 각종 로봇 5500대를 출하해 점유율 32.4%를 기록했다. 유니트리는 상하이 증권거래소 스타마켓에 42억 위안(약 9374억원) 규모의 기업공개(IPO)를 신청하며 글로벌 물량 공세를 예고했다. 이호근 대덕대 미래자동차과 교수는 “아틀라스는 자동차 생산 라인에서 만족도가 높고 옵티머스는 가정용 로봇 등으로 확장성에서 유리해 보이나 완성도 측면에서는 아틀라스가 우위에 있다”며 “중국 휴머노이드도 막대한 자본력과 정부 지원, 내수 시장을 바탕으로 3~5년 안에 기술적으로 따라올 가능성이 있어 안심할 수 없다”고 전망했다.
  • 비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

    비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

    GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 달성 국내 인공지능(AI) 스타트업 비드래프트(VIDraft Inc.·대표 김민식)가 추가 GPU 학습 과정을 거치지 않고도 최상위권 추론 성능을 도출하는 대형언어모델(LLM) 프레임워크 기술을 공개했다. 비드래프트는 자사가 개발한 ‘Darwin Family’ 계열 모델의 핵심 기술을 담은 연구 논문을 공개하고, 관련 핵심 기술 3건에 대한 국내 특허를 출원했다고 밝혔다. 이번에 등록된 논문은 「Darwin Family: MRI Trust Weighted Evolutionary Merging for Training Free Scaling of Language Model Reasoning」으로, 현재 Hugging Face Papers와 오픈소스 아카이브 arXiv(등록번호 2605.14386)에 게재된 상태다. 본 연구에는 비드래프트 소속 연구원 7명이 공동 저자로 참여 명단을 올렸다. Darwin Family는 기존 AI 개발 과정에서 필수로 여겨졌던 추가 학습(Post training) 없이 모델 병합만으로 고성능 추론 능력을 구현하는 새로운 방식의 AI 모델 프레임워크다. 핵심 기술은 MRI Trust Fusion, 14차원 적응형 병합 게놈(Merge Genome), 아키텍처 매퍼(Architecture Mapper) 등 세 가지로 구성된다. MRI Trust Fusion은 모델 각 레이어의 기능적 중요도를 분석한 뒤 신뢰 파라미터를 기반으로 동적 융합을 수행하는 기술이다. 이를 통해 GPQA 정확도를 기존 방식 대비 2.5%포인트 향상시켰다는 설명이다. 또한 14차원 병합 게놈 기술은 어텐션과 FFN, 임베딩 등 모델 내부 구성 요소를 세밀하게 제어하며 경사하강법 없이 진화 탐색만으로 최적 병합 전략을 자동 탐색한다. 아키텍처 매퍼는 Transformer와 Mamba 등 서로 다른 AI 구조 간 결합을 가능하게 하는 기술로, 추가 재학습 없이 이종 모델 교배를 구현한다. Darwin Family는 Hugging Face가 주관하는 AI 성능 벤치마크인 ‘GPQA Diamond(Graduate Level Google Proof Q&A)’ 평가에서 글로벌 3위를 기록했다. 해당 지표는 박사 학위 소지자 수준의 과학적 추론 능력을 평가하는 대표적 기술 지표다. 비드래프트는 별도의 파인튜닝이나 사후 학습을 거치지 않고도 수백억 파라미터 규모의 Fully Trained 모델들의 성능 데이터 수준을 상회했으며, 최소 4B부터 최대 35B 규모에 이르기까지 다양한 모델 세그먼트 구간에서 부모 모델 대비 실질적 성능 향상 수치를 검증했다고 밝혔다. 국내 정량 평가 지표에서도 상위 순위를 점유하고 있다. 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관·운영하는 ‘K-AI 리더보드’에서는 Darwin 기반 모델들이 2위, 3위, 4위, 5위, 7위, 8위를 동시에 기록 중인 것으로 집계됐다. 특히 현재 1위 모델과의 데이터 점수 격차는 0.001점 범위 내에 있는 것으로 확인됐다. 비드래프트에 따르면 공식 모델 공개 이후 45일 만에 파생·양자화 레포지터리 88개와 개별 모델 파일 473개가 생성됐다. GGUF 양자화 분야 개발자 bartowski와 mradermacher 등 글로벌 오픈소스 커뮤니티 개발자들도 Darwin 모델군 배포와 최적화 작업에 참여하고 있다. 현재 Darwin 모델은 Windows·Linux·Mac 환경의 GGUF 포맷을 비롯해 Apple MLX, AWQ, NVIDIA Blackwell 전용 NVfp4 등 다양한 플랫폼을 지원한다. 김민식 비드래프트 대표는 “Darwin 생태계의 확산 속도와 규모는 국내 AI 모델 역사에서도 보기 드문 수준”이라며 “세계 최상위권 양자화 개발자들의 자발적 참여와 폭넓은 플랫폼 지원 체계를 기반으로 글로벌 AI 표준 생태계로 진입하고 있다”고 밝혔다. 한편, 이번 연구는 과학기술정보통신부 재원으로 수행된 ‘AI컴퓨팅자원활용기반강화(GPU 임차 지원) 사용자 지원사업’의 지원을 받아 진행됐다.
  • 오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    오케스트로, GPU 대안 키운다… 국산 AI 반도체 클라우드 R&D 사업 수주

    - 112.5억 원 규모 연구개발 착수… 국산 AI 반도체 생태계 확산 주도- 국산 NPU·PIM 기반 클라우드 SW 스택 개발… GPU 중심 인프라 한계 극복- AI 모델 허브 구축… 최적화 모델 1,000개 이상 확보 목표 AI·클라우드 소프트웨어 전문 기업 오케스트로(대표 김범재, 김영광)는 과학기술정보통신부와 정보통신기획평가원(IITP)이 주관하는 ‘AI 반도체 특화 클라우드 네이티브 SW 스택 및 모델 허브 기술 개발’ 과제의 주관기관으로 선정됐다고 8일 밝혔다. 이번 연구개발 사업의 총규모는 112억 5000만원으로, 2026년부터 2029년까지 4년간 수행될 예정이다. 본 과제는 국산 NPU(신경망처리장치)와 PIM(지능형 메모리) 등 차세대 AI 가속기가 범용 클라우드 환경에서 기능할 수 있도록 클라우드 기반 운영 체계를 구축하는 것이 목적이다. 이를 통해 국산 AI 반도체의 생태계를 확장하고 활용도를 높이는 체계를 마련할 방침이다. 오케스트로는 이번 과제를 수행하며 AI 반도체 전용 클라우드 네이티브 SW 스택의 기술 수준을 높인다. 세부 개발 항목에는 ▲컨테이너 런타임 인터페이스(CRI) 호환 기술 ▲가속기 자원의 직접 접근을 지원하는 패스스루(Pass-through) 기술 ▲마이크로서비스 아키텍처(MSA) 프레임워크 등이 포함된다. 이는 기존 GPU 중심 인프라의 구조적 특성을 보완하고, 국산 NPU 자원을 유연하게 할당·운영할 수 있는 표준 체계를 수립하기 위함이다. 이와 함께 국산 AI 반도체 기반 서비스 확산을 위해 학습·추론 모델을 손쉽게 등록·배포할 수 있는 ‘AI 모델 허브’ 플랫폼도 구축한다. 모델 컨테이너화 자동화 기술과 메타데이터 관리 체계를 기반으로 운영될 예정이며, 과제 종료 시점까지 1000개 이상의 최적화 모델 확보를 목표로 한다. 특히 최근 수요가 빠르게 증가하고 있는 초거대 언어 모델(LLM) 실증 사례를 확보해 상용화 가능성을 검증한다. 국내 중소·벤처기업이 고가의 외산 GPU 의존도를 낮추고, 국산 AI 반도체 기반의 고성능 서비스를 보다 신속하게 개발·출시할 수 있도록 지원할 방침이다. 이번 연구 성과는 정부가 추진 중인 ‘K-클라우드 프로젝트’와 2026년부터 본격화되는 ‘국가 AI 컴퓨팅 인프라’ 구축 사업과 연계돼 실제 데이터센터 운영 환경에 적용될 예정이다. 오케스트로는 커널 레벨의 정밀 모니터링과 분산 추적 기술을 통합해 AI 워크로드 예측 정확도를 글로벌 최고 수준인 99%까지 끌어올리고, 대규모 AI 서비스 운영에 필요한 안정성과 신뢰성을 입증할 계획이다. 김범재 오케스트로 대표는 “이번 과제는 국산 AI 반도체가 글로벌 시장에서 경쟁력을 확보하는 데 필요한 핵심 소프트웨어 기반을 마련한다는 점에서 의미가 크다”며 “하드웨어와 소프트웨어가 유기적으로 결합되는 AI 컴퓨팅 환경을 구현해 국내 AI 인프라 자립도를 높이고, 국산 AI 반도체 생태계 확산에 기여하겠다”고 밝혔다.
  • 바이브컴퍼니, AI 에이전트 전용 ‘VAIV AI DATA’ 플랫폼 출시… 실시간 시장 맥락 기반 AI 추론 지원

    바이브컴퍼니, AI 에이전트 전용 ‘VAIV AI DATA’ 플랫폼 출시… 실시간 시장 맥락 기반 AI 추론 지원

    AI 전문기업 바이브컴퍼니가 AI 에이전트의 성능 지원을 위한 데이터 인텔리전스 플랫폼 ‘VAIV AI DATA PLATFORM(이하 VAIV AI DATA)’을 정식 출시했다. 최근 AI 산업은 단순한 모델 성능 경쟁을 넘어, AI가 실제 추론 과정에서 얼마나 정확하고 최신화된 정보를 확보할 수 있는지가 핵심 경쟁력으로 부상하고 있다. 특히 거대언어모델(LLM)은 학습 데이터 이후의 최신 정보를 반영하지 못하는 ‘지식 컷오프(Knowledge Cut-off)’ 한계를 안고 있어, 실무 환경에서 최신 시장 변화와 이슈를 충분히 반영하지 못한다는 지적이 꾸준히 제기됐다. 바이브컴퍼니는 이러한 문제의 핵심을 ‘외부 컨텍스트 데이터 부재’로 진단하고, AI 에이전트가 시장 흐름과 실시간 변화를 이해할 수 있도록 지원하는 데이터 인텔리전스 플랫폼을 출시했다. 현재 산업 현장에는 ERP나 데이터베이스(DB) 등 내부 데이터를 통합하는 솔루션은 다수 존재하지만, AI 에이전트가 외부 시장 상황을 이해하기 위한 고품질 데이터 공급 체계는 부족한 실정이다. VAIV AI DATA는 이러한 데이터 병목 문제를 해결하기 위해 개발됐다. 바이브컴퍼니가 지난 26년간 축적해온 약 550억 건 규모의 데이터 자산을 기반으로, AI가 즉시 이해하고 활용할 수 있는 지능형 지식 구조로 재설계해 제공하는 것이 핵심이다. 단순히 원천 데이터를 전달하는 수준을 넘어, 산업 리포트·기업 공시 정보·소셜 담론 등 다양한 멀티채널 데이터를 비즈니스 목적에 맞춰 구조화했다는 점이 특징이다. 이를 통해 AI 에이전트는 기업 내부 데이터에만 의존하지 않고, 실시간 시장 흐름과 사회적 맥락을 기반으로 보다 정교한 추론과 의사결정을 수행할 수 있게 된다. 기업은 변화하는 시장 상황에 보다 민첩하게 대응하고, 리서치와 분석 업무 효율 또한 높일 수 있다고 회사 측은 밝혔다. 플랫폼은 비즈니스 목적에 최적화된 5종의 데이터 인텔리전스를 공급한다. 세부 구성은 ▲실시간 시장 변화와 소비자 반응을 분석하는 ‘Trend 데이터’ ▲사회적 이슈 추적으로 리스크를 관리하는 ‘Issue 데이터’ ▲전문 지식 기반 리서치 과정을 구조화하는 ‘Research 데이터’ ▲AI 프로파일링을 통한 SNS 유저 특성 분석인 ‘Profiling 데이터’ ▲국내외 투자 지표와 시황 정보를 정제한 ‘Finance 데이터’ 등이다. 운용 편의성 측면에서는 글로벌 표준인 MCP(Model Context Protocol) 연동을 포함해 API, 대시보드, 커스텀 파일 등 4가지 방식의 연동을 지원한다. 이에 따라 도입 기업은 별도의 데이터 파이프라인 구축 절차 없이 실시간 데이터 분석과 리포트 작성 업무에 플랫폼을 활용할 수 있다. 김경서 바이브컴퍼니 대표는 “이제 AI 경쟁력의 핵심은 단순히 뛰어난 모델을 보유하는 데 그치지 않고, 해당 모델이 현시점의 외부 상황을 전문가처럼 읽어낼 수 있도록 만드는 생생한 지식 공급에 있다”며 “VAIV AI DATA는 26년간 축적한 데이터 역량을 에이전틱 AI 시대에 맞춰 재설계한 플랫폼으로, 복잡한 시장 신호를 AI가 즉시 이해할 수 있는 맥락으로 제공하는 지능형 엔진 역할을 하게 될 것”이라고 밝혔다. 바이브컴퍼니(구 다음소프트)는 2000년 설립된 국내 AI 전문기업으로, 데이터 자산과 생성형 AI 기술을 결합해 공공과 민간 분야에 AX(AI 전환) 서비스를 제공하고 있다.
  • SSD에 소외되던 HDD의 반전…AI붐에 핵심 인프라로 재부상

    SSD에 소외되던 HDD의 반전…AI붐에 핵심 인프라로 재부상

    생성형 인공지능(AI) 확산으로 데이터 저장 구조가 변화하면서 한동안 쇠퇴 산업으로 분류됐던 하드디스크(HDD)가 핵심 인프라로 재부상했다. 4일 업계에 따르면 글로벌 HDD 제조사 씨게이트는 2026년 1분기에 매출 31억 1000만 달러(약 4조 5754억원)를 기록해, 전년 동기의 21억 6000만달러(약 3조 1777억원)와 비교해 44% 증가했다. 매출총이익률은 47.0%로 전년의 36.2%에서 10.8%포인트 상승했고, 출하량은 199EB(엑사바이트)로 전년 144EB 대비 39% 증가했다. 특히 데이터센터 매출은 25억달러(약 3조 6780억원)로 전년 대비 55% 증가하며 전체 매출의 80%를 차지했다. 씨게이트는 지난달 28일(현지시간) 보도자료를 통해 “AI는 컴퓨팅만으로 작동하는 것이 아니라, 폭증하는 데이터를 얼마나 경제적으로 저장하느냐가 더 중요하다”라고 강조했다. HDD를 주력으로 하는 웨스턴디지털도 유사한 흐름이다. 매출은 33억 4000만달러(약 4조 9138억원)로 전년 22억 9400만달러(약 3조 3750억원) 대비 45% 증가했다. 매출총이익률은 50.5%로 전년 40.1% 대비 10.4%포인트 상승하며 50%를 처음 돌파했다. 출하량 역시 222EB로 전년 166EB 대비 34% 증가했다. 구글·마이크로소프트 등 클라우드 기업에 HDD를 공급해 발생하는 매출 비중은 89%에 달해 사실상 대부분의 성장이 데이터센터에서 이뤄지고 있다. 출하량 증가는 AI 구조 변화와 맞물려 있다. 학습 중심이던 AI가 추론·에이전틱 AI로 진화하면서 데이터 생성과 저장이 반복되고, 자율주행·로봇 확산으로 데이터 규모도 빠르게 커지고 있다. 이로 인해 클라우드 기업들의 데이터센터 투자가 늘면서 HDD 수요가 증가하고 있다. SSD가 고성능 처리를 담당하는 반면, 대규모 저장은 HDD가 더 경제적이라는 점도 영향을 미쳤다. 씨게이트는 실적 발표 콘퍼런스콜에서 “데이터센터용 HDD 생산 물량이 2027년까지 대부분 계약된 상태”라고 설명했다.
  • 진짜 상태는 엔비디아 아니다? 구글 8세대 TPU에 엿보인 구글의 AI 전략 [고든 정의 TECH+]

    진짜 상태는 엔비디아 아니다? 구글 8세대 TPU에 엿보인 구글의 AI 전략 [고든 정의 TECH+]

    구글이 지난해 8월 7세대 TPU인 아이언우드를 발표한 지 1년도 채 되지 않아 8세대 TPU를 공개하며 AI 가속기 시장에서 속도전을 벌이는 모습입니다. 이렇게 빠르게 차세대 칩을 내놓았다는 것은 7세대 공개 시점에서 이미 8세대를 개발 중이었다는 이야기입니다. 이는 두 개의 팀을 따로 만들어 비용을 더 투자하더라도 개발 경쟁에서 경쟁자를 앞서겠다는 강한 의지 없이는 불가능한 일입니다. 이번 8세대 TPU의 가장 큰 특징은 사상 처음으로 학습과 추론 전용 칩을 분리해 각각 TPU 8t와 TPU 8i로 이원화했다는 점입니다. 특히 이번 세대는 단순한 칩의 성능 향상을 넘어, 스스로 판단하고 행동하는 ‘에이전틱 AI(Agentic AI)’ 시대를 뒷받침하기 위한 ‘AI 하이퍼컴퓨터’ 아키텍처의 핵심 엔진으로 설계됐습니다. 학습 전용인 TPU 8t는 216GB의 HBM 메모리를 탑재하고 단일 슈퍼포드당 최대 9600개의 칩을 3D 토러스(Torus) 토폴로지로 연결해 압도적인 확장성을 자랑합니다. 이를 통해 최첨단 모델의 배포 기간을 수개월에서 수주 단위로 단축할 수 있으며, 포드당 총 121 ExaFlops의 FP4 연산 능력을 제공합니다. 추론 특화 칩인 TPU 8i는 에이전틱 AI의 핵심인 ‘추론(Reasoning)’ 성능을 극대화하기 위해 설계됐습니다. 288GB의 HBM과 더불어 이전 세대보다 3배 늘어난 384MB의 온 칩 (on chip) SRAM을 탑재했습니다. 이는 최근 엔비디아가 공개한 추론 가속기인 그록(Groq) LPU의 SRAM 전략과 유사한 것으로 평가됩니다. 결론적으로 세대별 성능 향상 측면에서 TPU8t 트레이닝 칩은 대규모 학습에서 전 세대 대비 2.7배 향상된 가격 대비 성능을 제공하며, TPU8i 역시 추론 환경에서 전 세대 대비 80% 향상된 가격 대비 성능을 제공합니다. 또 두 칩 모두 와트당 성능이 두 배 향상됐는데, 이는 전력 비용을 줄여 전체적인 AI 총소유비용(TCO)를 크게 줄일 수 있습니다. 이와 같은 비용 절감은 앞으로 AI 서비스의 수익화에 매우 중요한 요소입니다. 다만 기본적으로 엔비디아의 베라 루빈 플랫폼은 여전히 8세대 TPU보다 강력한 성능을 지니고 있습니다. 단일 칩 기준으로만 보면 루빈 GPU는 50 PFLOPS에 달하는 연산 능력을 지녀 8세대 TPU보다 몇 배 빠른 성능을 지니고 있습니다. 문제는 비싼 가격입니다. 엔비디아 플랫폼이 비싼 이유는 칩 자체의 생산 비용도 있지만, 높은 이윤을 남기면서 팔고 있는 것도 중요한 이유입니다. 그런데 여기서 구글이 자체 칩을 만들어 마진을 흡수하면 오픈 AI나 앤스로픽 같은 경쟁자보다 비용을 대폭 절감할 수 있습니다. 최근 칩플레이션과 에너지 비용 급상승으로 AI 서비스 비용은 비싸지고 수익화는 이를 따라가지 못하는 상황에서 구글이 누리는 비용 절감 효과는 결국 AI 경쟁에서 최종 승자가 될 가능성을 높일 수 있습니다. 언뜻 보기에는 구글 TPU가 엔비디아를 겨냥한 것 같지만, 사실은 엔비디아 플랫폼을 사용할 수밖에 없는 다른 경쟁자가 더 압박을 받을 수밖에 없는 셈입니다. 자체 TPU 개발의 또 다른 이점은 자체 서비스에 최적화된 플랫폼과 생태계입니다. 마치 애플의 A 시리즈 및 M 시리즈 프로세서가 iOS 및 맥 OS, 그리고 애플 서비스에 최적화된 기능을 제공할 수 있어 비용은 절감하고 서비스 품질과 사용자 경험은 높일 수 있는 것과 동일한 구조입니다. 사실 이런 이유 때문에 구글뿐 아니라 오픈 AI나 앤스로픽 역시 자체 칩 플랫폼을 개발하거나 타사 플랫폼 활용을 고려하고 있지만, 이미 10년 이상 개발해온 TPU의 노하우를 따라잡기는 쉽지 않습니다. 반대로 이야기하면 구글 입장에서는 앞선 TPU 설계와 이미 구축해 놓은 생태계가 이들과의 경쟁에서 매우 큰 무기인 셈입니다. 결국 TPU의 개발 목적은 엔비디아와의 직접적인 경쟁보다는, 자사 인프라에 최적화된 저비용·고효율 환경을 구축하여 AI 서비스 대중화 시대의 수익성을 선점하는 데 있습니다. 이러한 탄탄한 하드웨어 경쟁력과 기존의 방대한 서비스 플랫폼이 결합된 AI 생태계를 통해 구글이 최종적인 승자가 될 수 있을지 주목됩니다.
  • SK하이닉스 전성비갑 ‘소캠2’ 출격… AI 메모리 새판짜기

    SK하이닉스 전성비갑 ‘소캠2’ 출격… AI 메모리 새판짜기

    적은 전기로 데이터 처리 속도 2배엔비디아 슈퍼칩 ‘베라 루빈’ 최적화HBM과 투트랙으로 효율성 높여차세대 기술서도 주도권 확보 총력“메모리 성능의 새로운 기준 될 것” SK하이닉스가 차세대 인공지능(AI) 서버용 메모리 모듈인 ‘소캠2(SOCAMM2) 192GB’를 본격 양산한다고 20일 밝혔다. 스마트폰 등에 쓰이던 저전력 D램(LPDDR5X)을 AI 서버에서 빠른 속도로 구동하면서도 전력 소비는 낮도록 개량한 제품이다. AI의 추론기능이 중요해지면서 전력 소비 대비 높은 성능이 요구되는 가운데 SK하이닉스가 고대역폭메모리(HBM)에 이어 차세대 영역에서도 주도권을 잡겠다고 선언한 셈이다. SK하이닉스는 “소캠2는 (DDR5를 활용한) 기존 서버용 메모리 모듈(RDIMM) 대비 데이터 처리 속도(대역폭)가 2배 이상 빠르고, 전력 효율은 75% 이상 개선된 고성능 AI 연산 최적화 솔루션”이라고 이날 밝혔다. 더 적은 전기로 더 많은 데이터를 처리할 수 있다는 의미다. 특히 이 제품은 엔비디아의 차세대 AI 플랫폼 ‘베라 루빈’에 맞춰 설계돼 향후 AI 서버에 본격 적용될 가능성이 크다. 이번 발표가 주목받는 이유는 AI 메모리 시장의 구조 변화와 맞물려 있어서다. 그간 AI 서버는 그래픽처리장치(GPU)가 연산을 수행하고, 이를 초고속으로 지원하는 HBM과 데이터를 저장·공급하는 RDIMM 중심으로 구성돼 왔다. GPU가 요리사라면 HBM은 바로 사용할 재료를 올려두는 도마, RDIMM은 재료를 보관하다 필요할 때 꺼내 쓰는 냉장고 역할을 했던 셈이다. 다만 AI 연산 속도가 급격히 빨라지면서 RDIMM의 데이터 공급 속도와 전력 효율이 병목 요인으로 지적돼 왔다. HBM 중심 구조를 유지하면서도, 보다 빠르고 효율적인 메모리에 대한 수요가 확대된 이유다. SK하이닉스는 소캠2를 통해 이런한 문제를 줄여, AI 처리 속도를 높이겠다는 전략이다. 업계에서는 소캠2에 대해 HBM의 완전한 대체품보다 역할을 나눌 것으로 보고 있다. HBM이 최고 성능을 담당한다면, 소캠2는 전력과 비용을 줄이면서 데이터를 효율적으로 공급하는 역할을 맡는 식이다. 이를 통해 AI 서버는 더 많은 작업을 보다 효율적으로 처리할 수 있게 된다. 이 같은 흐름은 AI 시장이 ‘학습’ 중심에서 ‘추론’ 중심으로 이동하는 변화와도 맞닿아 있다. 학습은 데이터를 이용해 AI 모델을 훈련시키는 과정이고, 추론은 학습된 AI를 실제 서비스에 활용하는 단계다. 최근에는 많은 기업들이 AI를 실제 서비스에 적용하면서 전력 효율이 높은 메모리 수요가 빠르게 늘고 있다. SK하이닉스 김주선 AI 인프라 사장은 “소캠2 192GB 제품 공급으로 AI 메모리 성능의 새로운 기준을 세웠다”며 “글로벌 AI 고객과의 긴밀한 협력을 바탕으로 최적의 성능을 제공하고, 신뢰받는 AI 메모리 솔루션 기업으로 자리매김하겠다”고 밝혔다.
  • 오픈AI, ‘월 15.9만원’ 챗GPT 프로 신설…초고성능 추론 시장 잡는다

    오픈AI, ‘월 15.9만원’ 챗GPT 프로 신설…초고성능 추론 시장 잡는다

    기존 ‘200달러’ 단일 체제서 ‘100달러’ 옵션 추가 코딩 도구 사용량 5배 확대, 헤비 유저 혜택 집중 생성형 인공지능(AI) 선두주자 오픈AI가 챗GPT에 월 100달러(한국 공식 가격 15만 9000원) 규모의 새로운 ‘프로(Pro)’ 요금제 옵션을 도입했다. 기존에 월 200달러(약 29만원)에 달했던 프로 요금제의 높은 가격 장벽을 절반 수준으로 낮춰, 전문가와 개발자 등 ‘헤비 유저’들을 대거 흡수하겠다는 포석이다. 10일 오픈AI와 관련 업계에 따르면 챗GPT 유료 라인업은 Go(1만 3,000원), Plus(2만 9,000원), Pro(15만 9000원부터)로 재편됐다. 이번 개편의 핵심은 초고성능 구간인 ‘프로’ 요금제의 다변화다. 그동안 시장에서는 20달러짜리 플러스 요금제는 아쉽고, 200달러짜리는 너무 비싸다는 목소리가 컸는데, 이번에 100달러대 ‘중간 지대’를 신설하며 이용자 선택권을 넓혔다. 오픈AI가 요금제를 다변화한 이유는 AI를 업무 도구로 쓰는 고숙련 사용자층의 요구에 부응하기 위해서다. 단순한 대화 수준을 넘어 실제 업무에 AI를 활용하는 사례가 빠르게 늘고 있기 때문이다. 실제로 오픈AI의 코딩 특화 에이전트인 ‘코덱스(Codex)’는 최근 3개월 만에 주간 사용자 수가 5배 급증하며 300만명을 돌파했다. 신설된 월 100달러 프로 요금제는 이런 ‘헤비 유저’를 겨냥했다. 기존 플러스 요금제보다 5배 많은 코덱스 사용량을 보장하는 것이 특징이다. 여기에 최신 추론 모델인 인스턴트와 씽킹을 무제한 지원한다. 차세대 모델인 GPT-5.4 기반의 추론 기능도 포함해 복잡한 개발이나 분석 업무의 연속성을 높였다. 오픈AI 측은 “작업량이 많은 환경에서도 제약 없이 AI를 실무에 활용하도록 선택지를 넓힌 것”이라고 설명했다. 이처럼 생성형 AI 시장에선 ‘이용 패턴별 맞춤형 요금제’ 경쟁이 치열하다. 경쟁사인 구글이 비용 효율성을 강조한 ‘제미나이 1.5 플래시(Gemini 1.5 Flash)’로 가성비 시장을 공략하자, 오픈AI는 저가형부터 초고성능 모델까지 풀라인업을 구축하며 맞불을 놓은 모양새다. 이용자의 업무 성격과 예산에 맞춘 ‘체급별 구독 경쟁’이 본격화됐다는 분석이다. 업계에서는 이번 개편을 연내 추진 중인 기업공개(IPO)를 앞둔 수익 구조 다변화 전략으로 보고 있다. 오픈AI는 유료 구독 모델 세분화와 광고 도입을 통해 2030년까지 광고 매출로만 1000억 달러를 벌어들인다는 구상이다.
  • SKT·Arm·리벨리온, ‘AI 동맹’ 결성…“추론 최적화 데이터센터 잡는다”

    SKT·Arm·리벨리온, ‘AI 동맹’ 결성…“추론 최적화 데이터센터 잡는다”

    ‘전기 먹는 하마’ GPU 대신 NPU ‘관제탑 CPU-타격대 NPU’ 원팀 구축 글로벌 ‘소버린 AI’ 시장 정조준 SK텔레콤과 영국 반도체 설계회사 Arm, 국내 인공지능(AI) 반도체 선두주자 리벨리온이 차세대 AI 데이터센터(AIDC) 시장 선점을 위해 손을 맞잡았다. AI 산업의 무게중심이 대규모 학습에서 실제 서비스 단계인 ‘추론’으로 급격히 이동함에 따라, 저전력·고효율 인프라를 무기로 글로벌 시장을 공략하겠다는 포석이다. SK텔레콤과 Arm, 리벨리온 3사는 차세대 AI 인프라 혁신을 위한 전략적 파트너십(MOU)을 체결했다고 10일 밝혔다. 이번 협력의 핵심은 Arm의 데이터센터용 중앙처리장치(CPU)인 ‘Arm AGI CPU’와 리벨리온이 오는 3분기 출시 예정인 차세대 신경망처리장치(NPU) ‘리벨카드(RebelCard™)’를 하나의 서버에 통합하는 것이다. 그동안 AI 연산은 그래픽처리장치(GPU)가 주도해왔으나, 365일 24시간 가동되는 AI 추론 서비스 특성상 GPU의 막대한 전력 소모와 비용은 데이터센터 운영의 최대 걸림돌로 지목되어 왔다. 3사가 내놓은 해법은 ‘이종 컴퓨팅’(Heterogeneous Computing)이다. 시스템 운영과 데이터 관리를 총괄하는 ‘관제탑’ 역할의 CPU와, 실제 AI 추론 연산을 전담하는 ‘타격대’ 역할의 리벨리온 NPU를 결합해 효율을 극대화한다는 전략이다. 특히 리벨카드는 한국 최초로 서버급 고성능 AI 반도체인 ‘리벨100’을 탑재해 아시아 유일의 페타플롭스(PetaFLOPS)급 연산 능력을 갖췄다. 이번 연합은 단순히 기술 협력에 그치지 않고 데이터 주권 확보를 위한 독자 AI인 ‘소버린 AI’ 및 글로벌 통신사 특화 인프라 시장을 정조준한다. 국가나 기업이 독자적인 AI 인프라를 구축할 때, 성능과 가성비를 동시에 잡은 ‘검증된 패키지’를 공급해 표준을 선점하겠다는 구상이다. 이미 Arm과 리벨리온은 지난 3월 ‘Arm 에브리웨어’ 행사에서 양측의 칩을 결합해 오픈AI의 대규모 언어모델(GPT OSS 120B) 기반 에이전틱 AI 서비스를 실시간 시연하며 상용화 가능성을 입증한 바 있다. SK텔레콤은 이렇게 개발된 서버 설루션을 자사 AIDC에 도입해 실전 검증에 나선다. 특히 SKT가 독자 개발한 AI 파운데이션 모델 ‘에이닷엑스 케이원(A.X K1)’을 해당 인프라에서 직접 운영하며 안정성을 테스트할 계획이다. 이러한 협력 체계는 각 분야의 ‘정점’이 만나 하나의 완성된 설루션을 제안한다는 점에서 시장의 주목을 받고 있다. 오진욱 리벨리온 최고기술책임자(CTO)는 “압도적 성능과 전력 효율을 갖춘 리벨카드가 차세대 AIDC를 지탱하는 핵심 축이 될 것”이라며 “각 분야 전문가들이 ‘원팀’으로 뭉친 이번 사례는 업계에서도 유의미한 이정표”라고 자신감을 내비쳤다. Arm은 범용 인프라로서의 확장성을 강조했다. 에디 라미레즈 Arm 부사장은 “Arm 네오버스 기반 CPU는 대규모 AI 구축에 필수적인 성능을 갖췄다”며 “리벨리온, SKT와 함께 소버린 AI 및 통신 시장에서 실제 작동하는 확장성 있는 인프라를 실현할 것”이라고 말했다. 이재신 SK텔레콤 AI 사업개발 담당은 “추론 최적화 인프라에 독자 파운데이션 모델인 ‘A.X K1’을 얹은 ‘풀 패키지’를 제공할 것”이라며 “이를 통해 글로벌 AIDC 시장에서의 주도권을 확실히 쥐겠다”고 강조했다.
  • 설계도 읽고 재무제표 추론… 현장서 강한 ‘엑사원’ 떴다

    설계도 읽고 재무제표 추론… 현장서 강한 ‘엑사원’ 떴다

    과학·기술·공학·수학 평가 77.3점오픈AI·앤트로픽 경쟁 모델 앞서차트 분석·추론 능력도 우위 보여‘독자 AI 파운데이션 모델’도 대비 LG AI연구원이 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 인공지능(AI) 모델 ‘엑사원 4.5’를 공개했다. 설계도나 재무제표 등 서류 인식 능력을 고도화시킨 것이 특징으로 대중 서비스 보다는 산업용 활용이 확대될 전망이다. 엑사원 4.5는 LG AI연구원이 자체 개발한 ‘비전 인코더’와 거대언어모델(LLM)을 하나의 구조로 통합한 ‘비전-언어 모델’(VLM)로, 국내 최초 멀티모달 AI를 구현했던 엑사원 1.0부터 쌓아온 기술력의 집합체다. 엑사원 3.0부터 LLM에 집중해온 LG AI연구원이 다시 VLM으로 회귀한 것은 오는 8월 예정된 ‘독자 AI 파운데이션 모델’ 2단계 평가까지 대비한 것이다. LG AI연구원은 3단계 진출이 확정되면 본격적으로 모달리티 확장에 나서고, 궁극적으로 엑사원을 피지컬 AI까지 발전시킬 계획이다. 엑사원 4.5에서 가장 크게 향상된 성능은 복합 문서를 정확하게 읽고 추론하는 능력이다. 계약서, 재무제표, 전문 문헌 등 데이터와 숫자로 구성된 문서부터 기술 도면 등 그림 형태의 문서까지 이미지의 내용과 맥락을 이해해 텍스트로 출력할 수 있다. 설계도 등이 사용되는 건설업이나 제조현장, 연구원 및 학계 등 기업 간 거래(B2B)에서 활용성이 특히 높다. 소버린 AI를 목표로 하는 만큼 한국에 특화된 것도 강점이다. LG AI연구원은 지난 1월에는 동북아역사재단으로부터 데이터를 제공받아 학습을 진행하고 있다. 엑사원을 한국의 역사와 문화, 사회적 맥락까지 깊이 이해하는 AI로 발전시키려는 것이다. LG AI연구원이 공개한 벤치마크 점수에 따르면 엑사원 4.5는 과학·기술·공학·수학(STEM) 성능을 측정하는 5개 지표에서 평균 77.3점을 기록해 미국 오픈AI의 ‘GPT5-미니’(73.5점)와 앤트로픽의 ‘클로드 소넷 4.5’(74.6점), 중국 알리바바의 ‘큐웬3 VL 32B’(74.8점)를 모두 앞섰다. 복잡한 차트를 분석하고 추론하는 능력을 평가하는 ‘차트QA 프로’ 지표에서는 62.2점으로 GPT5-미니(60.9점), 클로드 소넷 4.5(62.1점)를 모두 넘어섰다. 시각 능력 평가 지표에서 높은 점수를 기록한 것은 AI가 문서 속 글자나 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄다는 뜻이다. 이진식 LG AI연구원 엑사원랩장은 “엑사원 4.5를 시작으로 음성과 영상, 물리 환경까지 AI의 이해 범위를 확장해 산업 현장에서 실질적으로 판단하고 행동하는 AI를 만들어가겠다”고 밝혔다.
  • 21조원 들인 ‘메타 AI드림팀’… 수학·과학 전문가급 추론 ‘뮤즈 스파크’ 출시

    21조원 들인 ‘메타 AI드림팀’… 수학·과학 전문가급 추론 ‘뮤즈 스파크’ 출시

    알렉산더왕 연구팀의 첫 작품석박사 설계한 ‘인류 최종 시험’구글·오픈AI 경쟁작보다 앞서인스타그램·AI 안경 등에 적용 메타가 인공지능(AI) 생태계의 ‘개방’을 상징하던 기존의 오픈소스 전략을 버리고 기술 독점을 통한 정면 승부를 선택했다. 그동안 ‘라마(Llama)’ 시리즈를 무료로 배포하며 생태계 확장을 주도해온 것과 달리 이번엔 ‘폐쇄형’ 모델로 승부수를 던진 것이다. 이는 글로벌 AI 경쟁의 축이 누구나 쓸 수 있는 ‘공유 자산’에서 빅테크가 기술을 점유하고 통제하는 ‘성능 중심’으로 완전히 옮겨갔음을 의미한다. 메타는 8일(현지시간) 알렉산더 왕 최고AI책임자(CAIO)가 이끄는 메타초지능연구소(MSL)의 첫 결과물인 ‘뮤즈 스파크(Muse Spark)’를 전격 출시했다. 왕 CAIO는 메타가 지난해 새 AI 모델 개발을 위해 약 21조원을 들여 영입한 데이터 플랫폼 기업 ‘스케일AI’의 창업자이자 개발자다. 이번 모델은 그가 이끄는 초지능 연구팀의 첫 성과로 작고 빠르면서도 과학·수학 등 전문 분야에서 인간 전문가 수준의 추론 능력을 갖췄다. 가장 눈에 띄는 성과는 AI의 한계를 시험하기 위해 고안된 ‘인류 최종 시험(HLE)’ 결과다. 석·박사급 전문가들이 AI가 풀기 어렵게 설계한 이 시험에서 뮤즈 스파크는 외부 도움 없이 스스로 답을 내는 ‘자체 사고’ 기준 50.2점을 기록했다. 이는 구글의 ‘제미나이 3.1 딥싱크(48.4)’와 오픈AI의 ‘GPT 5.4 프로(43.9)’를 앞선 수치로, 순수 지능 면에서 세계 최고 수준에 진입했음을 보여준다. 메타는 이처럼 향상된 추론 성능을 구현하기 위해 기술적 구조에도 변화를 줬다. 성능의 핵심은 새롭게 도입된 ‘심사숙고 모드’다. 여러 AI 에이전트가 동시에 문제를 분석하고 최적의 해답을 조율하는 기술로 사고의 깊이를 더했다. 이번 모델은 메타의 SNS 플랫폼은 물론 스마트 글래스 등에도 즉시 적용된다. AI 안경이 사용자가 보는 세상을 실시간으로 분석해 정보를 알려주고, 인스타그램 등에서 개인 비서처럼 대화를 나누는 식이다.
위로