찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • SSTT
    2026-06-26
    검색기록 지우기
  • DAWN
    2026-06-26
    검색기록 지우기
  • PM
    2026-06-26
    검색기록 지우기
  • AB
    2026-06-26
    검색기록 지우기
  • RAG
    2026-06-26
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
5
  • 페르소나AI, STK 2026서 AI 로봇 시연에 관람객 대거 몰려…현장 ‘열기 후끈’

    페르소나AI, STK 2026서 AI 로봇 시연에 관람객 대거 몰려…현장 ‘열기 후끈’

    페르소나에이아이가 10일 서울 코엑스에서 개막한 ‘2026 STK(스마트 테크 코리아)’에 참가해 AI 로봇 시연을 진행했다고 밝혔다. 당일 행사장에는 해당 기업의 로봇 기술 시연을 확인하려는 방문객들이 전시 부스에 집중되며 피지컬 AI 기술에 대한 시장의 관심도를 반영했다. 전시 현장에서는 페르소나AI가 공개한 AI 로봇의 기동과 반응 속도를 확인하기 위한 관람객들의 대기열이 형성됐다. 해당 로봇에는 한국 각 지역 작업자의 사투리를 인식하도록 설계된 페르소나AI의 SSTT(Sovereign AI Speech to Text) 음성모델이 온디바이스 형태로 탑재됐다. 현장 진행자의 구두 명령에 따라 사족 보행 로봇과 휴머노이드 로봇이 구동하는 제어 과정이 공개됐으며, 다수의 관람객이 부스 주변에서 시연 과정을 촬영했다. 페르소나AI는 이번 전시회를 통해 LAM, VLA, sLLM 등 자체 개발한 인공지능 모델을 로봇 운영체제(OS)에 최적화하여 연동한 기술을 시연했다. 기업 측은 이를 기반으로 에이전틱 로봇 시장으로 사업 영역을 확대하고 초기에 진입하겠다는 계획을 공개했다. 기술의 개발 방향은 단순한 하드웨어 제어 단계를 넘어 AI 로봇이 상황 판단과 명령 실행을 동시에 수행하는 구조를 구축하는 것이다. 이번 기술 시연은 인공지능이 소프트웨어 환경을 넘어 물리적 영역으로 확장되는 피지컬 AI의 구현 가능성을 검증했다는 점에서 지표를 지닌다. 페르소나AI는 개발된 AI 로봇을 바탕으로 산업 및 국방 등 실제 현장에서 적용 가능한 활용 방안을 도출했으며, 관람객들에게 차세대 인공지능 기술의 발전 단계를 제시했다. 인공지능과 로봇 인프라가 결합한 기술이 제조, 물류, 서비스 등 다양한 산업 부문으로 확산될 것이라는 시장의 전망도 현장에서 수집됐다. 전시장을 방문한 업계 관계자들과 일반 관람객들은 페르소나AI의 시연 부스에서 기술 규격과 적용 범위에 대한 질의응답을 진행했으며, 시연 종료 이후에도 부스를 통한 상담이 지속됐다. 한편, 차세대 기술의 동향을 확인 수 있는 국내 산업 전시회인 ‘STK 2026’은 오는 12일까지 사흘간 코엑스에서 개최되며, 인공지능, 로봇공학, 제조 자동화 등 다양한 솔루션이 전시된다. 행사 초반부터 관람객의 방문이 이어지고 있는 페르소나AI 부스는 피지컬 AI 분야에 대한 업계의 수요를 보여주는 사례로 평가받고 있다.
  • AI회사가 만드는 피지컬AI 로봇 공개, 페르소나AI 행사장 부스에 수많은 인파 몰려

    AI회사가 만드는 피지컬AI 로봇 공개, 페르소나AI 행사장 부스에 수많은 인파 몰려

    페르소나에이아이(페르소나AI, 대표 유승재)가 5월 6일부터 8일까지 서울 코엑스에서 개최되는 ‘2026 국제인공지능대전(AI EXPO KOREA)’에 참가해 피지컬AI 로봇 기술을 시연한다. 이번 행사에서 페르소나AI는 음성 명령을 기반으로 상황을 관찰하고 판단해 행동하는 에이전틱(Agentic) 로봇 기술과 자체 개발한 로봇 운영체제(OS) 역량을 공개한다. 전시 현장에서는 한국, 미국, 중국 등 3개국 공동연구를 통해 개발된 휴머노이드와 사족보행 로봇이 소개된다. 해당 로봇군에는 페르소나AI의 자체 AI 엔진이 탑재됐으며, 음성 인식 기반의 지능형 로봇 기술이 적용됐다. 특히 지역별 사투리까지 인식 가능한 온디바이스 기반 SSTT(Sovereign AI Speech to Text) 음성 모델을 내장해 응답 속도를 높이고 데이터 보안성을 강화했다. 이는 비용 효율성을 개선해 산업 현장 및 일상 환경에 적용 가능한 수준으로 구현됐다. 공개된 로봇은 단순 명령 수행을 넘어 주변 상황을 스스로 판단하는 에이전틱 기능을 보유했다. 사용자가 “덥다”고 말할 경우 주변 환경을 인식해 에어컨을 작동하거나 물을 제공하는 등 능동적 행동을 수행한다. 이는 기업이 자체 보유한 복수의 AI 모델을 로봇에 탑재해 기술적 패러다임을 제시한 사례다. 참관객들은 전시 기간 중 일 4회 진행되는 시연을 통해 피지컬AI의 기술 방향성을 확인할 수 있다. 페르소나AI는 경량화된 원천 AI 엔진을 앞세워 로봇 OS 개발을 선도하며 피지컬AI 시대를 앞당기고 있다. 인터넷 연결이나 GPU 없이도 동작하는 경량 AI 모델을 기반으로 CES 2025·2026 혁신상 연속 수상과 Gen AI Competition 등 국제 대회 수상을 통해 글로벌 기술 경쟁력을 입증해왔다. 또한 LAM, VLA, sLLM 등 자체 개발한 AI 모델을 로봇 OS에 최적화해 에이전틱 로봇 시장 선점을 목표로 하고 있다. 회사는 온디바이스 기반 AI와 한국어 특화 음성 인식 기술을 바탕으로 로봇, 제조, 물류 등 다양한 산업 분야로 적용 범위를 점차 넓혀갈 계획이다.
  • 페르소나에이아이, 소버린AI를 위한 사투리인식 음성AI로 언어 주권 강화

    페르소나에이아이, 소버린AI를 위한 사투리인식 음성AI로 언어 주권 강화

    글로벌 인공지능(AI) 패권 경쟁이 심화하면서 각국이 자국의 언어·데이터·인프라를 기반으로 한 ‘소버린 AI(Sovereign AI)’ 구축에 속도를 내고 있다. 소버린 AI는 단순히 AI를 보유하는 차원을 넘어 국가의 언어와 문화, 산업 데이터를 외부 의존 없이 스스로 통제·운영할 수 있는 AI 주권을 의미한다. 특히 음성 AI는 언어 주권을 직접적으로 좌우하는 핵심 기술로 평가받는다. 이러한 흐름 속에서 페르소나에이아이(대표 유승재, 이하 페르소나AI)는 2년 동안의 집중 개발 끝에 한국어의 특성을 정밀하게 구현한 차세대 음성 AI 모델 ‘SSTT(Sovereign AI Speech to Text)’를 공개했다. SSTT는 단순한 음성 인식을 넘어 국내 최고 수준의 음성 데이터 정밀도를 갖춘 것이 특징이다. 이번 모델은 4000만개 이상의 한국어 발화 데이터셋(약 5만 시간 이상 음성 데이터)을 학습해 압도적인 이해도를 갖췄다. 전체 학습량의 약 4분의 1 수준인 1만 3200시간을 사투리 데이터에 할애했다. 이를 통해 경상·전라·충청·강원·제주 등 5대 권역별 방언과 고유 어휘를 정밀하게 구분한다. 또한 AI가 인식하기 어려운 짙은 방언, 고유 어휘, 60세 이상 고령 화자의 음성 특성까지 반영해 세대와 지역을 아우르는 소통이 가능해졌다. 특히 표준어 중심의 기존 음성 인식 한계를 넘어 한국어 사투리 인식과 화자 분리가 가능하도록 설계된 점이 큰 특징으로 실시간 및 오프라인에서도 동작한다. 전처리 기능을 지원해 잡음·반향 감쇄, 원거리 인식을 위한 자동이득제어(AGC), 딥러닝 기반 음성구간 검출, 화자변곡점 검출과 같은 고품질의 음성 기술이 집약돼 있다. 기존의 음성 인식 모델(STT, Speech to Text)은 소리를 텍스트로 변환하는 핵심 기술이지만 사투리·억양·속도 차이로 인해 실제 산업 현장에서는 인식 정확도가 낮다는 한계가 있었다. 이로 인해 콜센터, 공공 민원, 의료·제조 현장 등 음성 인식 수요가 높은 분야에서도 시장 확산이 더디게 진행돼 왔다. 페르소나AI의 SSTT는 이러한 문제를 정면으로 해결했다. 최대 20명까지 화자 분리가 가능해 기존 4~5명 수준에 머물렀던 기술 대비 획기적인 성능 향상을 이뤘다. 다자간 동시 대화 상황에서도 ‘누가, 어떤 말을 했는지’를 정확히 구분할 수 있어 회의 기록, 현장 관제, 다중 사용자 인터페이스 등 활용 범위를 크게 확장했다. 이 같은 기술적 진보는 피지컬 AI(Physical AI) 시대를 대비한 핵심 요소로 평가된다. 앞으로 로봇, 키오스크, 산업 장비, 자율 시스템 등 대부분의 피지컬 AI 기기는 음성을 중심으로 제어·상호작용하게 될 것으로 전망된다. 이 과정에서 특정 국가나 기업의 외산 음성 모델에 의존할 경우 데이터 주권·보안·서비스 연속성 측면의 구조적 리스크가 발생할 수 있다. 업계에서는 페르소나AI의 차세대 음성 AI 모델을 소버린 AI 관점에서 매우 중요한 전략 자산으로 평가하고 있다. 한국어, 특히 지역 사투리까지 정밀하게 인식하는 대형 음성 모델은 단기간에 외부에서 대체하기 어려운 기술로 국가 차원의 AI 주권 확보에도 직결된다는 분석이다. 페르소나AI는 AI 모델 개발부터 산업별 솔루션화까지 수행하는 기업으로 AICC(AI 컨택센터)와 생성형 AI(Gen AI) 분야를 주력으로 하고 있다. 최근에는 지난해에 이어 CES 2026 혁신상을 수상하며 2년 연속 3관왕을 기록, 국제 무대에서도 기술 경쟁력을 입증했다. 또한 피지컬 AI의 핵심 엔진으로 평가되는 VLA(Vision-Language-Action) 기술을 개발하며 로봇·기기·AI를 연결하는 차세대 운영 구조를 제시하고 있다. 페르소나AI 관계자는 “소버린 AI 경쟁에서 가장 중요한 것은 단순한 모델 규모가 아니라 자국 언어와 실제 산업 환경을 얼마나 깊이 이해하느냐”라며 “SSTT는 한국형 소버린 AI의 실질적 기반이 될 수 있는 핵심 모델”이라고 밝혔다. 소버린 AI가 국가 경쟁력의 핵심으로 부상한 지금, 한국어 음성 주권을 겨냥한 페르소나AI의 행보가 피지컬 AI와 공공·산업 전반에 강력한 파급효과를 가져올 것으로 기대된다.
  • 직접 만든 AI 스피커… 음성 인식 ‘척척’

    직접 만든 AI 스피커… 음성 인식 ‘척척’

    코딩 기본지식 있으면 조립 어렵지 않아 명령 실행 등 기가지니 핵심기능 탑재 개발자 포털 통해 원하는 명령어 개발 공업 로봇도 연결 가능… 활용 무궁무진KT가 이용자 스스로 인공지능(AI) 스피커를 만들 수 있는 ‘AI 메이커스 키트’를 지난달 말 출시한 이후 중·고등학교 코딩 교육 교구로 입소문이 퍼지고 있다. 지난 17일 서울 서초구 KT우면연구센터 내 AI테크센터에서 개발자들을 따라 조립부터 구동까지 직접 체험해 봤다. 프로그래밍 언어 등 코딩 기본 지식이 전무하다면 사실 ‘DIY’(스스로 만들기)는 벅찰 수 있다. 하지만 기초 지식이 있거나 안내자가 있다면 쉽게 가능하다. 키트 구성품의 핵심은 ‘내맘대로 AI 스피커’다. 음성을 입·출력하는 마이크와 스피커, 음성을 전자 신호로 변환하는 보이스키트, 음성 대신 AI를 호출하는 스위치, 운영체제(OS)를 저장할 SD 카드, 기기의 ‘뇌’에 해당하는 소형 컴퓨터 ‘라즈베리파이3 모델B’로 이뤄졌다. 유튜브에 올려진 영상 혹은 키트에 들어 있는 잡지를 보며 조립할 수 있다. 스피커 조립을 마친 뒤 KT가 만든 ‘기가지니 개발자 포털’ 가입을 신청하면 스피커를 PC와 연결해 KT가 미리 만들어 둔 기본 예제를 설치할 수 있다. 예제는 기기가 호출어를 듣고 반응하는 코드, 음성을 인식해 문자로 출력, 또는 반대로 문자를 음성으로 재생하는 코드, 질문받고 답변하는 코드 등 9개다. 개발자가 스피커와 연결된 PC 화면을 띄워 놓고, 호출어를 듣고 반응하는 예제 1번(node ex1_kwssttdss. js 0)을 입력한 뒤 “기가지니”라고 부르자 프로그래밍 언어로 가득 찬 화면 끝에 ‘호출어가 감지됐다’(KWS Detected)라고 표시되며 스피커에서 “띠리링” 소리가 났다. 예제 2번을 실행하고 “안녕하세요”라고 말했더니 화면에 문자로 ‘안녕하세요’라고 떴다. 예제 9개만 있어도 AI 스피커의 기본 기능을 실행할 수 있다. 개발자나 코드를 짤 수 있는 사용자는 개발자 포털을 통해 명령어를 만들고 기기에 적용할 수 있다. 이렇게 만들어진 AI 스피커의 활용 가능성은 무궁무진하다는 게 KT의 설명이다. 전동 부품을 실은 레고 자동차부터 공업용 로봇까지 스피커에 연결할 수 있다. 박희철 KT 융합기술원 AI테크센터 eco기술팀장은 “플랫폼에 자동화기기 조작 단말을 탑재할 수 있느냐는 기업들의 문의가 벌써 들어오고 있다”고 말했다. AI 스피커를 로봇손 두 개와 연결해 가위바위보 게임을 하는 장면도 볼 수 있었다. 스피커의 구호에 맞춰 로봇손이 가위바위보를 내고, 보를 내서 이긴 오른손은 ‘I LOVE YOU’를 뜻하는 영어 수화로 세리머니를 했다. 박 팀장은 “손목 관절이 있는 로봇손을 이용해 음성을 수화로 통역하는 로봇손을 만들어 보려 한다”고 계획을 밝혔다. 김민석 기자 shiho@seoul.co.kr
  • ‘뭐든 연결하면 음성인식’… 직접 만드는 AI스피커

    ‘뭐든 연결하면 음성인식’… 직접 만드는 AI스피커

    코딩 기본 모르면 혼자는 어려워 레고부터 공장기기까지 무한 확장“저희 기계 연결 되나요” B2B 문의 지난 7월 말, 이용자가 직접 인공지능(AI) 스피커를 만들 수 있는 ‘AI 메이커스 키트’를 출시하면서 KT가 기대한 건 두 가지다. 중소·벤처기업 등이 AI 기술을 이용한 제품과 서비스를 만들 수 있는 음성인식 플랫폼을 제공, 국내 AI 저변을 넓히는 것이 첫번째다. 두번째는 학생들이 코딩을 배우고 실습할 수 있는 ‘교구’로서 AI 메이커스 키트가 쓰이는 것이다. 출시 한달이 채 안된 지난 17일 서울 서초구 KT우면연구센터 내 AI테크센터에서 만난 개발자들은 “키트는 음성인식 관련 개발자용으로 만들어졌지만, 벌써 중·고등학교 교구로 기능이 확장됐다”면서 “처음부터 교구로 만들었다면 확장성이 한정돼 이런 효과를 얻지 못했을 것”이라고 말했다. 이날 체험해 본 AI 메이커스 키트는 역시 코딩 언어 등 기본 지식이 없는 상태에서 혼자 만들긴 어려웠다. 이날은 ‘node ex7_kwssttdss. js 0’(예제 7번 실행)와 같은 언어를 기본부터 공부하는 대신 개발자들이 직접 만들고 작동시키는 과정을 따라가 봤다.키트 구성품의 핵심인 ‘내맘대로 AI스피커’는 음성을 입·출력하는 마이크와 스피커, 음성을 전자 신호로 변환하는 역할을 하는 보이스키트, 음성 대신 AI를 호출할 수 있는 스위치, 운영체계(OS)를 저장할 SD카드, 기기의 ‘뇌’에 해당하는 소형 컴퓨터 ‘라즈베리파이3 모델B’로 이뤄졌다. 유튜브에 올라간 영상이나 키트에 동봉된 잡지 ‘메이커스’를 보며 누구나 손쉽게 조립할 수 있다. 조립이 끝난 스피커를 일할 수 있게 만들기 위한 가장 쉬운 방법은 KT가 만든 ‘기가지니 개발자포털’에 가입해 서비스를 신청하는 것이다. 가입 뒤 간단한 절차를 거치면 스피커를 PC와 연결, 라즈베리파이를 구동하는 OS와 함께 KT에서 만들어 둔 기본 예제를 한번에 설치할 수 있다. 기본 예제는 기기가 호출어를 듣고 반응하거나, 음성을 인식해 문자로 출력, 또는 반대로 문자를 음성으로 재생하는 코드, 음성·텍스트로 질문을 받고 답변하는 코드 등 9개다. 개발자는 조립한 스피커와 연결된 PC 화면을 띄워 놓고 호출어를 듣고 반응하는 예제 1번(node ex1_kwssttdss. js 0)을 입력한 뒤 “기가지니”라고 부르자 무수한 프로그래밍 언어로 가득 찬 화면 끝에 ‘호출어가 감지됐다’(KWS Detected)라고 표시되며 스피커에서 “띠리링” 하는 소리가 났다. 예제 2번을 실행한 뒤 “안녕하세요”라고 말했더니 화면에 문자로 ‘안녕 하세요’가 표시됐다. 개발자포털에서 제공하는 예제 9개만 있어도 말을 알아듣고 대답하는 AI스피커의 기본 기능은 실행할 수 있다. 개발자나 코드를 짤 수 있는 사용자는 개발자포털을 통해 언어를 조합해 명령어를 만들고 기기에 적용할 수 있다. 이렇게 만들어진 AI스피커는 활용 가능성이 무궁무진하다는 게 KT 측 설명이다. 스피커엔 전동 부품이 들어있는 레고 자동차부터 공업용 로봇까지 연결할 수 있다. 박희철 KT 융합기술원 AI테크센터 eco기술팀장은 “벌써 플랫폼에 자신들 자동화기기 조작 단말을 탑재할 수 있느냐는 기업의 문의가 들어오고 있다”고 말했다. AI 메이커스 키트의 뛰어난 확장성은 먼저 ‘개발자들의 장난감’이라 불리는 미니 컴퓨터 라즈베리파이를 채용하고 있기 때문이다. 라즈베리파이에 달린 다용도 입출력 포트(GPIO)는 무수한 종류의 장치들과 연결해, AI스피커가 보내는 명령 신호를 기기에 적합한 형태로 전달한다. 또 KT가 개발한 플랫폼과 개발자포털은 라즈베리파이를 쉽게 설정하고 사용할 수 있게 만들어져 교육에 참여한 현직 개발자들이 놀랄 정도라고 관계자는 전했다.이날 KT우면연구센터에선 AI스피커를 로봇손 두개와 연결, 기가지니를 부르면 두 손이 가위바위보 게임을 하도록 설정해 놓은 걸 볼 수 있었다. KT 개발자들은 손에 각각 ‘코리’ ‘토리’라고 이름을 붙였다. 자사 AI 캐릭터 이름이다. 게임이 시작되니 AI스피커의 구호에 맞춰 손들이 가위바위보를 했다. ‘보’를 낸 오른쪽 손이 이기자 AI스피커는 “토리가 이겼습니다”라고 말했다. 가위바위보에 이긴 오른쪽 손은 ‘I LOVE YOU’를 뜻하는 미국 수화로 ‘승리 세리모니’를 했다. 간단해 보여도 손가락 하나하나에 코딩이 돼 있다고 한다. 박 팀장은 “앞으로 손목 관절이 있는 로봇손을 이용해 음성으로 이야기하면 수화로 통역하는 로봇손을 만들어 보려 한다”고 말했다. KT는 AI 메이커스 키트 출시 외에도 AI 플랫폼 확산에 공을 들이고 있다. 이날 방문한 AI테크센터를 지난해 개소한 것도 그 일환이다. KT는 또 AI 전문인력 육성을 위한 교육센터를 설립하고, 개발자들이 관련 앱을 개발할 수 있도록 기가지니의 프로그램 설계도에 해당하는 API를 공개했다. 서울대 공과대, 카이스트(KAIST) 과학영재교육연구원 등과는 AI 메이커스 키트를 활용한 교육과정을 신설해 운영하고 있다. 김민석 기자 shiho@seoul.co.kr
위로