서울신문 검색

한기대 연구팀, 깊이 영상 노이즈에 강한 ‘사족보행 로봇 파쿠르 기술’ 개발

계단·단차 등 주변 지형 안정적 인식국제학술대회 ‘IROS 2026’ 논문 채택 한국기술교육대학교(총장 유길상)는 컴퓨터공학부 한연희 교수 연구팀이 ‘깊이 영상(depth image)의 센서 노이즈에 강인한 사족보행 로봇 파쿠르* 기술’ 개발에 성공했다고 23일 밝혔다. 깊이 영상은 카메라와 물체 사이 거리 정보를 픽셀 단위로 담은 영상이다. 로봇이 계단·틈·단차·장애물 등 주변 지형의 3차원 구조 파악에 활용된다. 연구 핵심은 실제 환경에서 발생하는 깊이 영상의 노이즈 영향을 줄여, 로봇이 장애물을 안정적으로 통과하게 하는 것이다. 기존 시각 기반 보행 로봇 연구는 학습 단계에서 ‘깨끗한 깊이 영상’을 가정하고, 실제 운용 시 발생하는 센서 노이즈는 후처리 필터에 의존해 왔다. 필터의 최적값은 조명·표면 재질·거리 분포에 따라 달라져, 환경이 바뀔 때마다 다시 조정해야 하는 한계점이 발생한다. 연구팀은 로봇이 주변 지형을 이해하고 예측하는 학습 단계에서부터 깊이 영상의 노이즈에 강하도록 설계된 인식 프레임워크 ‘DAWN(Denoising and Alignment in World models for Noise-robustness)’을 제안했다. DAWN은 노이즈가 섞인 영상과 깨끗한 영상을 함께 비교·학습하도록 설계해 실제 환경에서도 로봇이 불완전한 영상 정보에 흔들리지 않고 계단·단차 등 주변 지형을 안정적으로 인식할 수 있게 해 로봇의 환경 인식 및 제어 안정성을 높였다. 이 기법은 학습 단계에서만 적용되므로 실제 로봇이 동작할 때 추가 연산 비용이 발생하지 않는다. 환경에 따라 필터값을 일일이 조정하지 않아도 돼, 조명·표면 재질·거리 조건이 달라지는 다양한 실제 환경에 적용할 수 있다는 장점이 있다. 연구팀은 개발한 기술을 사족보행 로봇 Unitree Go1에 적용한 결과 높이 18cm 계단, 폭 70cm 틈, 높이 45cm 단차를 별도 추가 학습 없이 제로샷*으로 통과했다. 한연희 교수는 “이번 연구는 학생 연구자들이 문제 정의부터 실제 로봇 검증까지 전 과정을 주도해 거둔 성과라는 점에서 더욱 의미가 크다”고 강조했다. 이어 “불완전한 센서 데이터와 다양한 환경 변화에 대응해야 하는 실환경에서의 로봇 인식 기술의 안정성을 높이는 데 기여할 것으로 기대한다”고 설명했다. 이번 논문은 로봇공학·자율주행·지능형 시스템 분야를 대표하는 국제학술대회 ‘IROS 2026’(IEEE/RSJ International Conference on Intelligent Robots and Systems)에 ‘DAWN: Noise-Robust Quadruped Parkour via Depth-Denoising World Models’라는 제목으로 채택됐다. 논문은 2026년 9월 27일부터 10월 1일까지 미국 펜실베이니아주 피츠버그에서 발표될 예정이다.

2026-06-23 16:22 서울신문

하늘 사진 본 AI “붉은빛 어우러져”… LG ‘캡셔닝 인공지능’ 육성

인공지능이 이미지 이해·설명의학 분야 등 다양한 활용 기대 LG가 이미지를 이해하고 설명하는 인공지능(AI)을 키우는 데 속도를 낸다. 글로벌 AI 연구자들을 대상으로 AI의 이미지 이해 능력을 평가하는 대회를 세계에서 처음으로 열며 인간의 시각 인지 능력에 한발 더 가까워진 초거대 멀티모달 AI 기술 생태계를 넓힌다. LG는 2월 1일부터 오는 4월 말까지 제로샷 이미지 캡셔닝을 주제로 한 ‘LG 글로벌 AI 챌린지’를 온라인으로 개최한다고 31일 밝혔다. 제로샷 이미지 캡셔닝은 AI가 사람처럼 처음 본 사물이나 동물, 풍경 등이 포함된 이미지를 봤을 때 학습한 데이터를 기반 삼아 스스로 이해하고 판단한 결과를 텍스트로 설명하는 기술이다. 이 기술이 고도화되면 사람들의 일상에 실질적인 도움이 되는 기술 개발을 앞당길 수 있다. 온라인상에 매일 올라오는 방대한 분량의 이미지 데이터를 AI가 자동으로 캡션과 키워드를 만들어 검색의 정확도, 편의성을 높여 줄 수 있다. 의학 전문 데이터를 학습해 의학 영상을 분석하는 ‘의학 전문가 AI’로도 활용할 수 있다. LG AI연구원은 공동연구센터를 세워 초거대 멀티모달 AI인 ‘엑사원’(EXAONE)을 연구 중인 서울대 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 함께 추진하는 셔터스톡과 함께 대회를 진행한다. 이경무 서울대 AI대학원 석좌교수는 “해당 기술은 AI가 인간의 지능에 얼마나 가까워졌는지 보여 주는 하나의 척도”라며 “학습 데이터 없이도 이러한 작업을 수행하는 제로샷 이미지 캡셔닝은 매우 도전적인 문제이자 세계적으로도 최근에 연구가 시작된 분야로, 우리나라의 AI 역량이 이미 세계적인 수준에 도달했음을 의미한다”고 평가했다.

2023-02-01 02:55 서울신문

AI가 처음 본 이미지 이해하고 설명...초거대 AI 키우는 LG

LG가 이미지를 이해하고 설명하는 인공지능(AI)을 키우는 데 속도를 낸다. 글로벌 AI 연구자들을 대상으로 AI의 이미지 이해 능력을 평가하는 대회를 세계에서 처음 열며 인간의 시각 인지 능력에 한 발 더 가까워진 초거대 멀티모달 AI 기술 생태계를 넓힌다.LG는 2월 1일부터 4월 말까지 제로샷 이미지 캡셔닝을 주제로 한 ‘LG 글로벌 AI 챌린지’를 온라인으로 개최한다고 31일 밝혔다. 제로샷 이미지 캡셔닝은 AI가 사람처럼 처음 본 사물이나 동물, 풍경 등이 포함된 이미지를 봤을 때 학습한 데이터를 기반삼아 스스로 이해하고 판단한 결과를 텍스트로 설명하는 기술이다. 이 기술이 고도화되면 사람들의 일상에 실질적인 도움이 되는 기술 개발을 앞당길 수 있다. 온라인상에 매일 올라오는 방대한 분량의 이미지 데이터를 AI가 자동으로 캡션과 키워드를 만들어 검색의 정확도, 편의성을 높여줄 수 있다. 의학 전문 데이터를 학습해 의학 영상을 분석하는 ‘의학 전문가 AI’로도 활용할 수 있다.LG AI연구원은 공동연구센터를 세워 초거대 멀티모달 AI인 ‘엑사원(EXAONE)’을 연구 중인 서울대학교 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 함께 추진하는 셔터스톡과 함께 대회를 진행한다. 이경무 서울대 AI대학원 석좌교수는 “해당 기술은 AI가 인간의 지능에 얼마나 가까워졌는지 보여주는 하나의 척도”라며 “학습 데이터 없이도 이러한 작업을 수행하는 제로샷 이미지 캡셔닝은 매우 도전적인 문제이자 세계적으로도 최근에 연구가 시작된 분야로 우리나라의 AI 역량이 이미 세계적인 수준에 도달했음을 의미한다”고 평가했다.

2023-01-31 15:59 서울신문