한국과학기술원(KAIST) 연구진이 영상 속 상황을 이해해 보다 현실감 있는 효과음을 자동 생성하는 인공지능(AI) 기술을 개발했습니다.
카이스트는 전산학부 오태현 교수 연구팀이 영상 속 물리 정보를 스스로 추론해 소리를 생성하는 AI 기술 '파바스(PAVAS)'를 개발했다고 오늘(26일) 밝혔습니다.
포항공과대학교(POSTECH)와 소니 AI가 함께 참여한 이번 연구는 단순히 영상 속 사물을 인식하는 수준을 넘어, '왜 이런 소리가 나야 하는지'까지 AI가 이해하도록 설계된 것이 특징입니다.
연구팀은 AI가 영상 속 움직임과 주변 환경을 분석해 물체의 무게와 속도를 추정하고, 이를 효과음 생성 과정에 반영하도록 했다고 설명했습니다.
실제 공개된 데모 영상을 보면 파바스는 물체 간 충돌이나 타격 등 물리적 상호작용이 발생하는 장면에서 완벽하진 않지만, 실제 환경과 매우 유사한 소리를 생성합니다.
물체의 질량이나 속도가 달라질 때 소리의 크기와 음색도 자연스럽게 변화합니다.
연구팀은 파바스가 영상 속 객체의 움직임과 충돌 특성을 분석해 장면과 정밀하게 맞아떨어지는, 현실적인 효과음을 생성한다고 설명했습니다.
향후 이 기술은 영화·게임 음향 제작 자동화는 물론 증강현실(AR)·가상현실(VR), 메타버스, 로보틱스 시뮬레이션 등 다양한 분야에서 활용될 수 있을 것으로 기대됩니다.
오태현 교수는 "향후 텍스트와 영상, 음성 등 다양한 정보를 동시에 이해하고 처리하는 차세대 AI의 핵심 기반 기술로 확장될 수 있을 것"이라고 말했습니다.
▣ KBS 기사 원문보기 : http://news.kbs.co.kr/news/view.do?ncd=8570111
▣ 제보 하기
◇ 카카오톡 : 'KBS제보' 검색
◇ 전화 : 02-781-1234
◇ 홈페이지 : https://goo.gl/4bWbkG
◇ 이메일 :
[email protected]
Copyright ⓒ KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지
#카이스트 #인공지능 #효과음AI #AI #한국과학기술원 #소리자동구현 #AR #VR #파바스 #PAVAS