국립창원대학교는 지능로봇융합공학과 권오설 교수 연구팀이 모듈 프루닝 기반 신경망 구조 탐색 네트워크를 통해 가볍고 효율적인 위성영상 분석 캡셔닝 모델을 구축했다고 12일 밝혔다.
해당 논문은 전기·전자분야 상위 9%에 속하는 국제학술지인 ‘IEEE Geoscience and Remote Sensing Letters(I.F.: 4.4, JCR 상위 9.5%)’에 게재됐다.
이 연구는 위성 영상 데이터로부터 이미지 캡셔닝 분석을 위해 모듈 프루닝 기반 신경망 구조 탐색 방법을 제안했다. 제안한 알고리즘은 딥러닝 네트워크 상에서 3가지 모듈(인코더, 디코더, 트랜스포머)에 대해 각각 다른 프루닝 기법을 적용했다.
이 과정에서 신경망 구조 탐색 프로세스에 기반해 네트워크를 최적화하고, 정확도를 개선함과 동시에 실시간 처리가 가능하도록 설계했다.
제안한 방법은 성능 저하 없이 추론 효율성을 향상시키고 저장 공간 요구량을 동시에 줄일 수 있다.
이를 위성영상 데이터인 RSICD 셋에서 평가한 결과, 정확도를 향상시킴과 동시에 모델 크기는 42.8% 줄이는 성과를 달성했다.
연구책임자인 권오설 교수는 “이번 연구는 이종의 위성 데이터를 바탕으로 지구의 정보를 분석하는 기술로써, 최종적으로는 위성에서 텍스트에 기반해 지상의 정보를 실시간으로 제공하는 기틀을 마련했다는 점에서 의미가 있다”고 설명했다.
또한 “본 연구는 미국 프린스턴대와 공동연구의 성과로써 두 대학의 강점인 우주항공 분야와 인공지능 분야의 협업을 바탕으로 이뤄낸 결과물이다”라고 전했다.
해당 논문은 과학기술정보통신부 산하 정보통신기획평가원의 대학ICT연구센터사업 및 한국연구재단의 우수중견연구지원사업(글로벌협력)의 지원으로 진행됐다.