부산외국어대학교는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 전담하는 '2025년 LLM 성능 평가 데이터셋 구축 사업‘에 최종 선정돼 2개 분야를 수주했다고 3일 밝혔다.
이번 사업은 '독자 AI 파운데이션 모델 프로젝트'와 함께 과기부에서 추진하는 2025년 '월드 베스트 LLM 데이터 활용 지원 사업'의 일환으로 △부산외국어대 △(주)인사이트정보 △(주)딥로딩 △(주)에프아이솔루션이 컨소시엄을 구성해 최종 선정됐다.
부산외대는 이번 사업에서 AI 파운데이션 모델의 성능 검증을 관장하며, 한국어와 한국 문화 기반의 고도화된 문제 해결 능력을 평가하는 데 중점을 둘 예정으로, 정량적·정성적 평가가 가능한 고품질 성능 평가 데이터셋을 구축해 초거대 AI의 성능과 글로벌 경쟁력을 높이는 데 기여할 예정이다.
이번에 구축되는 데이터셋은 텍스트 기반의 LLM(대규모 언어 모델) 성능 평가에 우선 활용되며, 향후에는 멀티모달(LMM) 및 에이전트형 AI(Agentic AI) 등 차세대 모델까지 포괄하는 복합적이고 정교한 성능 평가 체계의 기준이 될 것으로 기대된다.
박기양 부산외대 AI언어학습연구소장은 "현재 국내에는 한국어와 한국 사회·문화적 맥락을 반영해 AI 모델을 객관적으로 평가할 수 있는 공신력 있는 벤치마크와 평가 체계가 부족하다"며 “국내외 AI 모델 및 성능 평가 데이터 동향을 분석하고, 국내 활용 환경에 적합한 성능 평가 데이터 구축 전략과 평가 방법론을 수립해 국내 AI 기술 발전에 기여할 수 있도록 노력하겠다"고 밝혔다.