스마일게이트 AI센터, 인공지능 윤리성 연구 위한 혐오 발언 데이터 구축 및 공개

Home > > 기사내용

스마일게이트 AI센터, 인공지능 윤리성 연구 위한 혐오 발언 데이터 구축 및 공개

cnbnews 김수찬기자 | 2022.01.20 15:23:30

사진=스마일게이트 제공

스마일게이트 AI센터가 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만여개의 데이터를 기반으로 1만개의 데이터셋을 구축했다.

특히 데이터셋 구축 과정에서 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화 했다. 또 혐오 발언 분류를 위한 기준 모델을 공개했으며, 이를 통해 혐오 발언 추출이 가능하다.

스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 R&D를 실시하면서 확보된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.한편

이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지(링크)를 통해 1월 중 공개될 예정이다.

한우진 스마일게이트 AI 센터장은 “이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류 및 예방되어 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다”며 “향후 스마일게이트 AI 센터는 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.

☞ CNB뉴스 김수찬 기자의 다른기사 보기

주요 기사

: [기자수첩] 李 지시 ‘어공이 모든 책임’ 新품의법,…

: 사법개혁이냐 계파정치냐…與, ‘공취모’ 딜레마

: [구병두의 세상읽기] 노인 5명 중 1명 치매 온다… ‘…

: 대한항공, ‘드론쇼코리아 2026’ 참가

: “원포인트 개헌 국민투표 즉각 추진” 광주시-전국 시…

: KAI, 드론쇼 코리아서 ‘유무인 복합체계’ 공개…미래…

: [더불어금융(6)] “너도 살고 나도 사는 우리동네”…

: 거세지는 당내 ‘절윤’ 압박…출구 막힌 장동혁 대표

주요기사

[기자수첩] 李 지시 ‘어공이 모든 책임’ 新품의법, X피아…

: 24일 국무회의에서 이재명 대통령은 파격적인 새…

포토뉴스

: 곡성군, 섬진강 빚어낸 여행지…

ⓒ 2004~2024 Copyright by CNBNEWS. All rights reserved. (주)CNB미디어 사업자등록번호 : 206-81-40424 전화 02-396-3733 FAX:02-396-7330
대표이사 : 황용철 서울시 서대문구 연희로 52-20 정기간행물 등록번호 : 서울아00105 (2005.11.7) 발행일 : 2005.4.11 CNB뉴스 발행인·편집인: 황용철, 편집국장 : 도기천,
청소년보호책임자 : 류창림, CNB뉴스에 실린 내용 중 제휴기사, 칼럼 등 일부 내용은 CNB뉴스의 공식 견해와 다를 수 있습니다.