본문

뉴스 기사

[기사 제목]

스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축 및 공개

조회수 3717 | 루리웹 | 입력 2022.01.20 (09:18:30)
[기사 본문]

- 스마일게이트 AI 센터, 악플 및 혐오 발언 데이터셋 구축… 55만 여개 데이터 대상으로 1만 개 데이터 선별

- 혐오 발언의 사회적 맥락을 고려한 유형 세분화… 향후 게임 커뮤니티, 고객 응대 상담 챗봇, 여론조사 등 다양한 영역에서 활용 가능   


스마일게이트 AI센터(센터장 한우진)는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다. 


스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.    


악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다. 


특히 데이터셋 구축 과정에서 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화 했다. 또 혐오 발언 분류를 위한 기준 모델을 공개했으며, 이를 통해 혐오 발언 추출이 가능하다. 


스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다.게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 R&D를 실시하면서 확보 된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.한편 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지(링크)를 통해 1월 중 공개될 예정이다. 


스마일게이트 AI 센터 한우진 센터장은 “AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 인공지능이 사회에 미치는 문제에 대해서 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다. 특히 이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류 및 예방되어 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다”며 “향후 스마일게이트 AI 센터는 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다. 

 

[사진자료] 스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축_0120.png

 


김영훈 기자   grazzy@ruliweb.com




관련게임정보 목록

관련 정보

기     종

온라인/PC/아이폰/안드로이드

발 매 일

장     르

가     격

제 작 사

스마일게이트 AI센터

기     타



댓글

목록보기

댓글 | 12
1


BEST
세아가 데이터 쌓아주는건가?!
22.01.20 09:28
(2032750)

121.135.***.***

BEST
댓글 이미지 입니다. 이미지를 보려면 여기를 눌러주세요.
여기도 필터링이 필요해욧!
22.01.20 17:49
(5344959)

182.210.***.***

BEST
ㄱㄱ으로 인한 임신을 말하는듯..모든 임신이 축복받을 순 없으니까
22.01.20 11:53
(5488557)

106.101.***.***

BEST
임신은 축복이지란 말이 실제로 쓰이는 상황이 문제인거니 필터링해야할듯. 저런 어감이 정상적으로 쓰일 일이 없으니 AI가 잘 판단한듯
22.01.20 12:48
BEST
로아 수라도 익명섬이었을 때 데이터만 입력해도 충분할 듯
22.01.20 10:34
BEST
세아가 데이터 쌓아주는건가?!
22.01.20 09:28
패드립 DB
22.01.20 09:29
'임신은 축복이지!' 가 왜...?
22.01.20 10:07
일해라 안즈
나도 그 생각했는... 새생명이 생긴건 축복 아니야? | 22.01.20 10:47 | | |
BEST
일해라 안즈
ㄱㄱ으로 인한 임신을 말하는듯..모든 임신이 축복받을 순 없으니까 | 22.01.20 11:53 | | |
CHUPACABRA
ㄱㄱ으로 인한 임신인지 아닌지 단어만 보고 대화만 보고 알 수 없지 않나?? | 22.01.24 10:11 | | |
BEST
로아 수라도 익명섬이었을 때 데이터만 입력해도 충분할 듯
22.01.20 10:34
임신이 왜??
22.01.20 12:40
(5488557)

106.101.***.***

BEST
임신은 축복이지란 말이 실제로 쓰이는 상황이 문제인거니 필터링해야할듯. 저런 어감이 정상적으로 쓰일 일이 없으니 AI가 잘 판단한듯
22.01.20 12:48
BEST
댓글 이미지 입니다. 이미지를 보려면 여기를 눌러주세요.
여기도 필터링이 필요해욧!
22.01.20 17:49
이미 채용 사이트에서 인공지능이 새벽까지 잘도 걸러주고 계시던데?
22.01.21 01:13
다른건 이해가 되는데 임신 단어 필터링은 좀 애매하지 않나?? 안좋은 상황에서만 쓴다는 보장도 없고
22.01.24 10:12


1




목록보기
BEST 뉴스

PC/온라인
비디오/콘솔
모바일
PC/온라인
비디오/콘솔
모바일
PC/온라인
비디오/콘솔
모바일

BEST 유저정보
콘솔
PC
모바일
취미
BEST 게시글
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티
게임
애니/책
갤러리
커뮤니티


X