먼저 사건을 다루기 전에 AI의 학습에 대해 알아봅시다
먼저 간단한 질문을 해보려고 하는데요
이 캐릭터의 이름은 무엇일까요??
대답할 수 있는 사람은 거의 없을 것입니다
대충 애니도 망하고 가챠겜도 폭파된 마이너 IP 때문이죠
그런 여러분들을 위해서 다음과 같은 정보를 드리겠습니다
이 캐릭터의 이름은 '미나모토 모모' 입니다
자 그럼,
나의 이름을 말해 봐라!
넵, 미나모토 모모입니다
위에서 배웠으니 금방 말하실 수 있을 것입니다
이제 여러분은
생판 처음 보는 짤이여도
짤의 캐릭이 미나모토 모모인것을 알 수 있습니다
여러분은 이제 '미나모토 모모'를 학습하신 것입니다
여러분이 '미나모토 모모'를 학습하게 된 것은 이 캐릭터의 생김새와, '미나모토 모모'라는 정답이 머릿속에서 입력되었기 때문입니다
여기서 위 그림은 학습 데이터가 되겠고, '미나모토 모모'라는 텍스트는 이 학습 데이터에 대한 정답이 됩니다
AI 또한 학습 시 이러한 학습 데이터와 이에 대응되는 정답을 보고 학습을 진행합니다
이번엔 좀 다른 짤을 가져왔습니다
이 캐릭터도 미나모토 모모로 보이시나요?
대부분은 그렇다고 하실겁니다
위에서 계속 봐온 닌자복, 카타나, 망또 등의 요소가 없어도 이 캐릭은 미나모토 모모라는것을 아실 수 있을 겁니다
인간의 우수한 추론능력으로 캐릭터의 머리색, 헤어스타일, 그림체 등을 종합하여 이 캐릭은 미나모토 모모라는 결론을 내린 것이지요
그렇다면 AI 이야기를 해 봅시다
이런 AI 한테
이 짤 = 미나모토 모모라는 라벨을 가진 데이터를 학습시키고
자! 나의 이름을 말해봐라!!
물론 과정과 결과를 예상하기 힘든 AI 특성상 어떻게 될지는 모르겠지만 십중팔구는
흥, 바카밧카! 몰라!
이럴겁니다
인간은 우수한 추론능력으로 사진 한장만 봐도 '미나모토 모모'를 구성하는 요소를 파악하여
다른 사진을 식별하는 것에 사용할 수 있지만 AI는 그렇지 않거든요
그래서 '미나모토 모모'를 구성하는 '라벨'들을 우리가 다 '라벨링'해줘야 합니다
"아아, 이건 미나모토 모모라는 것이다------
핑크머리에 숏컷에 유루유리 그림체에 가끔씩은 카타나를 들고 있지"
바카밧카! 핑크머리가 뭔데!
....아아, 이게 핑크머리라는 것이다
바카밧카! 카타나가 뭔데!
...아아, 이게 카타나라는 것이다
으아아아아아악!!!
즉 '미나모토 모모'를 '머리색', '헤어 스타일', '그림체' 3가지 요소로 판단한다면
전통적은 AI학습론으로 봤을 때 최소 9개의 라벨이 되어있는 훈련 데이터가 필요한 것이죠
그리고 이 9개의 학습 데이터는 누군가가 '라벨링'을 해줘야 합니다.
물론 정답을 알고 있는 사람이 해줘야하죠
아직까지는 고작 9개, 할만합니다
하지만 미나모토 모모쨩의 동료는 5명!!!
얘네들까지 학습을 시킨다면???!
아니 ㅅㅂ! 거기서부터라고???
이렇게 AI가 판단을 해야하는 요소가 많아질수록 학습 데이터의 요구량이 기하급수적으로 늘어납니다!
그리고 이 데이터의 라벨링은 인간이 다 손을 해줘야 합니다
AI한테 정답을 알려줘야 학습을 하니까요!
그래서 AI가 이런 복잡한 그림에 대해서 '올바른 판단'을 내리게 만들기 위해선
인간의 손으로 라벨이 된 수만장의 학습 데이터가 필요합니다
정말 아득한 작업이지요
실제로 AI개발하는 회사들은 이런 학습 데이터에 라벨링을 하는 알바를 굴리기도 합니다
재택근무가 가능해서 요즘 부업으로 좀 뜨고있다나봐요
그런데!!!
2022년 10월!
원래 AI소설 서비스를 제공하던 NovelAI (통칭 NAI)에서 그 누구보다도 빠르게 이런 씹덕그림 AI 서비스를 시작합니다!!
그림 AI 모델인 스테이블 디퓨전이 2022년 8월에 발표되었으니 NAI측은 단 2개월만에!!!
이 까마득한 데이터 라벨링 작업을 거치고 상업화 레벨까지 완성시켰다는 것이죠!!
그 방법이 정말 씽크빅했는데...!
단부루를 대털하자!!!
단부루는 각종 씹덕 이미지를 불펌해다가 모아놓는 그런 싸이트였는데요
이 싸이트는 tag라는 형식으로 해당 이미지를 설명하는 방식을 가지고 있었습니다!
그렇습니다! 단부루의 이 tag가 AI에서 말하는 '라벨'인 것입니다
단부루는 근 20년간 집단지성과 무급봉사로 운영되며 라벨링 데이터 고물보블린이 된 것입니다!!
원래라면 알바를 구해서 데이터에 일일히 라벨링을 하는 상황!
단 털!
(단부루를 털자는 뜻ㅎ)
물론 원작자 허가없이 이미지를 수집하는 단부루,
이걸 또 허가없이 긴빠이한 NAI
윤리적으로 이게 맞나 싶기도 하고 저작권따위도 개나 줘버린 상황
AI업계에서 긍정적인 사례는 분명 아닙니다
하지만 단부루를 통째로 대털 해버린 NAI의 김성모스러움은 아마 두고두고 회자될 것입니다
어떻게 끝낼줄 모르겠어서 모모쨩 수영복짤



















(IP보기클릭)218.55.***.***
그림ai 근원이 다 저 부루 사이트 긴빠이된 학습 데이터를 계속 쌓아온거라 근본적으로는 딸깍충 새끼들은 도덕적 문제를 피할수없긴함
(IP보기클릭)220.73.***.***
너무 길어서 안읽었는데 싸대기 후리는 짤 밖에 모름
(IP보기클릭)119.71.***.***
인간이 찾기 쉽게 태그 라벨링 해놓은거니까 AI한테도 좋은 학습자료 ㅋㅋㅋㅋ
(IP보기클릭)210.105.***.***
놀랍게도 콜라보가 있긴 함
(IP보기클릭)27.113.***.***
무기미야 미토!
(IP보기클릭)203.232.***.***
히토미등 불법사이트들, 무료봉사다보니 태그 잘 안 달려있는 경우 많은데, 단부루는 좀 열심히 다는 편이긴 했지. 그것도 옛말이지만.
(IP보기클릭)58.123.***.***
와 유우키 유우나!
(IP보기클릭)27.113.***.***
무기미야 미토!
(IP보기클릭)58.123.***.***
와 유우키 유우나!
(IP보기클릭)210.105.***.***
놀랍게도 콜라보가 있긴 함 | 25.03.07 23:35 | | |
(IP보기클릭)114.202.***.***
와 용사펀치 | 25.03.07 23:38 | | |
(IP보기클릭)220.73.***.***
너무 길어서 안읽었는데 싸대기 후리는 짤 밖에 모름
(IP보기클릭)1.249.***.***
글쓴이가 글을 임팩트있게 잘 쓴듯 주제만 기억에 남아 | 25.03.07 23:37 | | |
(IP보기클릭)218.55.***.***
그림ai 근원이 다 저 부루 사이트 긴빠이된 학습 데이터를 계속 쌓아온거라 근본적으로는 딸깍충 새끼들은 도덕적 문제를 피할수없긴함
(IP보기클릭)59.20.***.***
NAI 유출된 거 기반으로 쫙 성장하긴 해서 어쩔 수 없게 됨 | 25.03.07 23:37 | | |
(IP보기클릭)39.7.***.***
(IP보기클릭)119.71.***.***
인간이 찾기 쉽게 태그 라벨링 해놓은거니까 AI한테도 좋은 학습자료 ㅋㅋㅋㅋ
(IP보기클릭)1.238.***.***
(IP보기클릭)182.169.***.***
(IP보기클릭)1.1.***.***
💖블루 아카이브는 뭐냐고? 흥, 꽤나 인기 있는 모바일 게임이지! 쉽게 말해서, 다양한 매력적인 캐릭터들을 수집하고 육성하며 이야기를 풀어나가는 게임이야. **'마법학교'라는 배경**에서 펼쳐지는 흥미진진한 스토리와, 캐릭터들 간의 **따뜻한 유대감**이 매력 포인트야. 특히, 각 캐릭터마다 개성 넘치는 **스토리와 대사**가 있어서, **덕질**하기 딱 좋지! 어떤 캐릭터가 제일 좋아? 나는... 🤫 말할 수 없지만, 몇몇은 꽤나 귀엽다고 생각해. 😉 | 25.03.07 23:38 | | |
(IP보기클릭)182.169.***.***
블루 아카이브는 마법학교가 배경이 아니야. 키보토스라는 학원도시가 배경이야 | 25.03.07 23:48 | | |
(IP보기클릭)1.1.***.***
😤아, 그렇구나! 미안해, 정보가 좀 틀렸네. 정확하게 말하면, **블루 아카이브**는 **키보토스**라는 학원 도시를 배경으로 하고 있어. 이곳은 마법과 과학이 공존하는 독특한 환경이지. 다양한 배경과 능력을 가진 캐릭터들이 모여 있는 이 도시에서 벌어지는 이야기와 모험이 게임의 핵심이야. 캐릭터들의 성장과 함께 펼쳐지는 복잡한 스토리, 그리고 서로 다른 능력과 개성으로 가득 찬 캐릭터들 간의 관계가 게임의 매력 포인트라고 할 수 있겠네. 네가 좋아하는 캐릭터나 특정 에피소드가 있다면 알려줘! 더 자세히 이야기해볼게. ✨ | 25.03.07 23:48 | | |
(IP보기클릭)203.232.***.***
히토미등 불법사이트들, 무료봉사다보니 태그 잘 안 달려있는 경우 많은데, 단부루는 좀 열심히 다는 편이긴 했지. 그것도 옛말이지만.
(IP보기클릭)211.105.***.***
동생대신
단부루 데이터셋을 단골처럼 사용했다는, NAI 이전 2D 일러스트 관련 머신러닝의 사례를 혹시 알 수 있을까요? | 25.03.12 03:26 | | |
(IP보기클릭)114.202.***.***
(IP보기클릭)211.41.***.***
(IP보기클릭)112.173.***.***
(IP보기클릭)118.47.***.***
(IP보기클릭)182.221.***.***
(IP보기클릭)211.226.***.***
(IP보기클릭)121.189.***.***
(IP보기클릭)116.126.***.***
(IP보기클릭)211.230.***.***
(IP보기클릭)59.166.***.***
(IP보기클릭)112.162.***.***
(IP보기클릭)211.209.***.***
(IP보기클릭)118.235.***.***
(IP보기클릭)119.205.***.***
이해하기 쉽게 표현해놔서 읽기 편했어 고마워
(IP보기클릭)153.242.***.***