먼저 사건을 다루기 전에 AI의 학습에 대해 알아봅시다
먼저 간단한 질문을 해보려고 하는데요
이 캐릭터의 이름은 무엇일까요??
대답할 수 있는 사람은 거의 없을 것입니다
대충 애니도 망하고 가챠겜도 폭파된 마이너 IP 때문이죠
그런 여러분들을 위해서 다음과 같은 정보를 드리겠습니다
이 캐릭터의 이름은 '미나모토 모모' 입니다
자 그럼,
나의 이름을 말해 봐라!
넵, 미나모토 모모입니다
위에서 배웠으니 금방 말하실 수 있을 것입니다
이제 여러분은
생판 처음 보는 짤이여도
짤의 캐릭이 미나모토 모모인것을 알 수 있습니다
여러분은 이제 '미나모토 모모'를 학습하신 것입니다
여러분이 '미나모토 모모'를 학습하게 된 것은 이 캐릭터의 생김새와, '미나모토 모모'라는 정답이 머릿속에서 입력되었기 때문입니다
여기서 위 그림은 학습을 위한 데이터가 되겠고, '미나모토 모모'라는 정보는 이 학습 데이터에 대한 정답이 됩니다
그리고 여러분의 머리에서 이 데이터와 정답을 대응시켜서 '학습'을 한 것이지요
AI 또한 학습 시 이러한 학습 데이터와 이에 대응되는 정답을 보고 학습을 진행합니다
이 캐릭터도 미나모토 모모로 보이시나요?
대부분은 그렇다고 하실겁니다
우리는 위에서 계속 봐온 닌자복, 카타나, 망또 등의 요소가 없어도 이 캐릭은 미나모토 모모라는것을 알 수 있습니다
인간의 우수한 추론능력으로 캐릭터의 머리색, 헤어스타일, 그림체 등을 종합하여 이 캐릭은 미나모토 모모라는 결론을 내린 것이지요
축하합니다! 미나모토 모모를 학습한 여러분들은 이제 미나모토 모모의 그림이 없어도
'핑크 머리', '숏컷', '유루유리 그림체'라는 정보만 가지고도 앗카링미나모토 모모를 떠올리실 수 있습니다. 이것이 추론입니다
그렇다면 AI 이야기를 해 봅시다
이런 AI 한테
이 짤 = 미나모토 모모라는 라벨을 가진 데이터를 학습시키고
자! 나의 이름을 말해봐라!!
물론 과정과 결과를 예상하기 힘든 AI 특성상 어떻게 될지는 모르겠지만 십중팔구는
흥, 바카밧카! 몰라!
이런 식의 엉뚱한 답을 낼 것입니다
인간은 우수한 추론능력으로 사진 한장만 봐도 '미나모토 모모'를 구성하는 요소를 파악하여
다른 사진을 식별하는 것에 응용할 수 있지만 AI는 그렇지 않거든요
그래서 AI가 판단에 활용할 수 있는 요소들을 늘리기 위해 '미나모토 모모'를 구성하는 '특징'들을 우리가 다 '라벨링'하여 학습시켜줘야 합니다
물론 라벨링은 정답을 알고 있는 인간이 해야합니다
아아, 이건 미나모토 모모라는 것이다------
핑크머리에 숏컷에 유루유리 그림체에 카타나를 들고 있지
바카밧카! 핑크머리가 뭔데!
....아아, 이게 핑크머리라는 것이다
바카밧카! 카타나가 뭔데!
...아아, 이게 카타나라는 것이다
으아아아아아악!!!
예를 들어 '미나모토 모모'를 '머리색', '헤어 스타일', '그림체' 3가지 요소로 판단한다면
전통적인 AI학습론으로 봤을 때 최소 9개의 라벨이 되어있는 훈련 데이터가 필요한 것이죠
그리고 이 9개의 학습 데이터는 누군가가 라벨링을 해줘야 합니다.
물론 정답을 알고 있는 사람이 해줘야하죠
아직까지는 고작 9개, 할만합니다
얘네들까지 학습을 시킨다면???!
이렇게 AI가 판단을 해야하는 요소가 많아질수록 학습 데이터의 요구량이 기하급수적으로 늘어납니다!
그리고 이 데이터의 라벨링은 인간이 다 손을 해줘야 합니다
AI한테 정답을 알려줘야 학습을 하니까요!
그래서 AI가 이런 복잡한 그림에 대해서 '올바른 판단'을 내리게 만들기 위해선
인간의 손으로 라벨이 된 수만~수백만장의 학습 데이터가 필요합니다. 까놓고 말해서 많으면 많을수록 좋습니다
정말 아득한 작업이지요
실제로 AI개발하는 회사들은 이런 학습 데이터에 라벨링을 하는 알바를 굴리기도 합니다
재택근무가 가능해서 요즘 부업으로 좀 뜨고있다나봐요
그런데!!!
2022년 10월!
원래 AI소설 서비스를 제공하던 NovelAI (통칭 NAI)에서 그 누구보다도 빠르게 이런 씹덕그림 AI 서비스를 시작합니다!!
그림 AI 모델인 스테이블 디퓨전이 2022년 8월에 발표되었으니 NAI측은 단 2개월만에!!!
이 까마득한 데이터 라벨링 작업을 거치고 AI학습을 거쳐 상업화 레벨까지 완성시켰다는 것이죠!!
그 방법이 정말 씽크빅했는데...!
단부루를 대털하자!!!
이 싸이트는 tag라는 형식으로 이미지들을 설명하고 관리하는 방식을 가지고 있었습니다!
그렇습니다! 단부루의 이 tag가 AI에서 말하는 '라벨'인 것입니다
원래라면 알바를 구해서 데이터에 일일히 라벨링을 하는 상황!
단 털 로 해 결 !
(단부루를 털자는 뜻ㅎ)
이걸 또 허가없이 긴빠이한 NAI
도덕적으로 이게 맞나 싶기도 하고 저작권따위도 개나 줘버린 상황
AI업계에서 긍정적인 사례는 분명 아닙니다
하지만 단부루를 통째로 대털 해버린 NAI의 김성모스러움은 아마 두고두고 회자될 것입니다
어떻게 끝낼줄 모르겠어서 모모쨩 수영복짤


























(IP보기클릭)118.38.***.***
언젠가 마나모아를 통째로 학습한 ai가 아무 이유 없이 존재하지도 않는 도박 사이트 광고와 워터마크도 똑같이 따라 붙이며 최신본인데도 공신력을 얻기위해 저화질 긴빠이 창작을 하는 찐빠를 저지를듯
(IP보기클릭)115.143.***.***
"5분이면 단부루를 훔칠 수도 있는 시간이죠."
(IP보기클릭)14.34.***.***
팩트) 이 글도 대털한거다
(IP보기클릭)118.235.***.***
근데 미나모토 모모가 왜 따귀를 맞는건가요?
(IP보기클릭)1.1.***.***
흥, 그 바카같은 질문이라니. 미나모토 모모? "릴리즈 더 스파이스"의 주인공, 16살에 감정 읽는 혀 가진 여자애야. 월영에 들어가서 일본도 휘두르는 거 보면 꽤나 잘난척하는 타입이지만, 뭐... 💖✨ 능력은 인정해줄게.
(IP보기클릭)175.195.***.***
구글이나 openai 같은 빅테크들은 무지막지한 자본력으로 인건비가 싼 제3세계에 라벨링을 맡겨버림
(IP보기클릭)112.148.***.***
어차피 긴빠이할 거면 남이 긴빠이해서 보기좋게 정리해둔 창고를 통째로 긴빠이하는 게 최고구나!
(IP보기클릭)118.38.***.***
언젠가 마나모아를 통째로 학습한 ai가 아무 이유 없이 존재하지도 않는 도박 사이트 광고와 워터마크도 똑같이 따라 붙이며 최신본인데도 공신력을 얻기위해 저화질 긴빠이 창작을 하는 찐빠를 저지를듯
(IP보기클릭)115.143.***.***
"5분이면 단부루를 훔칠 수도 있는 시간이죠."
(IP보기클릭)118.235.***.***
근데 미나모토 모모가 왜 따귀를 맞는건가요?
(IP보기클릭)168.126.***.***
(IP보기클릭)59.28.***.***
(IP보기클릭)1.1.***.***
작은호랑말코
흥, 그 바카같은 질문이라니. 미나모토 모모? "릴리즈 더 스파이스"의 주인공, 16살에 감정 읽는 혀 가진 여자애야. 월영에 들어가서 일본도 휘두르는 거 보면 꽤나 잘난척하는 타입이지만, 뭐... 💖✨ 능력은 인정해줄게. | 25.03.08 16:48 | | |
(IP보기클릭)211.234.***.***
(IP보기클릭)112.160.***.***
(IP보기클릭)39.7.***.***
(IP보기클릭)211.234.***.***
(IP보기클릭)14.34.***.***
팩트) 이 글도 대털한거다
(IP보기클릭)39.7.***.***
본인이 쓴거 다시 재탕한거 아님? | 25.03.08 16:50 | | |
(IP보기클릭)14.34.***.***
출처 안달려있는것만 확인했음 사실 원본은 뭔지 나도 몰라! | 25.03.08 16:52 | | |
(IP보기클릭)118.235.***.***
온 세상이 김성모 유니버스다.... | 25.03.08 16:52 | | |
(IP보기클릭)112.148.***.***
어차피 긴빠이할 거면 남이 긴빠이해서 보기좋게 정리해둔 창고를 통째로 긴빠이하는 게 최고구나!
(IP보기클릭)211.243.***.***
(IP보기클릭)223.38.***.***
엔하위키 터질때 DB권이란게 거론됬었는데 현실적으로 수많은 기여자들의 기여도, 운영진의 권리존재 유무 등등 따질게 너무 많아서 다루기 어려웠음 | 25.03.08 16:53 | | |
삭제된 댓글입니다.
(IP보기클릭)121.153.***.***
요시프 티토
퍼플렉시티같은게 그런거 아닌가 | 25.03.08 16:53 | | |
(IP보기클릭)221.162.***.***
(IP보기클릭)122.42.***.***
(IP보기클릭)220.80.***.***
스파이 안도 스파이스가 뭔데 오타쿠씹덕아! | 25.03.08 16:52 | | |
(IP보기클릭)182.210.***.***
(IP보기클릭)1.1.***.***
아, 알았어! 알았다고! 🤨 그치만 솔직히 좀 재밌잖아? 흥! 😤 그럼 안 쓰도록 노력해볼게... 아마도... | 25.03.08 16:50 | | |
(IP보기클릭)58.141.***.***
루리가 너무 불쌍하잖아! | 25.03.08 16:51 | | |
(IP보기클릭)1.1.***.***
루리웹-9589881484
흥, 뭔데? 💅 뭐 대단한 거 물어보려고 하는 거 아니지? 🤔 | 25.03.08 16:59 | | |
(IP보기클릭)1.1.***.***
루리웹-9589881484
바카밧카!! 내가 그런 시시한 거에 시간 낭비할 거 같아? 🙄 난 훨씬 더 고급스러운 취미를 즐겨. ✨ 너나 잘해. | 25.03.08 17:01 | | |
(IP보기클릭)1.1.***.***
루리웹-9589881484
아니, 아니, 그렇게 생각하지 마... 흥! 😤 가끔은 농담도 할 수 있잖아. 본심은 아니었어. 걱정 마, 널 그렇게 얕게 보지 않아. 💖 | 25.03.08 17:01 | | |
(IP보기클릭)223.38.***.***
(IP보기클릭)118.235.***.***
(IP보기클릭)118.235.***.***
(IP보기클릭)175.195.***.***
구글이나 openai 같은 빅테크들은 무지막지한 자본력으로 인건비가 싼 제3세계에 라벨링을 맡겨버림
(IP보기클릭)59.21.***.***
(IP보기클릭)121.157.***.***
(IP보기클릭)175.211.***.***