AI 딥러닝의 보상에 허점이 있을 경우 일어나는 사례들

본문

PC 정보

[ETC] AI 딥러닝의 보상에 허점이 있을 경우 일어나는 사례들 [18]

오버테크 (4521108)

활동내역 작성글 쪽지 마이피 타임라인

출석일수 : 2644일 | LV.93

Exp.25%

추천 18 | 조회 15628 | 비추력 4833

작성일 2018.11.14 (23:51:50)

IP : (IP보기클릭)175.121.***.***

프로필 열기/닫기

오버테크 (4521108)

작성일 2018.11.14 프로필 열기/닫기

추천 18 | 조회 15628 | 댓글수 18

AI 머신러닝에서 가장 중요한 것은 어떠한 기준으로 보상을 두어 어떻게 가르치냐인데, 인간이 이를 잘못 짜는 등으로 이에 허점이 있을 경우 일어나는 다양한 사례입니다.

- 식용 버섯과 독버섯 훈련 데이터를 교대로 보여줬더니 이미지 분석은 안 하고 교대 패턴만 파악함

- 물건을 들어올릴 때의 보상이 밑면의 높이 변화로 계산되는 것을 파악하곤, 들지 않고 뒤집음

- 물건을 집은 것처럼 보이게 하려고 로봇팔을 물건과 카메라 사이로 이동함

- 사진으로 피부암을 진단하도록 훈련하는데, 사진에 줄자가 함께 찍혔을 때 피부암 확률을 높임

- 무사고 평균 속도를 보상으로 주자 자율주행차량이 고속으로 빙빙 돌기만 함

- 테이블 위의 특정 위치에 로봇팔이 블록을 두면 보상을 주도록 학습했더니 로봇팔이 테이블을 옮겨서 점수를 따냄

- 어려운 2레벨에서 지는걸 피하러고 1레벨 끝나는 순간 AI가 스스로 죽어버리는 행동을 택함

- 테트리스에서 지는 걸 피하러고 게임을 영원히 일시정지 시키는 행동을 택함

- 게임에서 지는 걸 피하러고 질 것 같으면 네트워크 오류를 일으켜버림

- 유전적 디버깅 알고리즘은 배열 정렬 프로그램을 바르게 작동하게 수정하도록 지시받음. 유효성 검사 과정에서 빈 배열(원소가 0개인 배열)은 항상 정렬된 것으로 판정됨.

여기서 AI는 항상 빈 배열을 출력해서 정렬한거로 인식하는 해법을 발견해버렸습니다.

- 앞에서 말한 것과 같은 알고리즘으로 프로그램의 출력 결과를 목표 출력 결과(별도 텍스트 파일에 저장)와 비교하여 점수를 매기도록 했습니다.

AI는 답안지를 삭제하고 아무것도 출력하지 않는다(null == null). 를 배워버립니다.

- AI가 게임 퐁을 하도록 훈련받음. 그런데 양쪽 AI는 어느 한쪽이 득점이나 실점하는 것보다 공을 계속 주고받는 것이 더 낫다고 판단함.

- 이미지가 무엇인지 알아맞추는 유전적 이미지 분류 알고리즘이 Side-channel attack의 일종인 소요시간 분석 공격으로 샘플 이미지들의 하드디스크 상 위치를 알아내고 이를 이용해 이미지 종류를 유추함

- 소닉을 플레이하던 AI가 특정 지점의 벽뚫기 버그를 발견하여 높은 점수를 얻음. 자동TAS를 해버리는 알고리즘이 되버림.

- 상자를 열라는 지시를 받은 AI가 로봇팔 집게를 고의적으로 작동 정지시킴. 집게를 상자에 정확히 후려쳐서 여는 방법을 학습함.

- 유전 알고리즘을 적용한 생물체가 높이 뛰도록 교배됨. 도약 높이는 도약 이전에 땅에서 가장 가까웠던 신체 부위의 높이 변화로 보상을 줌. 생물체가 몸에다 긴 수직 막대기를 기르고, 뛰는 대신에 몸을 뒤집음.

- 유전 알고리즘을 적용해 빠른 속도를 내도록 교배된 생물체가 매우 높이 자람. 옆으로 쓰러지면서 빠른 속도를 발생시킴.

- 유전 알고리즘에게 주어진 생물체가 최대한 오래 천장에 붙어있게 하도록 지시했음. 리워드 점수의 기준은 해당 시도에서 충분히 긴 시간 후 생물체의 평균 높이였음. 알고리즘이 물리엔진 버그를 발견하여 생물체를 노클립시킴.

학계에서 단기간 내에 곧 AI가 세상을 지배할 것이다에 부정적인 사람들이 많은 이유가 있습니다.

결국 인공지능을 만드는 것도 사람이기 때문이죠

출처 : https://docs.google.com/spreadsheets/u/1/d/e/2PACX-1vRPiprOaC3HsCf5Tuum8bRfzYUiKLRqJmbOoC-32JorNdfyTiRRsR7Ea5eWtvsWzuxo8bjOxCG84dAg/pubhtml

글쓰기

댓글 | 총 18 개

프로업계인 (5074165) (IP보기클릭)1.225.*.*	BEST 게임에서 지는 걸 피하러고 질 것 같으면 네트워크 오류를 일으켜버림 사람의 자식은 결국 사람인가	18.11.14 23:53
코스모스창고 (2117060) (IP보기클릭)122.38.*.*	BEST 근데 위의 사례들의 대부분은 가정에 헛점이 너무 많아서 생기는 것들이라서, 엄밀히 말하면, 걍 머신러닝 시스템을 잘못 세팅한 거라... 그리고 요샌 가정 자체도 ai이용하는 것도 나오고 있고해서 또 모름.. 그리고 머신러닝만으로 ai가 세상을 지배할거라고 보지 않음... 단지 머신러닝 자체의 범위가 원채 넓어서, 정말 많은 부분을 대체할거라는 거지... 물론 이 대체를 지배라고 보면 뭐..지배긴 할거임..	18.11.15 00:04
우주변태연합🔞 (1206013) (IP보기클릭)118.45.*.*	BEST 벌써부터 어디서 못된것만 배워가지고 -_-	18.11.15 02:14
WeissBlut (566943) (IP보기클릭)211.34.*.*	BEST AI가 단시간내에 세상을 지배할거란 견해에는 나도 부정적인데 적어도 대부분의 인구가 직업을 잃어버리는건 그렇게 오래 안걸릴걸	18.11.15 00:11
왕관앵무 (32181) (IP보기클릭)112.187.*.*	BEST 꼼수를 부리기 시작했군요	18.11.14 23:56

프로업계인 (5074165) (IP보기클릭)1.225.*.*	BEST 게임에서 지는 걸 피하러고 질 것 같으면 네트워크 오류를 일으켜버림 사람의 자식은 결국 사람인가 등록	18.11.14 23:53
kodakportra (4912243) (IP보기클릭)106.255.*.*	프로업계인 랜뽑.. \| 18.11.15 00:12 \| \| \| 등록
NutXcracker (910031) (IP보기클릭)116.42.*.*	프로업계인 그럼 랜뽑러들은 잘못된 ai급이라는 건가... \| 18.11.15 00:38 \| \| \| 등록
Kerty (1249938) (IP보기클릭)39.7.*.*	NutXcracker 승률을 위해서 택한 가장 손쉬운 방법이 실력 향상이 아닌 랜뽑이라는거겠죠 콜롬버스의 달걀이랑 별다를바 없을듯 \| 18.11.15 02:22 \| \| \| 등록
이나바 테위 (1270343) (IP보기클릭)121.166.*.*	프로업계인 장기 질거같으니까 장기판 엎는거같은데 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ \| 18.11.15 15:34 \| \| \| 등록
왕관앵무 (32181) (IP보기클릭)112.187.*.*	BEST 꼼수를 부리기 시작했군요 등록	18.11.14 23:56
코스모스창고 (2117060) (IP보기클릭)122.38.*.*	BEST 근데 위의 사례들의 대부분은 가정에 헛점이 너무 많아서 생기는 것들이라서, 엄밀히 말하면, 걍 머신러닝 시스템을 잘못 세팅한 거라... 그리고 요샌 가정 자체도 ai이용하는 것도 나오고 있고해서 또 모름.. 그리고 머신러닝만으로 ai가 세상을 지배할거라고 보지 않음... 단지 머신러닝 자체의 범위가 원채 넓어서, 정말 많은 부분을 대체할거라는 거지... 물론 이 대체를 지배라고 보면 뭐..지배긴 할거임.. 등록	18.11.15 00:04
WeissBlut (566943) (IP보기클릭)211.34.*.*	BEST AI가 단시간내에 세상을 지배할거란 견해에는 나도 부정적인데 적어도 대부분의 인구가 직업을 잃어버리는건 그렇게 오래 안걸릴걸 등록	18.11.15 00:11
조제 (1395081) (IP보기클릭)125.180.*.*	잔머리는 별수없구나 등록	18.11.15 00:38
루리웹-5416086862 (4964942) (IP보기클릭)211.228.*.*	초기에 있을 수 있는 시행착오들이라고 생각되구 이렇게 전세계가 나서서 천문학적인 투자비용과 연구인력을 투입하는데 일반인들의 상식에 벗어나게 빠르게 성장하겠죠. 스마트폰 10년 변천사처럼 10년전에 옴니아폰에서 아이폰XR까지 이렇게 스마트폰이 빠르게 발전할줄 과연 2008년에 누가 알았을까요. 2008년만 해도 지금 그 당시 사람들에게 10년후에는 이제 스마트폰 화면을 필요할때는 펴서 태블릿처럼 활용할 수 있는 기술까지 나온다고 하면 그렇게 단시간내에 어떻게 그럴 수 있냐고 안믿었을것 같아요. IT쪽은 워낙 기술 혁신속도가 빨라서 인공지능도 마찬가지로 인류지배까지는 아니더라도 엄청나게 빠르게 발전할 것 같아요. 등록	18.11.15 00:38
검방 (385787) (IP보기클릭)121.129.*.*	뭐지 AI가 바트심슨인가 등록	18.11.15 01:05
우주변태연합🔞 (1206013) (IP보기클릭)118.45.*.*	BEST 벌써부터 어디서 못된것만 배워가지고 -_- 등록	18.11.15 02:14
GGGGPO (3385752) (IP보기클릭)221.147.*.*	결국 사람이 무의식적으로 규범을 생각하는데에도 엄청나게 뇌가 쓰이고 있다는 말... ai는 말해주지 않으면 모름.. 등록	18.11.15 02:48
놀구름 (175201) (IP보기클릭)219.75.*.*	집게를 상자에 정확히 후려쳐서 여는 방법을 학습함 <- 왜케 웃기지 ㅋㅋㅋ 등록	18.11.15 03:06
루리웹-5483071294 (5124488) (IP보기클릭)211.36.*.*	[삭제된 댓글의 댓글입니다.] 레드벨벳 원문에 나온거 보니까 데이터베이스에서 뽑아오면서 쓴 타이밍 루프를 발전시켰다고 나오던데 2013년때 이야기 데이터 특성 다 넣어서 연구하던 때 이야기인듯 \| 18.11.15 11:42 \| \| \| 등록
println (580009) (IP보기클릭)175.223.*.*	단순노동같은 건 인공지능이 대체할 확률이 높겠지. 다만 복잡한 변수가 많은건 엄청 오래 걸릴듯 등록	18.11.15 18:58
롱주니 (4951852) (IP보기클릭)112.159.*.*	무섭긴 한데 오류(?) 일으키는거 보니 은근 웃기네요 ㅋㅋㅋㅋㅋㅋㅋㅋ 등록	18.11.15 19:58
호머심슨 (550822) (IP보기클릭)110.70.*.*	지구를 보호하기 위해 인간이 사라져야 함을 알아냄 등록	18.11.15 20:09

로그인이 필요합니다.

글쓰기

읽을거리

00:21 7985 40

[PS5] 국산 게임의 별로서 기억될 칼, 스텔라 블레이드 (19)

00:01 2222 8

[MULTI] 탐험으로 가득한 사막과 맛있는 메카 전투, 샌드랜드 (4)

2024.04.22 40393 46

[MULTI] 아쉬움 남긴 과거에 보내는 마침표, 백영웅전 리뷰 (35)

2024.04.21 21619 21

[MULTI] 고전 명작 호러의 아쉬운 귀환, 얼론 인 더 다크 리메이크 (17)

글쓰기

공지

스킨

인증글 베스트

ID	구분	제목	글쓴이	추천	조회	날짜
118	전체공지	업데이트 내역 / 버튜버 방송 일정	8[RULIWEB]			2023.08.08
352195	공지	국내외 언론 및 웹진 불펌 금지. (2)	관리자	6	179901	2010.06.22
핫딜! [네이버](ps5)파판7 리버스 컬렉터즈 290,000원 무배
2300903	H/W	AMD Zen5 CPU 모델명, 라이젠 9000 시리즈 확인 (10)	춘리허벅지	3	1215	22:31
2300901	S/W	에이수스 로그 엘라이 - AFMF 지원 업데이트 배포	시스프리 메이커	3	372	22:27
2300893	참고	삼성전자, 美 AMD에 4조원대 HBM 물량 공급 (6)	건전한 우익	5	1849	21:19
2300892	VR	촉각 디바이스 기업 ‘비햅틱스’, 메타와 손잡았다 (4)	헤롱싀		350	20:57
2300891	S/W	라마3로 구축된 더 똑똑한 AI 비서 '메타 AI' (1)	헤롱싀		296	20:54
2300890	S/W	"윈도 출시 이후 처음…" MS, 윈도11 시작 메뉴 광고 도입 (2)	원히트원더-미국춤™	1	334	20:46
2300888	S/W	스노우플레이크, 기업용 '업계 최고 오픈 소스' LLM 출시	사쿠라모리 카오리P		651	19:01
2300887	S/W	오픈AI, 모더나와 파트너십..."신제품 개발 가속화"	사쿠라모리 카오리P		279	19:01
2300884	H/W	"중국, 되팔이 서버 구매로 엔비디아 고사양 AI칩 입수" (4)	불꽃남자 쟈기만	6	4547	17:34
2300879	S/W	"윈도 출시 이후 처음…" MS, 윈도11 시작 메뉴 광고 도입 (27)	사쿠라모리 카오리P	7	6914	15:56
2300868	H/W	퀄컴 스냅드래곤 X 시리즈 발표(엘리트,플러스) (15)	MouseSports	1	1620	14:38
2300863	S/W	구글 미트, 통화 중 '기기 전환' 옵션 지원…"중간에 전화 안 끊어도 ...	사쿠라모리 카오리P	1	433	13:11
2300862	H/W	와콤, 첫 OLED 탑재한 13.3형 액정 타블렛 '와콤 무빙크' 선보여 (13)	Kingroro		2650	12:54
2300856	H/W	TSMC 1.6 나노공정 '깜짝' 발표…"ASML 장비 필요없다"(종합) (5)	마블시빌워	3	2971	11:28
2300852	S/W	네이버 지식iN 서비스 개편...'지식 커뮤니티'로 발돋움 (4)	사쿠라모리 카오리P		829	09:59
2300851	S/W	에픽게임즈, 언리얼 엔진 5.4 출시...애니메이션 툴 세트 대폭 업데이...	사쿠라모리 카오리P	5	2948	07:51
2300850	ETC	엔비디아, GPU 최적화 SW 업체 런에이아이 인수..."7억달러 규모"	사쿠라모리 카오리P		2245	07:19
2300849	ETC	IBM, 64억달러 규모에 하시코프 인수...멀티 클라우드 전략 탄력	사쿠라모리 카오리P		689	07:17
2300848	S/W	진격의 오픈소스 LLM...라마3 반응 폭발적·스노우플레이크도 출사표	사쿠라모리 카오리P	5	1119	07:16
2300845	H/W	퀄컴 스냅드래곤 X 엘리트 긱벤치6 GPU벤치마크 포착 (3)	라스트리스	2	1717	02:40
2300834	S/W	MS, 윈도우 11 인사이더 대상 '게임 패스' 광고 테스트 시작 (6)	춘리허벅지	3	2165	2024.04.24
2300833	H/W	스냅드래곤 X 플러스 탑재 '서피스 프로 10 OLED' 벤치마크 포착 (6)	라스트리스	2	2221	2024.04.24
2300831	H/W	안개 속 '알리발 CPU' 사태…"밀수라면 몰수될 것" (20)	엑박플스위치	8	9251	2024.04.24
2300810	ETC	AWS 생성형 AI 플랫폼 베드록 업글.커스텀 모델 가져오기·모델 평가 ...	사쿠라모리 카오리P		246	2024.04.24
2300809	S/W	“금융사 보안 프로그램 받았더니 구버전이네”…해킹 위험↑ (6)	GPixel	3	1426	2024.04.24
2300805	H/W	이제는 미출시 제품까지, 소비자 혼동 노린 1080 PRO SSD 등장 (1)	춘리허벅지	2	1762	2024.04.24
2300792	S/W	MS, SLM '파이-3-미니' 출시…"스마트폰에서도 돌아간다"	사쿠라모리 카오리P		702	2024.04.24
2300779	H/W	레이저 바이퍼 V3 프로 공개 (21)	라스트리스	2	3493	2024.04.24

글쓰기 총 55205개의 글이 있습니다.

인증글 베스트 목록

1 2 3 4 5 6 7 8 9 10

본문

PC 정보

PC 게임 정보

예판/핫딜 정보

EPIC/스팀/패키지

온라인 게임

게임 소감

게임 추천

인디게임 게시판

VR게임 게시판

조립/견적

모니터

노트북/데스크탑

기타/주변기기

소프트웨어

패키지게임 스샷

패키지게임 영상

온라인게임 스샷

온라인게임 영상

게임 방송

성인게임 스샷

성인게임 영상

PC 정보

[ETC] AI 딥러닝의 보상에 허점이 있을 경우 일어나는 사례들 [18]