(AI) AI를 사용해서 텍스트로 동영상 만들기 튜토리얼 21

본문

유머 게시판

[자작기타] (AI) AI를 사용해서 텍스트로 동영상 만들기 튜토리얼 21 [10]

동생대신 (3533827)

활동내역 작성글 쪽지 마이피 타임라인

출석일수 : 3424일 | LV.41

Exp.43%

추천 23 | 조회 8763 | 비추력 1085693

작성일 2023.03.26 (23:10:33)

IP : (IP보기클릭)121.162.***.***

프로필 열기/닫기

동생대신 (3533827)

작성일 2023.03.26 프로필 열기/닫기

추천 23 | 조회 8763 | 댓글수 10

1편 : https://bbs.ruliweb.com/community/board/300143/read/58570656

2편 : https://bbs.ruliweb.com/community/board/300143/read/58609571

3편 : https://bbs.ruliweb.com/community/board/300143/read/58726346

4편 : https://bbs.ruliweb.com/community/board/300143/read/58843313

5편 : https://bbs.ruliweb.com/community/board/300143/read/58923623

6편 : https://bbs.ruliweb.com/community/board/300143/read/59028118

7편 : https://bbs.ruliweb.com/community/board/300143/read/59029076

8편 : https://bbs.ruliweb.com/community/board/300143/read/59084305

9편 : https://bbs.ruliweb.com/community/board/300143/read/59346702

10편 : https://bbs.ruliweb.com/community/board/300143/read/59499900

11편 : https://bbs.ruliweb.com/community/board/300143/read/59532048

12편 : https://bbs.ruliweb.com/community/board/300143/read/59585215

13편 : https://bbs.ruliweb.com/community/board/300143/read/59967569

14편 : https://bbs.ruliweb.com/community/board/300143/read/60013804

15편 : https://bbs.ruliweb.com/community/board/300143/read/60114346

16편 : https://bbs.ruliweb.com/community/board/300143/read/60172732

17편 : https://bbs.ruliweb.com/community/board/300143/read/60373829

18편 : https://bbs.ruliweb.com/community/board/300143/read/60397372

19편 : https://bbs.ruliweb.com/community/board/300143/read/60522326

20편 : https://bbs.ruliweb.com/community/board/300143/read/60544633

얼마 전에 드디어 일반 사용자가 사용할 수 있는 텍스트 투 비디오, 즉 텍스트만으로 일관성 있는 동영상을 생성하는 모델이 공개되었습니다.

출처 : 文本生成视频大模型-英文-通用领域 · 模型库 (modelscope.cn)

아래 링크에서 좀 느리기는 하지만 간단한 데모 버전을 사용해 볼 수 있습니다.

ModelScope Text To Video Synthesis - a Hugging Face Space by damo-vilab

Robot dancing in times square.

A cat eating food out of a owl,
in style of van Gogh.

Melting ice cream dripping
down the cone.

물론 weubi로 로컬 사용이 가능합니다.

사용법은 간단합니다.

(Automatic1111 webui 기준 : AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI (github.com))

1. 먼저 webui용 익스텐션을 설치합니다. 익스텐션 주소를 webui의 Extensions / Install from URL / URL for extension's git repository 에 붙여넣은 다음 Install을 누릅니다.

deforum-art/sd-webui-modelscope-text2video: Auto1111 extension consisting of implementation of ModelScope text2video using only Auto1111 webui dependencies (github.com)

2. 설치가 끝나면 Webui를 재시작합니다.

다시 Webui를 실행하면 아래 이미지처럼 ModelScope text2video 탭이 추가됩니다.

3. 이제 아래 링크로 가서 모델 및 설정 파일을 전부 다운 받습니다. 받은 파일들은 webui가 설치된 폴더의 stable-diffusion-webui/models/ModelScope/t2v/ 경로에 넣습니다. 폴더가 없으면 새로 만드시면 됩니다. 모델 파일을 넣고 webui를 재시작합니다.

모델 : damo-vilab/modelscope-damo-text-to-video-synthesis at main (huggingface.co)

4. 각 항목의 의미는 다음과 같습니다.

-txt2vid 텍스트에서 비디오를 생성합니다.

-prompt : 일반적인 프롬프트 입니다. 현재 모델이 기본 stable diffusion 베이스라 SD용 프롬프트를 입력하시면 됩니다.,

-Negative prompt : 마찬가지로 네거티브 프롬프트입니다.

-Steps : 이미지 생성에 사용되는 스텝과 동일합니다. 올릴수록 디테일이 올라가지만 오래 걸립니다.

-CFG_scale : 이미지 생성에 사용하는 것과 동일합니다. 높을수록 프롬프트에 충실한 이미지가 생성되지만 지나치면 이미지가 왜곡됩니다.

-frames : 생성될 영상의 프레임 숫자를 결정합니다. 해당 값만큼의 이미지가 생성됩니다. 너무 높으면 vram 부족으로 터질 수 있습니다. 적당히 조정합니다.

-Seed : 이미지 생성에 사용하는 시드와 동일합니다. -1면 매번 랜덤한 값이 사용됩니다.

-width/height : 생성될 영상의 해상도를 결정합니다. 이 모델은 vram 사용량이 매우 높으며, vram 4gb의 그래픽카드는 최대 192x192 해상도의 영상을 생성할 수 있습니다. 참고 : Add minimal requirements — launching on 4 GBs of VRAM · deforum-art/sd-webui-modelscope-text2video · Discussion #27 (github.com)

-eta : 노이즈에 영향을 주는 설정입니다. 기본 값을 사용하시면 됩니다.

-Batch count : 한번에 생성할 영상의 숫자를 결정합니다.

VAE Mode : 최적화 관련 옵션입니다. 대부분 GPU(half precision을 사용하면 무난합니다. 그래도 부족하면 CPU 옵션을 사용할 수 있습니다.

-keep pipe in memory : 비디오를 생성하고나서 모델 등을 언로드하지 않고 유지합니다. 연속으로 비디오를 생성할 때 좀 더 빨라집니다.

-Generate : 영상 생성을 시작하는 버튼입니다.

-update. the video : 영상 생성이 끝나고 누르면 영상을 재생할 수 있습니다.

이제 프롬프트를 입력해서 비디오를 생성해 봅시다,

먼저 256x256 해상도로 하늘을 날고 있는 돌고래의 영상을 생성합니다.

높은 일관성을 유지하면서 프롬프트에 충실한 영상이 생성되었습니다.

생성된 영상과 프레임들은 img2img-images\text2video-modelscope 경로에 저장됩니다.

해당 모델은 서터스톡 라이브러리로 학습되었는지 Shutter stock 워터마크가 생성되는 경우가 꽤 많습니다. 네거티브 프롬프트를 잘 조정하거나 영상 편집 프로그램에서 워터마크를 제거할 필요가 있습니다.

이제 금색 돌고래가 길거리를 걷고 있는 영상을 생성합니다.

금색 돌고래가 열심히 도로를 달리는 영상이 생성됩니다.

이제는 사람을 생성해봅시다.

해상도가 낮아서 얼굴이 뭉게지기는 했지만 잘 생성됩니다.

얼굴 클로즈업 영상을 생성합니다.

눈이 좀 호러틱하기는 하지만 나름 잘 나왔습니다.

일반적인 Stable diffusion 모델과 마찬가지로 유명인들은 프롬프트에 입력하기만 해도 생성이 가능합니다.

헤엄치고 있는 일론 머스크

텍스트만이 아니라 img2img처럼 기존 영상에서 새로운 영상을 만드는 vid2vid도 가능합니다.

vid2vid 탭으로 이동합니다.

영상을 업로드할 수 있는 항목이 생긴 것을 제외하면 나머지는 txt2vid와 거의 동일합니다.

-Input video : 영상 파일을 업로드합니다.

-Input video path : 비디오를 업로드하는 대신 경로를 입력합니다.

-denoising strength : 원본 영상에서 얼마나 변형될지를 결정합니다. 너무 낮으면 오히려 노이즈가 증가합니다.

-vid2ivd start frame : 입력된 영상의 지정된 프레임부터 처리를 시작합니다. 앞부분을 생략할 때 유용합니다.

원본 영상을 업로드합니다. 해상도를 처리하기 좋게 편집할 필요가 있습니다.

디노이징 스트렝스 0.65를 사용합니다. SD가 베이스다보니 실사풍으로 나옵니다.

다음은 반대로 실사풍 영상을 2D로 변환해 봅시다.

디노이징 스트렝스를 0.7로 올렸더니 입이 안 움직이기는 하지만 꽤 2D풍으로 변했습니다.

터미네이터의 한 장면으로 바꿔봅시다.

저장되는 영상은 Output settings에서 조정할 수 있습니다.

-FPS : 생성된 영상의 초당 프레임 숫자를 지정합니다. 기본값은 15입니다.

-Add soundtrack : 생성된 영상에 사운드를 삽입합니다. None : 안 넣음, File : 지정된 경로의 파일에서 가져옴, Init Video : VId2VId 사용시 입력된 영상의 사운드를 사용.

-Soundtrack Path : 위에서 File을 사용했을 경우 넣을 사운드 파일의 경로를 입력합니다.

아래와 같이 사운드가 자동으로 삽입됩니다.

-Skip video creation : 프레임 이미지들을 생성한 다음 영상으로 합치는 과정을 생략합니다.

-CRF : 인코딩 품질 옵션입니다. 높을수록 품질이 낮아집니다. 17이 기본값입니다.

-Preset : 인코딩 처리 속도입니다. 느릴수록 품질이 올라갑니다만 원체 화질이 낮아서 별 차이는 없습니다.

이외에도 오픈소스는 아니지만 비슷한 txt2vid AI 도구의 베타테스트가 진행 중입니다.

해상도나 품질은 훨씬 좋습니다.

#AI

글쓰기

댓글 | 총 10 개

다이바 나나 (5572128) (IP보기클릭)14.5.*.*	아 셔터스톡 로고가 박히는게 학습 데이터때문이었군요.. 등록	23.03.26 23:12
THINKDICK (318020) (IP보기클릭)211.52.*.*	신기한 연재물이네. 등록	23.03.26 23:12
레몬쨩 (3655862) (IP보기클릭)180.70.*.*	이건 글카 성능이 얼마나 좋아야해? 등록	23.03.26 23:14
작성자 동생대신 (3533827) (IP보기클릭)121.162.*.*	레몬쨩 본문에 설명한 것처럼 최소 vram 4gb가 필요합니다, \| 23.03.27 00:05 \| \| \| 등록
29250095088 (5592975) (IP보기클릭)119.192.*.*	동생대신 생각보다 낮네 \| 23.03.30 11:58 \| \| \| 등록
루안네츠 (1460839) (IP보기클릭)121.176.*.*	이야... 영상이 꽤 부드럽네요 등록	23.03.27 01:15
진실의 마녀 (1418752) (IP보기클릭)59.10.*.*	셔터스톡ㅋㅋㅋㅋ 등록	23.03.27 03:06
루리웹-4895725122 (5733974) (IP보기클릭)1.237.*.*	항상 많이 배워갑니다! 좋은 내용 감사드려요! 여기서 실사풍 영상을 2D로는 어떻게 바꾸신걸까요? model을 바꾼다고 크게 바뀌지도 않고, anime girl이라고 바꿔도 sd가 너무 많이 나오면서 이상하게 나와서 여쭈어봅니다! 등록	23.04.25 14:55
작성자 동생대신 (3533827) (IP보기클릭)121.162.*.*	루리웹-4895725122 본문에 소개한 비디오 모델은 일반 스테이블 디퓨전과 동일한 형식의 프롬프트를 필요로 합니다. "art by shinkai makoto"나 "by ufotable", "illustration" 같은 태그들을 같이 입력하시면 도움이 됩니다. 다만 기본 SD 자체가 애니메이션 스타일에는 적합하지 않은 편이라 한계가 있습니다. \| 23.04.25 15:09 \| \| \| 등록
루리웹-4895725122 (5733974) (IP보기클릭)1.237.*.*	동생대신 아, model은 의미가 없나보군요! 감사합니다 큰 도움 되었습니다~! \| 23.04.25 15:35 \| \| \| 등록

로그인이 필요합니다.

글쓰기

읽을거리

2024.05.21 22792 26

[XSX|S] 세누아의 전설: 헬블레이드 2, 체험으로서의 게임이란 (54)

2024.05.20 19890 131

[게임툰] 황야에 피어난 메카의 로망, 샌드랜드 (22)

2024.05.15 62289 343

[게임툰] 레트로로 그린 잔혹동화, 리틀 구디 투 슈즈 (61)

2024.05.07 92907 28

[PC] 2년 기다림이 아깝지 않은 장독대 묵은지, 브이 라이징 (22)

글쓰기

공지

스킨

인증글 베스트

ID	구분	제목	글쓴이	추천	조회	날짜
118	전체공지	업데이트 내역 / 버튜버 방송 일정	8[RULIWEB]			2023.08.08
57774658	공지	유머 게시판 통합 공지 - 아동 대상 표현 강화	_루리	88	2524813	2022.06.30
	질문	유튜브 레이아웃을 치지직처럼 변경할 수 있을까요?	트리플나인🌸⚒️		236	2024.05.24
파이널판타	질문	전작 클리어 전승 같은게 있나요?	쭈용쓰		14	2024.05.24
스텔라블레	질문	레드후드랑 앨리스 의상이 안보이네요. (2)	건전마인	1	641	2024.05.24
핫딜! [네이버페이] 일일적립. 클릭 16원
66194683	잡담	야겜) NTRAHOLIC이 만드는 censor 재밌어 보이던데?	돌아온 감염충		1	00:27
66194682	잡담	의외로 야구는 응원하는 팀이 ↗같이 못한다고	변태라는이름의 신사		20	00:27
66194681	유머	사실 이건 직구 레퀴엠이 아닐까	루리웹-8218530081		66	00:27
66194680	잡담	타 커뮤에서 부산 식당 보고 와드	피파광	1	75	00:27
66194679	잡담	명조) 초뽑 40연 돌려서 베리나만 떴는데 리세각임? (1)	카발리어로	1	18	00:27
66194678	잡담	간장게장 사먹어본 후기	엑스트라버진들기름	1	91	00:26
66194677	잡담	선착순 한명! (6)	팬티2장	4	63	00:26
66194676	게임	@) 치유키 대사 수준.jpg (2)	근성장	1	40	00:26
66194675	애니/만화	@) 다음생에는 이구아나가 되고 싶다 (1)	마망부장관		13	00:26
66194674	게임	원신) 페이몬이 굉장한 이유	자캐애니제작회		58	00:26
66194673	유머	대충 강형욱 건 지금 다 보고 드는 걱정 하나	Daon		96	00:26
66194672	잡담	마이너 취미들 디시로 간다 뭐라하는데	유니콘샐러드	1	30	00:26
66194671	애니/만화	시티 헌터 - Get Wild (1)	데빌쿠우회장™		18	00:26
66194670	유머	RTX4090을 사야되는 이유 (1)	맨하탄 카페		112	00:26
66194669	유머	제발 치킨이 맞다고 해주세요. 제발... (4)	Trust No.1		100	00:26
66194668	게임	[M&B] 200m 이상의 거리에서 헤드샷 성공을 달성해야 하는데	Sieg Choys		15	00:26
66194667	잡담	블루아카 a.i) 우리집에 고양이 보러 올래? (1)	페도는 아님		46	00:26
66194666	잡담	블루아카) 유우카랑 결혼하기 vs 노아랑 결혼하기 (1)	Hifumi Daisuki	3	47	00:26
66194665	유머	천장에 메달린 박쥐 사진을 뒤집으면	변태라는이름의 신사	3	82	00:26
66194664	잡담	버튜버) 나츠키 슈타게 12화 후기	루리웹-1420251412		17	00:26
66194663	유머	하의만 입고 다니는 상의실종녀	루리웹-1062589324	3	140	00:25
66194662	잡담	직구규제 뉴스 왤케 잘 안나옴? (10)	Cortana	3	79	00:25
66194661	유머	의외로 치매 예방 교재인 것	데어라이트	1	77	00:25
66194660	잡담	나도 이거 하나 설치할까.... (1)	그래서 안살거야?		40	00:25
66194659	게임	[스타레일] 막내 여동생한테 장난치는 언니와 오빠	리버티시티경찰국		42	00:25
66194658	잡담	니케)젤 맘아픈 도로롱.	알락꼬리꼬마도요	3	49	00:25
66194657	게임	블루아카) 아슬아슬한 바니걸 네루 (1)	적방편이	1	60	00:25
66194656	애니/만화	블루아카) 아비도스의 풍경화 (1)	142sP		58	00:25

글쓰기 총 26197187개의 글이 있습니다.

인증글 베스트 목록

1 2 3 4 5 6 7 8 9 10

다이바 나나 (5572128) (IP보기클릭)14.5.*.*	아 셔터스톡 로고가 박히는게 학습 데이터때문이었군요.. 등록	23.03.26 23:12
THINKDICK (318020) (IP보기클릭)211.52.*.*	신기한 연재물이네. 등록	23.03.26 23:12
레몬쨩 (3655862) (IP보기클릭)180.70.*.*	이건 글카 성능이 얼마나 좋아야해? 등록	23.03.26 23:14
작성자 동생대신 (3533827) (IP보기클릭)121.162.*.*	레몬쨩 본문에 설명한 것처럼 최소 vram 4gb가 필요합니다, \| 23.03.27 00:05 \| \| \| 등록
29250095088 (5592975) (IP보기클릭)119.192.*.*	동생대신 생각보다 낮네 \| 23.03.30 11:58 \| \| \| 등록
루안네츠 (1460839) (IP보기클릭)121.176.*.*	이야... 영상이 꽤 부드럽네요 등록	23.03.27 01:15
진실의 마녀 (1418752) (IP보기클릭)59.10.*.*	셔터스톡ㅋㅋㅋㅋ 등록	23.03.27 03:06
루리웹-4895725122 (5733974) (IP보기클릭)1.237.*.*	항상 많이 배워갑니다! 좋은 내용 감사드려요! 여기서 실사풍 영상을 2D로는 어떻게 바꾸신걸까요? model을 바꾼다고 크게 바뀌지도 않고, anime girl이라고 바꿔도 sd가 너무 많이 나오면서 이상하게 나와서 여쭈어봅니다! 등록	23.04.25 14:55
작성자 동생대신 (3533827) (IP보기클릭)121.162.*.*	루리웹-4895725122 본문에 소개한 비디오 모델은 일반 스테이블 디퓨전과 동일한 형식의 프롬프트를 필요로 합니다. "art by shinkai makoto"나 "by ufotable", "illustration" 같은 태그들을 같이 입력하시면 도움이 됩니다. 다만 기본 SD 자체가 애니메이션 스타일에는 적합하지 않은 편이라 한계가 있습니다. \| 23.04.25 15:09 \| \| \| 등록
루리웹-4895725122 (5733974) (IP보기클릭)1.237.*.*	동생대신 아, model은 의미가 없나보군요! 감사합니다 큰 도움 되었습니다~! \| 23.04.25 15:35 \| \| \| 등록

본문

[자작기타] (AI) AI를 사용해서 텍스트로 동영상 만들기 튜토리얼 21 [10]

게시판 관리자