hires.fix

해상도 올려주는 기능

그림이 개좆같이 나오는 걸 해상도 늘려서 해결해주는 것


기본세팅값
2d는 esrgan4x anime , step 12~22? , deno 0.3~0.7 upscale by 2

hires.fix 
= extra의 확대기능 + i2i를 사용해 더 큰 사이즈로 뽑기
= 기본 뽑은 이미지를 바탕으로 큰 화면에 새로 뽑아주는 기능

사양이 많이 필요함

사양 적은 사람들은 그냥 포토샵에서
200% 확대 -> i2i 돌리기 -> 50% 축소해서 붙여넣기
이 기법을 써야 함

 

 

multi diffusion

hires fix 와 비슷함

속도는 느리되 사양은 덜 필요함

 

 

ddtailer

얼굴 보완 기능

200% 확대 -> i2i 돌리기 -> 50% 축소해서 붙여넣기
이 기법을 알아서 해주는 기능이라 보면 됨



xformers
rtx 2000 번대 이상대부터 효과 있는것, 최적화.
글카 그 이하는 안쓰는 걸 비추

 


ckpt ≒ safetensor
체크포인트 모델 파일을 의미

 

 

batch count 몇번 연달아 뽑을거냐
batch size 한번 에 몇개를 동시에 할 거냐 (고사양 요구)

 

저사양이면 batch size를 1개로 해서 1번에 1개씩 생성하게 해야함

 

임베딩 / Embedding
학습된 하나의 프롬프트, 단어 하나

 

 

Aesthetic Gradients
ai 그림 학습 방법 중 하나 (고유명사)

 

textual inversion

ai 그림 학습 방법 중 하나 (고유명사)

 

dreambooth

ai 그림 학습 방법 중 하나 (고유명사)

 

 

Lora

ai 그림 학습 방법 중 하나 (고유명사)

하이퍼네트워크와 임베딩의 상위호환급 취급을 받는 중

용량이 작음에도 큰 영향력을 발휘하는게 장점
200mb 이하의 비교적 작은 용량

단, 학습시키려면 고사양 필요

\models\Lora 폴더에 저장

 


lora 사용시 역할

스카이림 모드 같은 것.

기존의 모델도 쓰고 로라도 쓰고 이렇게 두개를 같이 쓸 수 있음

 

 

hypernetwork

그림체나 스타일을 학습시킴 (고유명사)

 

 

checkpoint  .ckpt      ai model      sd 1.5 sd 2.0 같은 통 모델

 

 

YCH - Your Characters Here 니 캐릭터를 여기 넣어라

 

 

Fine Tuning Text-to-Image Diffusion Models

학습한 데이터를 스테이블 디퓨전에 새로 집어넣음. 즉 새로운 개념을 모델에 주입함

 

 


detail = steps = samples
샘플수
낮을수록 뭉개지고 많을수록 디테일해짐
보통 20~100 을 씀



creativeness = guidance scale
프롬프트 글자에 근사한 정도
보통 7~15를 씀
샘플러에 따라서 너무 올리면 깨지기도 함

 

 

denoising (img2img)

프롬프트 글자에 근사한 정도 (위에 거랑 비슷함)

낮으면 내가 업로드한 이미지에 가깝게 나옴

높으면 프롬프트에 가깝게 나옴

보통 0.2~0.3 ,   0.4~0.7 을 씀



sampler = model = sampling method =샘플방식
lms 시리즈 = 현실사진용
k euler a 및 그외 = 그림용



seed 
-1 또는 빈칸은 랜덤하게 출력됨

 


resoultion (width x height)
출력 크기
512보다 낮으면 값이 변화됨

 

 

gfpgan = face restoration
얼굴 보정

 


control net

image 2 image 보완한 애드온 (=스크립트, 플러그인, 부가기능)

open pose 포즈를 유지한 채 이미지 변경 가능

canny 외곽선 유지한 채 이미지 변경 가능

depth 울룩불룩 요철을 유지한 채 이미지 변경 가능

 

 

 

masking = inpainting

원하는 곳 지정하면 다시 그려줌

 

 

 

반응형
Posted by 이름이 익명
: