tti Stable Diffusion 용어
ai 그림 공부 2022. 9. 11. 11:45 |
hires.fix
해상도 올려주는 기능
그림이 개좆같이 나오는 걸 해상도 늘려서 해결해주는 것
기본세팅값
2d는 esrgan4x anime , step 12~22? , deno 0.3~0.7 upscale by 2
hires.fix
= extra의 확대기능 + i2i를 사용해 더 큰 사이즈로 뽑기
= 기본 뽑은 이미지를 바탕으로 큰 화면에 새로 뽑아주는 기능
사양이 많이 필요함
사양 적은 사람들은 그냥 포토샵에서
200% 확대 -> i2i 돌리기 -> 50% 축소해서 붙여넣기
이 기법을 써야 함
multi diffusion
hires fix 와 비슷함
속도는 느리되 사양은 덜 필요함
ddtailer
얼굴 보완 기능
200% 확대 -> i2i 돌리기 -> 50% 축소해서 붙여넣기
이 기법을 알아서 해주는 기능이라 보면 됨
xformers
rtx 2000 번대 이상대부터 효과 있는것, 최적화.
글카 그 이하는 안쓰는 걸 비추
ckpt ≒ safetensor
체크포인트 모델 파일을 의미
batch count 몇번 연달아 뽑을거냐
batch size 한번 에 몇개를 동시에 할 거냐 (고사양 요구)
저사양이면 batch size를 1개로 해서 1번에 1개씩 생성하게 해야함
임베딩 / Embedding
학습된 하나의 프롬프트, 단어 하나
Aesthetic Gradients
ai 그림 학습 방법 중 하나 (고유명사)
textual inversion
ai 그림 학습 방법 중 하나 (고유명사)
dreambooth
ai 그림 학습 방법 중 하나 (고유명사)
Lora
ai 그림 학습 방법 중 하나 (고유명사)
하이퍼네트워크와 임베딩의 상위호환급 취급을 받는 중
용량이 작음에도 큰 영향력을 발휘하는게 장점
200mb 이하의 비교적 작은 용량
단, 학습시키려면 고사양 필요
\models\Lora 폴더에 저장
lora 사용시 역할
스카이림 모드 같은 것.
기존의 모델도 쓰고 로라도 쓰고 이렇게 두개를 같이 쓸 수 있음
hypernetwork
그림체나 스타일을 학습시킴 (고유명사)
checkpoint .ckpt ai model sd 1.5 sd 2.0 같은 통 모델
YCH - Your Characters Here 니 캐릭터를 여기 넣어라
Fine Tuning Text-to-Image Diffusion Models
학습한 데이터를 스테이블 디퓨전에 새로 집어넣음. 즉 새로운 개념을 모델에 주입함
detail = steps = samples
샘플수
낮을수록 뭉개지고 많을수록 디테일해짐
보통 20~100 을 씀
creativeness = guidance scale
프롬프트 글자에 근사한 정도
보통 7~15를 씀
샘플러에 따라서 너무 올리면 깨지기도 함
denoising (img2img)
프롬프트 글자에 근사한 정도 (위에 거랑 비슷함)
낮으면 내가 업로드한 이미지에 가깝게 나옴
높으면 프롬프트에 가깝게 나옴
보통 0.2~0.3 , 0.4~0.7 을 씀
sampler = model = sampling method =샘플방식
lms 시리즈 = 현실사진용
k euler a 및 그외 = 그림용
seed
-1 또는 빈칸은 랜덤하게 출력됨
resoultion (width x height)
출력 크기
512보다 낮으면 값이 변화됨
gfpgan = face restoration
얼굴 보정
control net
image 2 image 보완한 애드온 (=스크립트, 플러그인, 부가기능)
open pose 포즈를 유지한 채 이미지 변경 가능
canny 외곽선 유지한 채 이미지 변경 가능
depth 울룩불룩 요철을 유지한 채 이미지 변경 가능
masking = inpainting
원하는 곳 지정하면 다시 그려줌