Stable Diffusion AI 이미지 생성기 로컬 구축하기

💡 Quotation
스테이블 디퓨전(Stable Diffusion)은 2022년에 출시된 딥 러닝, 텍스트-이미지 모델이다. 스타트업 스태빌리티 AI(Stability AI)가 여러 학술 연구원 및 비영리 단체와 공동으로 개발했다.

스테이블 디퓨전은 사용자로부터 텍스트를 입력받아 그림이나 사진으로 출력을 해줍니다! 😎

깃에 있는 내용을 그대로 클론을 받고 배치파일 또는 스크립트를 실행하면 바로 사용할 수 있을 정도로 구축하는 방법도 쉽습니다.

사양

CPU: Ryzen5 7500F
MEM: DDR5 32GB
GPU: nVidia RTX 4060 8GB (엔비디아 권장)
Windows 11 Pro x64

준비

Git

깃 허브에서 스테이블 디퓨저 및 확장 모듈을 클론할 때 필요합니다.

Python

AI 는 파이썬 위에서 돌아간다고 생각하면 됩니다.
- 설치 후 환경 변수 추가 필요
  - Win + R 키를 눌러 sysdm.cpl ,3 입력
  - 환경변수 클릭
  - Path에 Python3 설치 경로 추가
    - %appdata%\..\Local\Packages\ 에 찾을 수 있음
    - 파이썬이 설치된 루트 디렉터리와 Scripts 디렉터리 두 개 추가
  - Path 가 길다고 오류 메세지가 나오면 아래와 같이 조치
    - HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem 에서 LongPathsEnabled 값을 1로 수정

Stable Diffusion WebUI

필요한 패키지를 자동으로 받아주고 Web UI 를 제공

실행

클론을 한 후 해당 디렉터리 안에 webui.bat 을 실행하면 됩니다.

처음 실행하면 필요한 패키지를 설치하느라 시간이 조금 걸릴 수 있습니다. 👍

패키지를 모두 받고 준비가 끝나면 인터넷 브라우져가 실행될 것입니다. 로컬 호스트에 7860 포트로 실행됩니다.

webui

예제

긍정 프롬프트에 적힌 사진이 출력되고, 부정 프롬프트에 적은 내용은 출력에서 제외합니다.

create_cat

cat

Prompt: a cat on street, brown color, cute

자세히 적을수록 원하는 이미지를 출력할 수 있다고 합니다.

🚀 활용

civitai 에서 본인이 출력하고 싶은 사진의 모델을 고른 후 적용하면 퀄리티는 높이고 소요 시간을 단축시킬 수 있습니다.

civitai

저는 다운로드가 제일 많은 모델을 적용 시켜봤습니다.

다운로드 후 *.safetensors 파일을 stable-diffusion-webui\models\Stable-diffusion 에 위치시켜주세요.

refresh_model

새로고침을 누르면 해당 모델을 찾을 수 있습니다. 해당 모델로 변경 후 다시 만들어보겠습니다.

cat2

Prompt: a cat on street, brown color, cute

child

Prompt: cute child, smile face, yellow cap, yellow backpack

아래는 같은 프롬프트에 다른 모델을 사용하여 만든 이미지입니다.

child2

Prompt: cute child, smile face, yellow cap, yellow backpack

camera

Prompt: a film camera on central park, neck strap

사양#

준비#

Git#

Python#

Stable Diffusion WebUI#

실행#

예제#

🚀 활용#

사양

준비

Git

Python

Stable Diffusion WebUI

실행

예제

🚀 활용