2026-05-177분 읽기

스테이블 디퓨전 시작하기 - 초보자를 위한 설치부터 첫 이미지 생성까지

AI 이미지 생성에 관심은 있지만 어디서부터 시작해야 할지 막막한 분들을 위한 실전 가이드. 사양 확인부터 모델 다운로드, 프롬프트 작성까지 한 번에 정리했습니다.

#스테이블디퓨전 #AI이미지생성 #StableDiffusion #AI툴 #WebUI

스테이블 디퓨전 시작하기 - 초보자를 위한 설치부터 첫 이미지 생성까지

유튜브나 인스타그램에서 AI로 만든 이미지를 보고 '나도 한번 만들어볼까' 싶었는데, 막상 검색해보니 용어부터 낯설고 설치 방법도 복잡해 보여서 포기한 경험이 있으실 겁니다. 미드저니처럼 월 구독료를 내야 하는 서비스는 부담스럽고, 무료로 쓸 수 있다는 스테이블 디퓨전은 진입 장벽이 높다고 알려져 있죠. 사실 한 번만 제대로 세팅해두면 그 이후부터는 클릭 몇 번으로 원하는 이미지를 무제한 생성할 수 있습니다.

스테이블 디퓨전이란 무엇인가

스테이블 디퓨전(Stable Diffusion)은 영국의 Stability AI가 2022년 8월에 공개한 오픈소스 이미지 생성 모델입니다. 텍스트를 입력하면 그에 맞는 이미지를 만들어내는 방식으로, 미드저니나 달리(DALL-E)와 같은 카테고리에 속합니다.

가장 큰 차이점은 완전히 무료이며 내 컴퓨터에서 직접 구동된다는 점입니다. 인터넷 연결 없이도 사용할 수 있고, 생성 횟수에 제한이 없으며, 만든 이미지가 외부 서버에 저장되지도 않습니다.

스테이블 디퓨전의 진짜 강점은 '내가 모든 것을 통제할 수 있다'는 점입니다. 모델 교체, 세부 옵션 조정, 추가 기능 설치까지 자유롭게 커스터마이징할 수 있습니다.

다른 AI 이미지 도구와의 비교

항목	스테이블 디퓨전	미드저니	달리3
비용	무료	월 10달러부터	ChatGPT Plus 포함
설치	로컬 설치 필요	웹/디스코드	웹 사용
생성 횟수	무제한	플랜별 제한	일일 제한
커스터마이징	매우 자유로움	제한적	거의 불가
학습 난이도	높음	낮음	매우 낮음

내 컴퓨터 사양 확인하기

스테이블 디퓨전을 쾌적하게 사용하려면 일정 수준 이상의 그래픽카드가 필요합니다. CPU나 RAM보다 GPU의 VRAM 용량이 가장 중요합니다.

최소 사양: NVIDIA GPU, VRAM 4GB 이상
권장 사양: NVIDIA RTX 3060 12GB 이상
쾌적한 사양: RTX 4070 이상, VRAM 12GB 이상

VRAM이 부족하면 이미지를 생성할 수는 있지만 시간이 오래 걸리거나 해상도가 제한됩니다. 1024x1024 이미지 한 장 생성하는 데 RTX 4070 기준 약 6초, GTX 1660 6GB 기준 약 30초 정도 걸린다고 보시면 됩니다.

참고: AMD 그래픽카드나 맥북에서도 구동은 가능하지만, NVIDIA GPU 대비 속도가 2~5배 느리고 호환성 문제가 자주 발생합니다. 가능하면 NVIDIA 환경을 권장합니다.

WebUI 설치 단계별 가이드

스테이블 디퓨전을 가장 쉽게 사용하는 방법은 AUTOMATIC1111 WebUI를 설치하는 것입니다. 명령어 없이 브라우저 화면에서 모든 작업을 할 수 있게 해주는 인터페이스입니다.

설치 순서

Python 3.10.6 버전 설치 (다른 버전은 호환성 문제 발생)
Git 설치
설치하고 싶은 폴더에서 명령 프롬프트 실행
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 입력
생성된 폴더 안의 webui-user.bat 실행
처음 실행 시 필요 파일을 자동으로 다운로드 (10~20분 소요)
완료되면 브라우저에서 http://127.0.0.1:7860 접속

팁: 설치 폴더는 한글이 포함되지 않은 경로에 만드세요. 'C:/AI/sd' 같은 영문 경로를 사용하면 오류 발생 확률이 크게 줄어듭니다.

체크포인트 모델 다운로드

WebUI를 설치했다고 끝이 아닙니다. 실제로 이미지를 그려내는 '모델 파일'이 필요합니다. 이 파일을 체크포인트(checkpoint)라고 부르며, 어떤 모델을 사용하느냐에 따라 그림 스타일이 완전히 달라집니다.

가장 많이 사용되는 모델 공유 사이트는 Civitai와 Hugging Face입니다. 각 모델은 보통 2GB에서 7GB 사이의 용량을 차지합니다.

모델 종류별 특징

실사형 모델: Realistic Vision, epiCRealism 등 - 사람 사진 같은 결과물
2D 일러스트형: Anything V5, MeinaMix 등 - 애니메이션 스타일
SDXL 계열: Juggernaut XL, DreamShaper XL 등 - 1024px 고해상도 특화

다운로드한 .safetensors 또는 .ckpt 파일은 stable-diffusion-webui/models/Stable-diffusion 폴더에 넣으면 됩니다. WebUI 좌측 상단에서 모델을 선택해 바로 전환할 수 있습니다.

프롬프트 작성의 기본 원칙

스테이블 디퓨전은 프롬프트(텍스트 명령)의 품질에 따라 결과물이 크게 달라집니다. 미드저니처럼 자연어 문장보다는 키워드를 쉼표로 나열하는 방식이 효과적입니다.

프롬프트 구조 예시

'a young woman, long black hair, white dress, standing in a sunflower field, cinematic lighting, 8k, detailed face, photorealistic'

이런 식으로 주제 - 외형 - 배경 - 조명 - 품질 키워드 순서로 작성합니다. 한글로도 일부 인식되지만, 영어로 작성하는 것이 훨씬 정확한 결과를 줍니다. 영어가 부담스럽다면 번역기를 활용하거나 텍스트 변환기 같은 도구로 표현을 다듬어보는 것도 방법입니다.

네거티브 프롬프트(Negative prompt)도 중요합니다. 이미지에서 빼고 싶은 요소를 입력하는 칸으로, 보통 'low quality, blurry, bad anatomy, extra fingers' 같은 키워드를 기본으로 넣습니다.

주요 파라미터 설명

설정	권장값	설명
Sampling steps	20~30	생성 반복 횟수, 높을수록 정교
CFG Scale	7~11	프롬프트 충실도
Width/Height	512x512 또는 1024x1024	SD1.5는 512, SDXL은 1024
Sampler	DPM++ 2M Karras	품질과 속도 균형

자주 발생하는 문제 해결법

설치 과정과 사용 중 마주치는 대표적인 오류 몇 가지를 정리했습니다.

VRAM 부족 오류 (CUDA out of memory)

이미지 크기를 줄이거나 webui-user.bat 파일을 메모장으로 열어 set COMMANDLINE_ARGS= 뒤에 --medvram 또는 --lowvram 옵션을 추가하면 됩니다. 단, 속도는 느려집니다.

Python 버전 오류

3.10.6 외 다른 버전이 설치되어 있으면 충돌이 발생합니다. 기존 Python을 제거하고 정확한 버전을 재설치한 뒤 환경변수를 다시 설정해주세요.

모델 로딩 실패

다운로드한 파일이 손상되었거나 폴더 경로가 잘못된 경우입니다. 파일 크기를 확인하고 정확한 폴더에 넣었는지 점검하세요. 파일명에 특수문자가 포함되면 인식이 안 될 수 있으므로 정규식 테스터로 패턴을 확인하거나 영문/숫자로만 파일명을 변경하는 것을 추천합니다.

생성 결과가 이상할 때

손가락이 7개로 나오거나 얼굴이 일그러지는 경우가 흔합니다. 네거티브 프롬프트에 'extra fingers, deformed, mutated hands'를 추가하고, 해상도를 너무 높게 잡지 마세요. 512x768처럼 세로로 긴 비율에서 인물 결과가 더 안정적입니다.

처음 설치할 때 막히는 부분이 많지만, 한 번 세팅을 끝내면 매일 수십 장의 이미지를 무료로 만들 수 있습니다. 오늘은 일단 WebUI 설치와 기본 모델 하나만 받아보세요. 그다음 Civitai에서 마음에 드는 모델을 골라 다운로드해보는 것으로 충분합니다.