https://docs.getgrist.com/3mjouqRSdkBY/sdperformance/p/1
Stable Diffusion 그래픽 카드 별 연산 수치 정리표입니다. (4000번대 및 3000번대 포함)
숫자가 높을 수록 그림 뽑는 속도가 빠르고 좋습니다. (512 x 512 기준으로만 나열했습니다.)
랩탑으로도 테스트 한 용자들이 있으므로, 자신이 쓰고 있는 그래픽 카드만 체크하신 다음
Addtitonal info 에서 조건 교차 검증하시면 되겠습니다.
https://usem.liberaforms.org/sdperformance
퍼포먼스 테스트 기준입니다. 모델 / VAE / 배치 카운트 / 프롬프트 는 이대로 놓고 테스트 하시면 됩니다.
RTX 4090 : 최고 40.67 ~ 최저 22.72 it/s
RTX 4080 : 최고 23.40 ~ 최저 15.83 it/s
RTX 4070ti : 최고 22.28 ~ 최저 16.61it/s
RTX 3090 : 최고 17.82 ~ 최저 4.07 it/s
RTX 3080ti : 최고 18.59 it/s ~ 최저치 미집계
RTX 3080 : 최고 13.83 ~ 최저 7.00 it/s
RTX 3070ti : 최고 11.06 ~ 최저 8.77 it/s
RTX 3070 : 최고 11.56 ~ 최저 9.01 it/s
RTX 3060ti : 최고 9.56it/s ~ 최저치 미집계
RTX 3060 : 최고 8.01 ~ 최저 6.25 it/s
집에서 512 x 512 기준, 테스트 하실 때 이 결과 값 보다 속도가 안 나오신다면 Stable Diffusion 의 세팅이 잘못되셨거나,
(대표적으로 Xformer / cudnn / CUDA / Torch / --no-half-vae 사용 여부 등등...)
VRAM 이 작은 모델인지 (같은 모델이라면 무조건 VRAM 이 더 큰 모델이 깡패입니다.)
지나치게 큰 해상도를 사용하는지 / LoRA 를 여러 개 첨가해서 사용 하는 지에 대한 체크가 필요합니다.
(해상도가 클 경우 속도가 2.5배 하락, LoRA 여러 개 첨가 시 속도 2배 하락 = 이 두 가지 조건을 모두 사용할 경우 속도 4배 이상 하락)
512X512 기준으로, 모델 / VAE / 배치 카운트 / 프롬프트 카운트를 위에 링크 드린대로 해보시고 그래도 속도가 안나오시면 점검해보시면 됩니다.
프롬프트가 너무 많아도 속도가 떨어지고
지나치게 큰 해상도를 사용하는지 / LoRA 를 여러 개 첨가해서 사용 하면 속도가 팍팍 떨어집니다.
특히 해상도가 가장 많이 잡아먹습니다.
조만간 정리해서 여기에 올려보겠습니다.