Stable Diffusion 使用 AMD ROCm 显卡加速
https://bbs.ruliweb.com/userboard/board/700315/read/3180
https://github.com/XiaozhouTAT/stable-diffusion-webui-use-amd-gpu
Ubuntu
- 本篇文章使用 Ubuntu 20.04 LTS(不频繁更新的系统才是好系统),理论上 Ubuntu 22.04 LTS 也可以,下载地址。
- 使用 Linux 和 Python 难度最大的不是安装,而是依赖问题,请做好心理准备。
- Ubuntu 可以安装在电脑上任意分区,会自动添加引导到 Windows 的引导上。
- RX6700XT 按照 Tom’s Hardware文章的测试参数,跑512x512, 100it 约16秒,6.25it/s.
Windows?
- 由于 ROCm 版本的 Pytorch 不支持 Windows,你一定要用 Windows 请使用下面的方法,并做好性能减半,或者完全不能用的准备。
- https://github.com/lshqqytiger/stable-diffusion-webui-directml
- https://github.com/nod-ai/SHARK/
显卡是否支持
- 官方ROCm支持列表支持 GFX9, CDNA, RDNA显卡。
以上是官方支持的显卡,同架构的显卡可以添加环境变量来支持。
RX580
- 网友说官方ROCm对 RX580 只支持到 Rocm3.7,之后的版本官方不做可用性认证,导致新版本ROCm支持 RX580 有很多bug,但是 ROCm3.7 只支持Python3.6-3.9
- 幸好网友对官方 ROCm 进行了修改,添加了 RX580 的支持,会用到 https://github.com/xuhuisheng/rocm-gfx803 库里的修改版 rocblas, pytorch, torchvision, tensorflow.
请注意这个库使用的是 Ubuntu 20.04 LTS 进行的验证。
安装Python
sudo apt install wget git python3 python3-venv python3-pip -y
就上面的命令也有可能存在依赖问题,祝你好运。
安装ROCm
# https://docs.amd.com/category/Release%20Documentation
# https://www.amd.com/zh-hans/support/graphics/radeon-500-series/radeon-rx-500-series/radeon-rx-580
# https://www.amd.com/zh-hans/support/graphics/amd-radeon-6000-series/amd-radeon-6700-series/amd-radeon-rx-6700-xt
wget https://repo.radeon.com/amdgpu-install/22.40.3/ubuntu/focal/amdgpu-install_5.4.50403-1_all.deb # Rocm 5.4.3 on Ubuntu 20.04 LTS (focal)
sudo apt install ./amdgpu-install_5.4.50403-1_all.deb
sudo apt update && sudo apt upgrade -y
sudo amdgpu-install --usecase=rocm --no-dkms
sudo usermod -a -G video,render $LOGNAME
sudo reboot
上面的包的作用就是 添加 https://repo.radeon.com/ 到你的 Ubuntu 源,并将可执行添加到$PATH,Ubuntu CN 源的速度其实还行,但是 Radeon 的速度看人品了,自己加速器吧。
显卡驱动状态
ls -l /dev/dri/render* # 看显卡在Linux下可见不可见
watch -n 1 rocm-smi # 每1秒刷新 rocm-smi 显卡状态
/opt/rocm/bin/rocminfo # 详细显卡信息
rocminfo | grep 'Name' # 显卡名称,gfx代号
/opt/rocm/opencl/bin/clinfo # 显示支持 OpenCL 显卡
安装 PyTorch
- PyTorch官方安装命令 是
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2
- 但是他们的库速度很慢,国内的mirror是爬虫抓的,不是官方支持,所有安装兼容性可能有问题,有加速器的尽量使用加速器吧。
请注意你安装的 Python 的快捷方式是
python
python3
python3.10
中的哪一个,还有pip
pip3
要注意。
# https://download.pytorch.org/whl/ -> https://mirror.sjtu.edu.cn/pytorch-wheels/
# ALL pytorch version https://download.pytorch.org/whl/torch_stable.html or https://mirror.sjtu.edu.cn/pytorch-wheels/torch_stable.html search ROCm
# Pip的配置文件为用户根目录下的:~/.pip/pip.conf or ~/.config/pip/pip.conf(Windows路径为:C:\Users\<UserName>\pip\pip.ini)
# https://pypi.tuna.tsinghua.edu.cn/simple
# http://mirrors.aliyun.com/pypi/simple
# http://pypi.douban.com/simple
# https://mirrors.cloud.tencent.com/pypi/simple
# https://repo.huaweicloud.com/repository/pypi/simple
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple
python -m pip install --upgrade pip wheel -i https://mirrors.aliyun.com/pypi/simple
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2
pip install torch torchvision torchaudio -f https://mirror.sjtu.edu.cn/pytorch-wheels/rocm5.4.2/torch_stable.html -i https://mirrors.aliyun.com/pypi/simple
pip list | grep 'torch'
#pip install torch==2.0.0+rocm5.4.2 torchvision==0.15.1+rocm5.4.2 torchaudio==2.0.1+rocm5.4.2 -f https://mirror.sjtu.edu.cn/pytorch-wheels/rocm5.4.2/torch_stable.html
# 下面命令可能能会帮你解决依赖问题,也可能不会。
pip freeze > req.txt
pip install -r req.txt
要注意自己下载安装的是否是带有 ROCm 标识的 PyTorch.
下载 Stable Diffusion WebUI
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
#python -m venv venv
#source venv/bin/activate #Linux
#pip install virtualenv #Windows
#.\venv\Scripts\activate #Windows CMD or PS
#source venv/Scripts/activate #Git Bash
#python -m pip install --upgrade pip wheel -i https://mirrors.aliyun.com/pypi/simple
#pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
#deactivate
从这里开始会下载很多 GitHub 的文件,可能会下载失败,请加速器吧。或者了解 https://ghproxy.com 的用法。
修改 webui-user.sh
# 添加进 webui-user.sh
export HSA_OVERRIDE_GFX_VERSION=10.3.0 # gfx1030 Radeon RX 6800 6800 XT 6900 XT, gfx1031 Radeon RX 6700 XT.
#export HSA_OVERRIDE_GFX_VERSION=8.0.3 # gfx803 Radeon RX580
# RX5000 系列需要在 COMMANDLINE_ARGS 添加 --precision full --no-half,RX500 和 RX6000 系列不需要
# --medvram --lowvram --opt-sub-quad-attention --disable-nan-check https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Command-Line-Arguments-and-Settings
export COMMANDLINE_ARGS="--skip-torch-cuda-test --autolaunch --listen --theme dark"
#export TORCH_COMMAND="pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2"
export TORCH_COMMAND="pip install torch torchvision torchaudio -f https://mirror.sjtu.edu.cn/pytorch-wheels/rocm5.4.2/torch_stable.html -i https://mirrors.aliyun.com/pypi/simple"
下载Model
- civitai.com
- huggingface.co
- 推荐下载 fp16 版本
- 将下载的 .safetensors 放到
stable-diffusion-webui/models/Stable-diffusion
目录下。
运行 webui.sh
./webui.sh
在实际运行时,你添加修改某些功能会自动从GitHub下载某些文件,不用加速器,你遇到的问题会很多。
请注意,PyTorch 版本必须和 ROCm 版本一致,比如 5.4.x 5.2.x,否则你会在运行某些功能时报 PyTorch 版本不匹配的错误。