Пару недель назад вышел новый метод дистилляции диффузионных моделей
Flash Diffusion, а сейчас подвезли демку для
SD3!
Дистилляция занимает от
пары десятков (SD1.5) до пары сотен (SDXL) GPU-часов, протестирована на
множестве задач: text-to-image, inpainting, super resolution, face swap и на
T2I адаптерах, а FID и CLIP-Score на COCO датасетах лучше, чем у других методов.
Авторы выложили
код, в том числе и для обучения,
модели (SD3, SDXL, Pixart-alpha) и онлайн-демо.
А умельцы уже добавили
TinyAutoencoder для SD3, что ещё ускорило модель, попробуйте
сами!