Black Forest Labs: выпустили
Tools, набор моделей для тонкой работы с генерацией изображений.
В него входит:
*
FLUX.1 Fill: модель для инпейтинга и аутпейтинга, позволяющая вписывать/менять объекты на картинках или расширять кадр.
*
FLUX.1 Depth: изменение картинки на основе карты глубины.
*
FLUX.1 Canny: изменение картинки на основе карты очертаний.
*
FLUX.1 Redux: адаптер для получения вариаций изображения.
Canny и Depth идут в двух вариантах: полных моделях с максимальным качеством, и лоры (
Canny Lora плюс
Depth Lora) на основе Dev для упрощенной разработки.
Всё это уже можно крутить в
Comfy (обновляемся до последней версии).
Данные решения от BFL показывают себя лучше, чем контролнеты собранные сообществом, вроде
варианта от Alibaba (хотя в анонсе ссыль ведёт на альфа версию контролнета, а уже есть обновлённая
бета). Также пишут, что картинки на выходе лучше других моделей, но на их бенчах нет
Recraft V3.
В целом, BFL молодцы, что работают и на комьюнити, продвигая опенсорс, и себя не забывают с платными фишками по API.
Анонс
Хаггинг
Гитхаб
Запуск в Comfy