Нейросетевые изображения изначально содержат в себе
парадокс: с одной стороны, они приближены к реальным образам, с другой — изобилуют артефактами и искажениями. Это во многом объясняется выборками данных, на которых обучаются сервисы: туда в основном попадают «усредненные» изображения
💻
О том, как они затем воспроизводятся нейросетями, для
Teller Blog уже писал наш автор
Иван Неткачев.
Неткачев не только исследователь, но и медиахудожник. Одна из его работ под названием
Stopping Light во многом иллюстрирует тезисы опубликованного текста. Автор натренировал нейросеть на
фотографиях реальных церквей, а затем — на изображениях церквей
из GTA San Andreas. В конечном счете получилось генеративное видео, в котором реалистические образы сливаются с референсами из цифрового мира.
Иван предлагает детальнее взглянуть на принципы генерации изображений. Перед компаниями, которые тренируют ИИ, остро стоит вопрос нехватки данных. И работа Неткачева в этом контексте —
предположение, как в будущем будут обучаться нейросети 🖥
Рано или поздно ИИ будет вынужден изучать не только тексты и изображения, созданные человеком, но и
сгенерированные другим ИИ.