Segment Anything Model (SAM)
В прошлом
обзоре мы уже рассмотрели задачу интерактивной сегментации и общий подход к ней. Как знали, что грядет что-то грандиозное
🙂
Недавно вышла
статья с описанием новой архитектуры и огромного датасета для interactive segmentation. Авторы собрали
более миллиарда масок на 11 миллионах изображений и выложили данные c моделью в открытый доступ.
В новой статье мы рассмотрим архитектуру, процесс тренировки и подход к разметке датасета.
И подробнее разберем детали, которые еще не встретили в других обзорах статьи: как prompt encoder кодирует клики и рамки, как mask decoder создаёт маску.
Читайте новую статью по ссылке:
https://www.notion.so/deepschool-pro/Segment-Anything-50ce061b804a4d7e96cd0d6b084d396d?pvs=4