🌿 Наши коллеги из Layer CV выбивают очередную SotA! 🌿
На прошлой неделе ребята опубликовали работу:
"Saliency-Guided DETR for Moment Retrieval and Highlight Detection". В ней авторы предлагают новый способ поиска ключевых моментов в видео релевантных текстовым запросам пользователей.
Модель SG-DETR демонстрирует
SOTA-
метрики на всех ключевых бенчмарках: Charades-STA, TACoS, TVSUM и YouTube Highlights. Особо впечатляющим стал результат на главном бенчмарке QVHighlights, где модель опередила предыдущее решение с невероятным гэпом в
7.44 п.п. 🌿
Препринт версия работы доступна на
arXiv и
PwC. И уже совсем скоро будет опубликован код, веса модели и наш датасет. Будем рады вашим отзывам и комментариям!
📚
А ещё
Марина Бессмертная на RnD Day рассказала в своем докладе "
Тихо! Сейчас будет та самая сцена" об автоматизированном пайплайне для анализа видеоконтента.
📹