View in Telegram
Majority vote for CV annotations: improve your data labeling pipeline 🔮 В субботу 27.05 на ODS DataFest 🦜 в треке Data Collection & Labelling @karinakv рассказала о наших методах агрегации разметки в Computer Vision. Тут мы кратко напишем о мотивации и о результатах, а доклад с описанием методов можно посмотреть по ссылке. Речь пойдет о 3х типах разметки в CV: bounding boxes, сегментационные маски и временные интервалы. Для разметки больших данных часто используются краудсорсинг платформы, однако получаемое качество разметки оставляет желать лучшего. Частые ошибки разметчиков: 😔 разметка неверно локализует объект 😰 неверно выбрана метка 😭 лишние / пропущенные выделенные области Для наибольшей уверенности в правильности разметки на подобных площадках вводят понятие «перекрытия», то есть один и тот же сэмпл размечают несколько человек 👥. Получение одной итоговой разметки из нескольких мы называем агрегацией. Наше решение состоит из 2х частей - hard aggregation и soft aggregation - и позволяет привести полученные варианты разметок для одного и того же сэмпла, даже если не все из них верные, к итоговой хорошей разметке 💪. Такой подход также позволил нам существенно снизить временные и денежные 💸 ресурсы на разметку 3х наших датасетов: HaGRID, EasyPortrait и Slovo. В скором времени планируем реализовать фреймворк агрегации, который можно будет установить как питоновскую библиотеку 🐍 . С его помощью можно будет усреднять разметку не только с краудсорсинг-платформ, но и с выходов нейронок! В комментариях к этому посту можете рассказать о том, какие ошибки допускают пользователи при разметке ваших данных и мы учтем это при реализации фреймворка. ❤️ #news
Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global
Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global
Find friends or serious relationships easily