MiVOLOv2.0 уже здесь
⚡
Как и раньше, модель можно пощупать в
демо на Hugging Face.
А можно прямо тут, в Телеграм боте, которого мы под такое важное событие наконец сделали –
@AnyAgeBot!
🤖
Основные факты:
- Датасет был расширен на ~30%. Значительная часть дельты состоит из примеров, на которых первая версия ошибалась.
- Много сэмплов из таких сложных и реалистичных источников, как соц. сети или
LAION-5B.
- Сильно добалансировали правый хвост распределения возрастов.
- Добавили новые аугментации во время тренировки.
- Появилась новая версия со входным разрешением 384х384, помимо старого 224х224. Оба демо работают с максимальным разрешением.
Рост метрик, в итоге, достаточно значительный. См. комментарии к посту.
Но это ещё не всё. Мы замерили потенциал
LMM (Large Multimodal Models) в задаче определения пола и возраста, в т.ч. на
ChatGPT и сравнили результаты с
MiVOLO. Причём, речь не о просто сборе данных, мы поэкспериментировали с файн-тюном
LLaVA.
Результаты вышли настолько интересными, что в скором времени будем писать по этой теме статью-технический репорт.