⚡️⚡️⚡️Несколько часов назад Qwen анонсировали
QvQ-72B-Preview — первую open source мультимодальную модель с ризонингом (умеет итеративно «размышлять/рассуждать» и двигаться в сторону правильного ответа)
Сами авторы говорят, что модель в стадии preview и может «тупить», но так или иначе метрики очень крутые. Ключевые проблемы:
📍Модель может миксовать языки при ответах
📍Модель может зацикливаться в рассуждениях, не приближаясь к правильному выводу
📍Требуется дополнительный уровень безопасности и “любимого” alignment
📍В ходе рассуждений модель может утратить внимание на входную картинку и начать галлюцинировать
Ещё детали и примеры в блоге
👇
https://qwenlm.github.io/blog/qvq-72b-preview/
P.S. Так или иначе — we made a new step to AGI
💪
@complete_ai