Продолжаю свои тесты и вот удалось развернуть... / Neural Deep

Всем привет! Начнем этот год с бенчмарков on-premise VL и Cloud моделей и их производительности в анализе неструктурированных документов и извлечении данных из них через подход Structured output. У нас сегодня открытые данные (таможенные декларации и не…

Продолжаю свои тесты и вот удалось развернуть Qwen2-VL-72B-Instruct-FP8-dynamic на 4х4090 (на immers за 260к деревянных в месяц) с 16к токенами контекста и с не плохой скоростью Cейчас взял этот бенчмарк cmarkea/doc-vqa и упаковал тест в streamlit что бы визуально видеть как отрабатывает модель 1) Проблема я не понял как побороть требование следовать точному ответу из заготовленных правильных (возможно не так готовлю) 2) Чукча решил собрать на базе Structured Output модератора на базе Qwen 2.5 7b который будет решать True или False то в итоге что бы не писать кучу обработок Как соберу все в едино выдам результаты в комментарии

https://t.center/neuraldeep/1256

560 viewsValerii Kovalskii, Jan 6 at 12:25

Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global

Бот для знакомств