🗞 ـ مدل جدید بصری علیبابا: QvQ برای تقویت استدلال تصویری🔘 ـ تیم Qwen کمپانی Alibaba مدل آزمایشی جدیدی به نام QvQ-72B-Preview را ارائه کرده است که بر بهبود قابلیتهای استدلال تصویری متمرکز است. این مدل تحت مجوز Apache2 2 منتشر شده و به کاربران اجازه میدهد تا با بارگذاری تصویر و ارائه یک پرسش، پاسخی طولانی دریافت کنند. اگرچه کیفیت نتایج مختلف بوده، اما تأثیر قابلیتهای مدل جالب توجه است. مدل QvQ در حقیقت ادامهای بر QwQ است که قبلاً معرفی شده و توانایی تحلیل گسترده با دریافت نشانههای مختلف را دارد. این مدل اکنون بر روی پلتفرم Hugging Face Spaces در دسترس است و آماده استفاده و ارزیابی توسط کاربران علاقهمند است.
🔗Simon Willison's Weblog🪄مشاهده خلاصه مطلب با AI✔@rade_ai_news | @rade_ai