🔔 اعلام برنامه جلسه‌ی هشتم ژورنال‌کلاب مدل‌های زبانی بزرگ / LLM Journal Club / Telegram Center

🔔 اعلام برنامه جلسه‌ی هشتم ژورنال‌کلاب مدل‌های زبانی بزرگ 📚 موضوع: معماری دوگانه برای بهبود ایمنی و کارایی در مدل‌های زبانی بزرگ 👤 سخنران مهمان: دکتر شروین قاسملو از پژوهشگران ارشد هوش مصنوعی در شرکت متا 🗓 زمان: سه‌شنبه ۱۴۰۳/۰۹/۲۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰ مکان برگزاری: vc.sharif.edu/ch/mjafari 🔍 در این جلسه، دکتر شروین قاسملو درباره‌ی معماری نوآورانه‌ی Doppelgänger صحبت خواهد کرد؛ روشی که به‌صورت همزمان به بهینه‌سازی ایمنی و مفید بودن مدل‌های زبانی بزرگ (LLM) می‌پردازد. این معماری با اضافه کردن یک ماژول موازی به مدل، ایمنی ورودی و خروجی را در لحظه‌ی تولید هر توکن پیش‌بینی می‌کند و نیاز به مدل‌های جداگانه برای ارزیابی ایمنی پس از تولید را حذف می‌کند. این رویکرد با استفاده از داده‌های کم، نتایجی دقیق‌تر و کارآمدتر ارائه می‌دهد و به بهبود سرعت و کاهش مصرف منابع منجر می‌شود. منابع: 1. Doppelgänger’s Watch: A Split Objective Approach to Large Language Model افزودن رویداد به تقویم گوگل‌ از همه‌ی شما دعوت می‌کنیم که در این جلسه شرکت کنید. #LLM #LLM_JC #LLM_Club #INL_Lab

https://t.center/LLM_JC/37

3.8K viewsedited Dec 3 at 19:46

Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global

Find friends or serious relationships easily