🔔 اعلام برنامه جلسهی هشتم ژورنالکلاب مدلهای زبانی بزرگ
📚 موضوع: معماری دوگانه برای بهبود ایمنی و کارایی در مدلهای زبانی بزرگ
👤 سخنران مهمان:
دکتر شروین قاسملو از پژوهشگران ارشد هوش مصنوعی در شرکت متا
🗓 زمان: سهشنبه ۱۴۰۳/۰۹/۲۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰
مکان برگزاری:
vc.sharif.edu/ch/mjafari
🔍 در این جلسه، دکتر شروین قاسملو دربارهی معماری نوآورانهی Doppelgänger صحبت خواهد کرد؛ روشی که بهصورت همزمان به بهینهسازی ایمنی و مفید بودن مدلهای زبانی بزرگ (LLM) میپردازد. این معماری با اضافه کردن یک ماژول موازی به مدل، ایمنی ورودی و خروجی را در لحظهی تولید هر توکن پیشبینی میکند و نیاز به مدلهای جداگانه برای ارزیابی ایمنی پس از تولید را حذف میکند. این رویکرد با استفاده از دادههای کم، نتایجی دقیقتر و کارآمدتر ارائه میدهد و به بهبود سرعت و کاهش مصرف منابع منجر میشود.
منابع:
1.
Doppelgänger’s Watch: A Split Objective Approach to Large Language Model
افزودن رویداد به تقویم گوگل
از همهی شما دعوت میکنیم که در این جلسه شرکت کنید.
#LLM #LLM_JC #LLM_Club #INL_Lab