🔹️#انویدیا سری جدیدی از مدلهای زبان کوچک به نامهای Minitron 4B و 8B رو معرفی کرده که به واسطه هرس کردن و فشردهسازی اطلاعات، فرآیند آموزش مدلها رو تا ۴۰ برابر سریعتر کرده.
🔹️این روش جدید روی هرس ساختاری تمرکز داره و به صورت سیستماتیک نورونها، لایهها یا سرهای توجه (Attention) رو براساس اهمیت محاسبهشده اونها حذف میکنه. هدف این روش حفظ عملکرد مدل اصلی با کاهش چشمگیر هزینه و زمان آموزشه.
🔹️محققان از هوش مصنوعی برای تجزیه و تحلیل انفجارهای کیهانی استفاده خواهند کرد.
هوش مصنوعی با توانایی یادگیری ماشین به کمک ستاره شناسان برای درک بهتر انفجار ستاره ای به نام سوپرنوا خواهد آمد. دکتر مارک مگی نویسنده ارشد این تحقیق گفت:در حالی که ساخت یک مدل در حال حاضر 90 دقیقه طول می کشد، هوش مصنوعی قادر است هزاران مدل سوپرنوا را در کمتر از یک ثانیه تولید کند.