لاما۳ با پشتیبانی از فارسی آمدسلام بعد از مدتها. گفتیم با یه خبر برگردیم: شرکت متا لاما۳ رو بیرون داد. علی الحساب چند تا بولت راجع بهش بگیم تا جزئیات مفصلتر رو در آینده نزدیک بهتون بگیم:
• پشتیبانی از فارسی (لینک دمو در انتهای پست و عکس اول از نمونه سوال و جواب)
• ۱۰ درصد بهبود نسبت به ورژنهای قبلی داره
• در دو سایز ۸ و ۷۰ میلیاردی در دو نسخه base و instruct ارائه شده
• توکنایزرش با اندازه ۱۲۸ هزار تا آپدیت شده
• باز هم اجازه استفاده تجاری داده شده
• روی ۱۵ تریلیون توکن آموزش داده شده
• روی ۱۰ میلیون نمونه لیبلزده شده توسط انسان فاینتیون شده
• برای alignment هم از sft و ppo و dpo استفاده شده
• روی mmlu بهترین مدل زبانی وزنباز هست (بالای ۸۰)
• مدل ۸ و ۷۰ میلیاردی نسخه instruct یه ترتیب با ۶۲.۲ و ۸۱.۷ در HumanEval وضعیت بسیار خوبی در کدزنی دارند.
• اندازه context window با اندازه پیش فرض ۸۱۹۲ و با قابلیت افزایش
لینک به تصاویری از مدل:
https://t.center/overfit_stuff/313لینک بلاگ متا:
https://ai.meta.com/blog/meta-llama-3/لینک بلاگ توضیح و استفاده لاما:
https://huggingface.co/blog/llama3لینک دمو لاما۳ (پشتیبانی از فارسی):
https://www.llama2.ai/لینک کالکشن هاگینگفیس:
https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6#model
@nlp_stuff