🔴لایفوب از دو مدل زبانی تهران و شیراز رونمایی کرد 🔹تیم هوش مصنوعی شرکت دانشبنیان لایفوب پس از ۶ ماه تلاش موفق به توسعه مدلهای جدید برای پردازش زبان فارسی شده است. این نخستین بار است که یک مدل زبانی بر اساس دادههای زبان فارسی با تنوع موضوعی و پلتفرمی بهصورت کلان انجام شده و اکنون در راستای مسئولیت اجتماعی در اختیار پژوهشگران و فعالان حوزه هوش مصنوعی قرار میگیرد. «تهران» و «
شیراز» نام این مدلهای زبانی است.
🔻#تهران (Tehran) و
#شیراز (Shiraz)، دقیقترین و سریعترین مدلهای زبانی تا به امروز برپایه معماری خانواده BERT برای زبان فارسی در دسترس قرار گرفتند.
✅دپارتمان هوش مصنوعی شرکت
#LifeWeb با تدوین جامعترین مجموعه داده فارسی با نام
#دیوان موفق به آموزش دو مدل زبانی مبتنی بر ساختار RoBERTa و MobileBERT شده است که در حال حاضر مطابق با آزمونهای انجام شده در مقایسه با سایر مدلهای زبانی فارسی دارای بالاترین دقت و سرعت است.
این مدلها بر روی بیش از ۱۷۰ میلیون متن فارسی معادل بیش از ۱۰ میلیارد توکن شامل متون پستهای انواع پلتفرمهای آنلاین مانند پرعضوترین گروهها و کانالهای تلگرامی از موضوعات مختلف، ایکس(توییتر)، پربازدیدترین سایتهای خبری و وبلاگهای فارسی، کامنتهای اینستاگرام و دیگر پلتفرمهای شبکه اجتماعی در انواع موضوعات تاریخی، حقوقی، گردشگری، تکنولوژی، پزشکی، روزمره تحت آموزش قرار گرفتهاند.
همچنین مدل
شیراز با استفاده از معماری MobileBERT که منجر به بهبود سرعت در زمان پاسخدهی با حفظ دقت مدلهای زبانی میشود، توانسته است این مهم را برای زبان فارسی نیز فراهم کند. این مدلها در دقت و سرعت پاسخدهی مدلهای ParsBERT و AriaBERT وFaBERT را پشت سر میگذارند.
🟣بدین وسیله از شما دعوت میشود برای مشاهده جدول مقایسه دقتها و همچنین اطلاع از جزییات بیشتر این پروژه از صفحه Github و HuggingFace #لایف_وب به آدرس زیر دیدن فرمایید:https://github.com/lifeweb-ir/LMhttps://huggingface.co/lifeweb-aiبرای استفاده از دمو به این لینک بروید:
https://lifewebco.com/ai