جامعترین سیستم ارزیابی مدلهای زبانی فارسی متولد شد
🔹 متخصصان مرکز تحقیقات هوش مصنوعی پارت و آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر با سرپرستی یکی از اساتید برجسته هوش مصنوعی کشور، سرکار خانم دکتر سعیده ممتازی، جامعترین و قدرتمندترین سیستم ارزیابی مدلهای زبانی فارسی
(Open Persian LLM Leaderboard) را توسعه دادند، تا زیستبوم هوش مصنوعی کشور از این پس به سنجهای دقیق و یکپارچه برای ارزیابی LLMهای فارسی مجهز شود.
🔹 این سیستم ارزیابی شامل
بیش از 40 هزار نمونه است که بخشی از آنها از چندین بنچمارک معتبر جهانی به فارسی برگردانده شده و بخشی دیگر در داخل کشور از پایه تهیه و برچسبزنی شدهاند. این تعداد نمونه، همواره در حال افزایش و بهروزرسانی است تا ضریب دقت در ارزیابیها همواره بهبود یابد. با این توضیحات، مدل ارائه شده، در کنار برترین بنچمارکهای جهانی قرار میگیرد.
🔹 بخش کوچکی از دادگان این سیستم ارزیابی (بنچمارک) هم اکنون به صورت متن باز در دسترس عموم قرار گرفته است.
🔗 برای ارزیابی مدل زبانی خود و دیگران کافی است
کلیک کنید.
🆔 @Partdpai