Запустили open-source модели на 7 и 32 миллиарда параметров
Сегодня мы выложили в открытый доступ две большие языковые модели на русском языке: T-Pro на 32 млрд параметров и обновленную T-Lite на 7 млрд параметров. Они построены на базе моделей Qwen 2.5 и дообучены на русский язык.
T-Pro заняла второе место по бенчмарку
MERA среди всех моделей, включая проприетарные, и первое место среди открытых. А T-Lite стала лучшей русскоязычной open-source моделью в классе «до 10 миллиардов параметров» по ряду индустриальных бенчмарков.
🎄Скачать модели можно с
huggingface.
🎄Больше подробностей и бенчмарки —
здесь.