⚡️Шок контент с большим количеством восклицательных знаков
❗️
Вышла новая модель Sky-T1-32B-Preview, созданная на базе Qwen2.5-32B-Instruct!
Для ее обучения было потрачено всего 450 долл! При этом задействовано было всего лишь 8 видео карт NVIDIA H100!
По тестам эта модель по многим параметрам работает на уровне GPT-4o1-preview!
Это значит, что создание собственных моделей теперь доступно и для малого/ среднего бизнеса! Революционная история!
Кроме того, разработчики выложили все мануалы и код, с помощью которого можно выучить свою модель!
Блог команды
NovaSky
Тут можно посмотреть пример датасета, который использовался при обучении