Китайцы сделали 2 прорыва в ИИ-модели DeepSeek-R1
Как пишут сами авторы, их текущие
модели размером 7-70 млрд параметров даже близко не достигли своего максимума эффективности — и это без необходимости в новых данных для обучения.
"
Мы даже близко не достигли предела возможностей современных ИИ-моделей", -
говорится в статье.
Что особенно интересно:
1. Модель обучается полностью через RL без предварительной тренировки на примерах.
2.
В процессе обучения обнаружены эмерджентные свойства: модель сама научилась увеличивать время на "размышление" над сложными задачами и проводить самоанализ.
Этот подход напоминает AlphaZero от DeepMind, которая училась играть в го и шахматы "с нуля", без копирования человеческих стратегий.
И все это может получить любой человек, у кого есть смартфон/компьютер и интернет. Для этого нужно скачать приложение DeepSeek или открыть в браузере. И для этого всего не нужна подписка ежемесячная и VPN.
Экономические последствия таких достижений могут быть огромными:
1. Задачи, выполняемые через компьютер, становятся доступными для автоматизации.
2. ИИ показывает высокую эффективность не только в творческих задачах, но и в четком следовании инструкциям.
3. Открытость технологий DeepSeek делает эти возможности доступными для широкого круга разработчиков и компаний.
DeepSeek делает то, что изначально обещала OpenAI - создает действительно открытые, передовые технологии ИИ, доступные всему сообществу, при этом достигая впечатляющих результатов через инновационные подходы к обучению.
Такие модели с открытым исходным кодом, как R1 имеют большой потенциал влияния на экономику и рынок труда, а также на сам ИИ. Об этом мы писали
здесь.
Подробнее о новой модели DeepSeek R1 читайте в нашем предыдущем
посте