LLM, которая способна «рассуждать» — o1 от OpenAI
OpenAI
представил первую в серии «рассуждающих» AI-моделей. o1 выстраивает «цепочку размышлений» при обработке запросов — так же, как человек постепенно подходит к задачам. Вместе с ней выпустили облегченную o1-mini для генерации кода.
o1 рассуждает как человек
Модели
дали задачу решить головоломку. Она размышляла 30 сек., описывая все шаги рассуждений.
o1 способна улучшать свой мыслительный процесс, пробовать различные стратегии и признавать свои ошибки. Если GPT-4o решила 13% задач отборочного экзамена Международной математической олимпиады, то «рассуждающая» модель — 83%.
Кардинально иной подход в обучении — но деталей не раскрыли
Как
рассказал руководитель исследований OpenAI Джерри Творек, модель обучили с помощью совершенно нового алгоритма оптимизации и набора данных. Его разработали специально под o1. Разработчики также применяли обучение с подкреплением (модель дообучается в процессе работы после первичного обучения)
Совсем не повседневный помощник
o1 медленнее и дороже предыдущих GPT, она предназначена именно для решения многоэтапных задач в науке, математике, программировании. Для разработчиков o1
стоит в 3-4 раза дороже, чем GPT-4o.
Open AI заявляет, что о1 вышла на 2й из 5 уровней AGI.