Вот и результаты Strawberry
🍓 на арену подъехали. И конечно же это новый лидер!
Похоже, o1 открывает свой новый тир, результаты (в среднем) на голову выше, чем у предшественников, улучшился перформанс даже на обычных не наукоёмких запрсах. А в хард-промптах и кодинге все остальные даже не близко (4o может немного).
Челам с подпиской повезло, им еще и лимиты недавно повысили. А вот стоит ли переплачивать в 30 раз (тк o1
тратит в ~6 раз больше токенов на запрос чем 4o) за API для обычного пользователя – пока непонятно.
А как вы планируете использовать новую модель на полную мощь?
@ai_newz