Исследование OpenAI: больше времени на размышление делает AI более устойчивым к манипуляциямНовое исследование OpenAI показывает, что модели AI становятся более устойчивыми к попыткам манипуляции, если им дать больше времени на «подумать». Исследователи также обнаружили новые методы атак.
Недавнее исследование OpenAI показывает, что предоставление моделям AI большего времени для обработки информации позволяет им лучше противостоять попыткам манипуляции.
Тестируя свои модели o1-preview и o1-mini, исследователи обнаружили как обнадеживающие результаты, так и некоторые неожиданные уязвимости.
1️⃣ DevHub