В недавнем
исследовании про таргетированный AI-фишинг авторы собирали информацию в интернете о человеке, с помощью GPT-4o и Claude 3.5 Sonnet составляли его профиль, на основе которого генерировали персонализированные фишинговые сообщения. Что интересно, в 88% случаев профили оказывались точными и полезными, а click-rate на ссылки в автоматически сгенерированных письмах составил 54%. Это значение совпало с click-rate для писем, написанных человеком-экспертом. В аналогичных же исследованиях прошлого года, чтобы достичь уровня экспертов, моделям требовалось участие человека.
Результаты лишний раз подчеркивают необходимость создания и улучшения детекторов сгенерированного контента.
LLM модели совершенствуют свои «обманные способности», а мы продолжаем совершенствовать нашу модель детектирования для русскоязычных текстов
GigaCheck. Обновленная версия уже доступна в нашем
Telegram-боте. Кроме того, мы добавили нашу новую модель (находится на стадии бета-тестирования), которая умеет определять в co-written текстах фрагменты текста, созданные LLM. Вы можете легко переключать модели через команду
/model
.
Напомним, что используемый нами подход для детекции интервалов основан на архитектуре DN-DAB-DETR, подробнее можно почитать в опубликованной нами
статье, про которую мы писали в
этом посте.
Заходите в
бот, тестируйте, и не дайте злоумышленникам вас обмануть!
😊