Архитектуры, вдохновленные нейронауками, для AI Safety
Сотни миллиардов в AGi, опенсорсный deepseek и агенты с доступом к командной строке. А ещё помните, учёные
обнаружили, что между биологическим мозгом и нейросетками больше сходств, чем мы думали. Похожие архитектуры, механизмы передачи информации и даже структуры обработки данных. Тревожники типа меня (Ginger) дуреют, конечно... И бесспорно, эта волна несёт тонны возможностей. Перед тем, как накрыло, неплохо бы черпнуть мудрости у природы - на этот раз для повышения надежности и безопасности ИИ.
Человеческий мозг может показаться не самой лучшей моделью для разработки безопасных систем ИИ: мы развязываем войны, вредим планете, имеем когнитивные искажения, застреваем в эмоциональных травмах. Однако у него есть свойства, которые все же стоит перенять для безопасности ИИ. Мозг миллионы лет эволюционировал, чтобы функционировать в сложной и непредсказуемой среде для успеха нашего биологического вида. Пока справляется.
Команда
NeuroAI Safety уверена, что пока это лучший эталон, что у нас есть, и разработала дорожную карту на 88 страниц, в которой изложила, куда стоит направить совместные усилия:
1. Реверс-инжиниринг сенсорных систем
Мозг превосходит нейросети в обработке сенсорных сигналов: зрение, слух и тактильные ощущения. За обработку информации отвечает масса специализированных модулей (сенсорные коры, гиппокамп и тд).
В рамках этого
проекта исследуются способы декодирования представлений, используемых мозгом для обработки сложных данных и извлечения ключевых сигналов из шума.
2. Создание цифровых близнецов с телесной моделью
Человеческий интеллект не существует в вакууме, он зависит от тела и его взаимодействия с миром. Этот
проект направлен на создание цифровых двойников, которые могут “чувствовать” и “действовать”, интегрируя сенсорно-моторные данные, подобно мозгу. Это улучшит понимание того, как обучать системы ИИ через взаимодействие с физическим или симулированным окружением.
3. Создание биофизически достоверных моделей мозга.
Современные ИИ-архитектуры сильно упрощают реальный мозг. Этот
проект предлагает строить модели, учитывающие биофизические параметры (динамику ионных каналов, нейронные связи). Эти модели помогут выявить, как биологические ограничения и структуры мозга повышают его устойчивость.
4.
Разработка когнитивных архитектур следующего поколения
Когнитивные процессы человека сложны и плохо изучены: память, внимание, адаптивное поведение, обучение на ошибках. Задача этого
проекта использовать аналоги типа дофаминовой регуляции для обучения ИИ “мыслить на перспективу” и избегать решений с долгосрочными негативными последствиями.
5. Использование данных мозга для дообучения ИИ
Команда NeuroAI Safety
исследует, как записи нейронной активности человека могут улучшить дообучение ИИ, помогая моделям улавливать ключевые паттерны или игнорировать нерелевантную информацию.
6. Реконструкция функции потерь мозга
В машинном обучении модели оптимизируют функцию потерь, но что делает мозг? Мы знаем, что человеческий мозг невероятно эффективен в предсказании действий других для социальной координации. Этот
проект изучает “функцию потерь” мозга (например, цели обучения), чтобы ИИ тоже безопасно взаимодействовал с людьми.
7.
Использование методов нейронаук для интерпретации ИИ
Как интерпретировать решения ИИ? Мозг использует методы “вычитки” информации (например, через когнитивные карты). Этот
проект изучает, как механизмы из нейронаук могут помочь объяснять внутренние процессы в нейронных сетях.
Методы
Команда делает акцент на междисциплинарности: используются данные ЭЭГ, fMRI, биофизическое моделирование, реверс-инжиниринг и анализ когнитивных процессов.
Следующие шаги: к чему готовиться?
Фокус (в т.ч инвесторов) может сдвинуться в сторону скоординированных, масштабных усилий по развитию нейротехнологий на стыке разработки ИИ, безопасности ИИ, и нейронаук.
Так что, если вы не верили
Лекуну в 2022, можно уже начинать.
Док:
NeuroAI Safety или
arxiv
На фото: смотровая площадка, серфер Гаретт Макнамару впервые покоряет 24-метрового пайп монстра в Назаре