Google выпустил базовый документ, посвященный AI-агентам Под агентами в нём понимаются программы, которые расширяют возможности генеративных AI-моделей, позволяя им использовать инструменты для доступа к актуальной информации и выполнения действий во внешнем мире. Агент может включать одну или несколько языковых моделей, которые принимают решения о том, как реагировать на запросы пользователей и управлять своими действиями, опираясь на данные, полученные от внешних инструментов.
Ключевыми аспектами агентного подхода являются:
1.
Автономность: агенты способны действовать независимо, часто без прямого вмешательства человека, особенно если они снабжены четкими целями или задачами.
2.
Целеполагание: агенты имеют конкретные цели, которых они стремятся достичь, используя свои встроенные инструменты и возможность вести рассуждения.
3.
Рассуждение и планирование: агенты используют различные методы рассуждений для анализа ситуации и планирования своих дальнейших шагов.
4.
Доступ к инструментам: агенты оснащены инструментами, которые позволяют им взаимодействовать с внешним миром, включая выполнение API-запросов, работу с данными и другие операции, которые модель не могла бы выполнить самостоятельно.
То есть, агенты представляют собой мощное сочетание модели, методов рассуждений и инструментов, которое позволяет действовать более эффективно и гибко в реальных условиях.
Ключевым способом реализации агентов разработчики видят схему «когнитивных архитектур». Её ключевые моменты:
1.
Агенты расширяют возможности языковых моделей, используя инструменты для доступа к актуальной информации и выполнения сложных задач автономно. В своей работе они могут использовать одну или несколько LLM для принятия решений о том, как перейти через состояния и использовать внешние инструменты для решения различных задач, которые было бы сложно или невозможно решить с помощью одной модели.
2.
Основой работы агента является слой оркестрации — когнитивная архитектура, которая структурирует процессы рассуждения, планирования, принятия решений и направляет действия агента. Различные методы рассуждений, такие как ReAct, Chain-of-Thought и Tree-of-Thoughts, предоставляют структуру для слоя оркестрации, который собирает информацию, обрабатывает ее, генерирует ответы или стимулирует действия.
3.
Инструменты — расширения, функции и хранилища данных — служат «ключами» к внешнему миру для агентов, позволяя им взаимодействовать с внешними системами и получать доступ к знаниям за пределами обучающих данных. Расширения соединяют агентов с внешними API для получения актуальной информации. Функции дают разработчикам более детальный контроль над потоком данных и выполнением операций. Хранилища данных открывают доступ к структурированным или неструктурированным данным, поддерживая приложения, основанные на извлечении знаний.
Ожидается, что в будущем агенты покажут значительные достижения благодаря усовершенствованию инструментов и возможностей вести рассуждения. Это позволит им решать все более сложные задачи.
Кроме того, стратегический подход «цепочки агентов», объединяющий специализированных агентов для конкретных задач, будет способствовать созданию комплексных систем, работающих наподобие конвейера, каждое звено которого выполняет свою функцию.
#news #AI #бигтехи #политика https://www.kaggle.com/whitepaper-agents