Пока вынашивал в голове пост, где рассказывал бы по шагам про
агентов —
Леша уже его написал, почитайте.
TLDR:
1. Люди прикинули, что если поставить GPT цель, то он неплохо справляется с ее декомпозицией на простые задачи.
2. Люди также прикинули, что если хранить в памяти результаты запросов к GPT, и подбирать для каждого следующего запроса нужную информацию из памяти → то получится обойти ограничения инпута (сейчас это 5k токенов/коротких английских слов)
3. В результате можно поставить задачу
агенту, он ее разобъет на подзадачи → начнет решать доступными средствами → будет сверять результат и задачу, продвигаясь все дальше.
4. В агентах нет ничего нового — это склейка нескольких существующих решений, в самом простом примере занимает 100 строчек кода. Они построены вокруг обычного GPT, который попросили писать себе списки задач → затем
думать как их решить используя доступные средства. Из текущих средств — браузер + поиск.
Мой опыт:
1. Все эксперименты достаточно примитивны. Я пока ничего практичного не видел, кроме задач на рисерч и структуризацию информации из интернета. Но я вижу большой потенциал в том, что будут расширяться количество интеграций. Сейчас уже появился модуль, что читать ленту в твиттере и писать туда. На реддите видел эксперименты по тому, чтобы дать агентам доступ ко всей операционной системе.
2. Если видите, что кому-то autogpt заработал миллионы, то это полный буллшит.
Предсказания:
1. Контейнеризация агентов,
aka “агент под задачу”. Например: агент-рисерчер соберет анализ сайтов конкурентов; агент-маркетолог опишет рекламную кампанию.
2. Расширение способов взаимодействия с миром для агентов. Сейчас это браузер, гугл и инструменты языковой модели. Дальше в руках агентов окажутся интеграции с большинством сервисов → расширится объем действий для достижения цели. Закрытые сервисы (Twitter) начнут еще сильнее душить свое API.
3. Агенты начнут вставать на место конкретных рекуррентных сценариев внутри компаний и делать со временем лучше людей.