В октябре вышел
Technology Radar Volume 31.
Если ещё не вчитались, то рекомендую. А если вы впервые сталкиваетесь с этим фундаментальным трудом, то советую заглянуть в раздел
archive.
Хочу выделить Retrieval Augmented Generation (RAG) и то, что он перешел в категорию Adopt.
Некоторые базовые вводные о том, что это такое и как это работает можно узнать из
этой статьи.
Если коротко, то это про то, что мы программно подмешиваем к запросу пользователя контекст, по которому LLM должна искать ответ. А контекст мы достаем как раз благодаря RAG, деля наши знания на чанки и векторным поиском выбирая те, которые подходят под вопрос наилучшим образом. А LLM уже формирует итоговый ответ.
На нашем внутреннем AI Meetup'е ребята недавно рассказывали, как они с помощью RAG и LLM автоматизировали ответы в support каналах команд, в которые часто приходят сотрудники смежных команд и задают разные вопросы по их зоне ответственности.
Жду не дождусь, когда появятся AI ассистенты для сотрудников, которые помогают им решать свои вопросы внутри контекста, в котором они находятся.
#picture #link #thought