Так, мне нужен AI агент с доступом к десктопу.
Заполнял отчет BOIR для компании в U.S. Department of the Treasury (как обычно дотянул до последнего дня отчета кек).
Приходилось скрины копипастить в ChatGPT а и следовать инструкциям.
Хочется чтобы оно могло
- анализировать что на экране сейчас
- помнить чт было (например я показал данные моей компании и мои паспортные)
- говорить "нажми сюда и введи ХХХ" (пока полностью ввод я не доверю)
Но даже сейчас конечно всяко лучше чем пытаться понять что там надо самому с гуглом.