Runner H - специализированная 3B модель для веб-автоматизации. В отличие от
Claude Computer Use, это не просто API для браузера, а полноценный визуальный агент, который как будто бы реально понимает что происходит на экране и умеет с этим работать. Ребята подняли $200M на сид-раунде и сразу выкатили интересный продукт.
Модель показывает интересные результаты -
67% успеха на бенчмарке WebVoyager (для сравнения - у Anthropic всего 52%, у Emergence - 61%). При этом она использует в 10 раз меньше параметров чем конкуренты. Runner H работает со скриншотами страниц, понимает контекст интерфейса и может точно определить координаты для клика мышкой по нужному элементу. А ещё она умеет самовосстанавливаться при изменении интерфейса.
Runner H ищет научные статьи на
arxiv.org, находит автобусные остановки в Google Maps, получает спортивную статистику с ESPN и даже решает сложные математические задачи через Wolfram Alpha. Всё это просто по текстовым командам на естественном языке. Обратите внимание на пример сложного поиска по рецептам - агент не только находит рецепт, но и анализирует отзывы и рейтинги.
Studio - часть проекта, - платформа для создания автоматизаций. Нужно только описать сложный процесс вроде покупки в интернет-магазине или заполнения документов, а Runner H сам разберётся как это сделать. В будущем обещают добавить возможности для обучения агента специфическим задачам и создать комьюнити разработчиков.
Открыт
вейтлист на закрытую бету, и я, конечно же, записался!
Сергей Булаев AI 🤖 - об AI и не только