10 главных фишек нового Gemini или сможет ли Google обойти Open AI?
Сейчас смотрю прямую трансляцию нового функционала Gemini. Ну вот, дожили. Gemini от Гугл реализовал мою мечту:)
Подробнее про мечту и ещё несколько зацепивших меня инсайтов:
1. Ура! Сбылась моя мечта:) Только представьте! В реальном времени ведущая показывает, как сняла кусочек видео, пытаясь разобраться в проигрывателе пластинок и параллельно задала вопрос голосом — и вуаля, получила исчерпывающий ответ, включая ответы из видео из Интернета (!).
Вот прямо от этом я мечтал, когда у меня посудомойка заглючила;););)
Все, будущее наступило:)
2. Интеграция с Gmail. Много всего, но зацепило вот что: находит в почте счета и строит сначала таблицу, а потом и графическую (точную!) визуализацию расходов! Вау, ещё не видел такого, вообще красивых встроенных графиков не видел ни у кого.
3. Создают синтетического «члена команды» (AI Teammate) в виде эккаунта Гугл. Дали должностную инструкцию, ааааааа! И он в рабочем пространстве начинает выполнять конкретные задачки в рабочих чатах:):):) Мониторить ход проекта, отвечать на конкретные вопросы и тп
Огромный потенциал, учитывая количество пользователей Gmail. Суперлегкая интеграция в уже работающие процессы как основная фича.
4. … и всего 90К зрителей при почти 12М подписчиков. Эх, обгоняет прогресс интерес к технологии, очень обгоняет.
Ну либо у Гугла репутация не про ИИ… в массовом сознании. Вот она, власть и инерция бренда.
Upd: количество зрителей упало до 77К… да, далеки ИИ-технологии от народа;)
5. Загружая и обрабатывая файлы в Gemini 1.5, я ещё пару месяцев назад понял, что победить миллион токенов контекста вообще трудно чем-то ещё. Это лучший результат на рынке. Сейчас они анонсируют 2 миллиона (аааааааа!).
6. Рассказали, как она строит графики по вашим данным, которые сама выгребает из кучи мусора ваших документов (посмотрите пункт 2 выше!). Она… сама пишет код на Питоне, чтобы визуализировать ваши данные. Ух…
7. Хах, они позиционируют Gemini как основу для работы… Android! Вот и несколько сотен миллионов устройств, где она сразу будет работать. Окно Gemini открывается НАД приложениями и можно сразу перетаскивать созданное… например, мгновенно созданный МЕМ под твой ответ другу (да, в Гемини будут картинки!). Плюс позже обещают работу ИИ «на устройстве!». То есть, без Интернета.
Еще раз. Ваш персональный ИИ на телефоне. Без интернета. Ух, аж страшно.
8. Презентующий открыл на телефоне огромный PDF с полными правилами сложной спортивной игры — и мгновенно получает точные и достоверные (!) ответы ТОЛЬКО по файлу + ссылки на конкретные фрагменты в качестве доказательства в окне НАД открытым pdf, и это на телефоне! Это совершенно потрясающая штука, которую мы часто используем в браузере, стала ещё удобнее на телефоне.
9. Перешли к саммари.
Мультимодальность
Длинный контекст
Агенты
— вот три кита Gemini от Гугл.
Мне нравится внятность посыла и четкость позиционирования. От себя добавлю — изначально огромная пользовательская база с возможностью мгновенной легкой интеграции ИИ с большой пользой. Ну и огромный объем доступных данных, конечно же. Сделал бы (небольшую, но всё же) ставку на Gemini на горизонте полугода против ChatGPT. Как говорится, запомните этот твит.
10. Ну и ложка дёгтя… большая часть ещё только ожидается. Но, учитывая их мощности и возможности, думаю, что долго ждать не придётся.
Ну вот, закончили! Всем спасибо:) пойду ужинать уже. Приятного аппетита тем, кто тоже собирается!