Александр Пономарёв

Текст

На конференции Google I/O 2024 корпорация представила ИИ Gemini Live, который умеет вести голосовые диалоги, способен видеть окружение пользователя и реагировать на него

Gemini Live представляет собой симбиоз платформы машинного зрения Google Lens и виртуального помощника Google Assistant. В корпорации отмечают, что система использует новые методы генеративного ИИ, чтобы обеспечить более точный анализ изображений, сочетая их с улучшенным речевым движком для более реалистичного диалога.

Используемые в Gemini Live технологии связаны с Project Astra — концепцией DeepMind по созданию приложений и агентов на базе ИИ с поддержкой понимания нескольких источников данных в реальном времени — текста и мультимедиа. Gemini Live сможет отвечать на вопросы о предметах и обстановке в поле зрения камеры смартфона — причем не только в реальном времени, но и вспомнить о том, что было раньше.

Способность запоминать стала возможной благодаря архитектуре модели в основе ИИ — Gemini 1.5 Pro. У нее весьма емкое контекстное окно, поэтому она может обрабатывать большое количество данных, прежде чем подготовить ответ. Gemini Live может стать полноценным виртуальным ассистентом — давать полезные советы, придумывать идеи и так далее.

Бесплатным ИИ от Google не будет — после запуска в конце года Live станет эксклюзивом для Gemini Advanced, более сложной версии Gemini, которая доступна подписчикам плана Google One AI Premium за 20 долларов в месяц.

Здесь мы рассказываем об аналогах знаменитого ChatGPT от OpenAI:

Читать на ЦО.РФ

Chat GPT: 6 аналогов не хуже оригинала  Чем заменить знаменитый «чат джипити»?

Языковая модель GPT-4 от компании OpenAI практически захватила мир, став новым стандартом во многих областях, но есть и другие решения чат-ботов, которые, возможно, подойдут вам даже лучше

Использованные источники: Google