Павел Иевлев

Текст

Крупное обновление ChatGPT позволяет ИИ видеть, слышать и говорить

ChatGPT, одна из ведущих нейронных сетей, получит революционное обновление, которое позволит ей видеть, слышать и говорить. Это расширяет круг задач, которые может решать модель, например, починить велосипед, определив его модель и детали по фотографии, или выдать рецепт на основе фото имеющихся ингредиентов.

Благодаря внедрению новых голосовых и графических функций пользователи теперь могут взаимодействовать с ChatGPT на более интуитивном уровне, как с помощью голосового общения, так и путем демонстрации изображений непосредственно ИИ. Обновление использует Whisper, систему распознавания речи с открытым исходным кодом, для транскрипции произнесенных слов в текст, обеспечивая беспрепятственное взаимодействие «голос – текст».

Обновление обещает пользователям множество практических применений: от решения математических задач с помощью простой фотографии до создания креативных решений для остатков еды. Интеграция визуальных и слуховых функций представляет собой скачок в универсальности модели и вовлеченности пользователей, обеспечивая более полный и интерактивный опыт работы с искусственным интеллектом.

Как сообщается в официальном пресс-релизе, «мы начинаем внедрять в ChatGPT новые голосовые и графические функции. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяющий вести голосовой разговор или показывать ChatGPT, о чем вы говорите».

Что такое ChatGPT:

Читать на ЦО.РФ

ChatGPT: Языковая модель и текстовый ИИ  Что такое ChatGPT, для чего он нужен, куда развивается и что о себе думает

ChatGPT называют «прорывом, равным по значению появлению интернета», и о нем написано много статей. Однако мы решили спросить «Что такое ChatGPT?» у самого ChatGPT. Кто, как не он, имеет наилучший ответ о себе?

Использованные источники: