ChatGPT научился общаться голосом и распознавать изображения

OpenAI объявила о значительном обновлении ChatGPT, которое позволит моделям искусственного интеллекта GPT-3.5 и GPT-4 анализировать изображения и реагировать на них в рамках текстового разговора.

OpenAI, стартап в области искусственного интеллекта из Сан-Франциско, в понедельник выпустил версию своего популярного чат-бота, который может взаимодействовать с людьми с помощью устной речи. Как и в случае с Alexa от Amazon, Siri от Apple и другими цифровыми помощниками, пользователи могут разговаривать с ChatGPT, и он ответит им.

Нововведения

Компания заявляет, что после запуска данной функции пользователи смогут задействовать её, включив голосовое общение в настройках приложения, а затем выбрав один из пяти различных синтетических голосов с такими именами, как «Можжевельник», «Небо», «Бухта», «Эмбер» и «Бриз». OpenAI утверждает, что эти голоса были созданы в сотрудничестве с профессиональными актёрами озвучивания.

Впервые ChatGPT также может реагировать на изображения. Люди могут, например, загрузить фотографию внутренней части своего холодильника, а чат-бот может предоставить им список блюд, которые они могли бы приготовить из имеющихся у них ингредиентов. Также можно сфотографировать свой велосипед и спросить ChatGPT, как опустить сиденье. Затем чат-бот с искусственным интеллектом может порекомендовать правильные инструменты и инструкции, исходя из изображения руководства.

Доступность

Новые функции в ChatGPT будут доступны для подписчиков Plus и Enterprise в течение следующих двух недель. Отмечается, что синтез речи появится только на iOS и Android, а распознавание изображений будет доступно как в веб-интерфейсе, так и в мобильных приложениях.

Автор: Александр Лазарчук

Источник: mobidevices.com

Понравилась статья? Поддержите нас!
Читайте больше на эту тему:
Подпишись на наши новости!
Реклама
Реклама
Реклама