Расширенный голосовой режим ChatGPT: что вам нужно знать

47

ChatGPT уже поддерживает голосовой режим, который позволяет пользователям взаимодействовать с ИИ с помощью голосовых команд. Однако это стандартный голосовой режим с ограниченными возможностями. Теперь OpenAI выпускает долгожданный расширенный голосовой режим с улучшенным тоном, новым пользовательским интерфейсом, большим количеством голосов и дополнительными функциями. Вот все, что вам нужно знать о расширенном голосовом режиме в ChatGPT, чем он отличается от стандартного голосового режима, какие функции он предоставляет и его ограничения.

Что такое расширенный голосовой режим?

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Стандартный голосовой режим транскрибирует вашу речь в текст, выдает результат, а затем преобразует текст обратно в речь. Напротив, расширенный голосовой режим основан на собственных аудиовозможностях GPT-4o, то есть он напрямую обрабатывает сам звук. Таким образом, стандартный голосовой режим не является по-настоящему мультимодальным в своих возможностях ИИ, как расширенный голосовой режим.

В результате расширенный голосовой режим может звучать более естественно по тону, понимать акценты и даже улавливать вербальные сигналы, такие как скорость речи, и реагировать с эмоциями. Хотя не все эти функции в настоящее время доступны, расширенный голосовой режим по-прежнему предлагает гораздо лучшие возможности понимания и реагирования, чем стандартный голосовой режим.

Чем расширенный голосовой режим отличается от стандартного голосового режима

В настоящее время расширенный голосовой режим доступен для пользователей Plus (ChatGPT Plus предлагает несколько дополнительных функций) и Team. Однако он пока недоступен в ЕС, Великобритании, Швейцарии, Исландии, Норвегии и Лихтенштейне. Кроме того, на данный момент вы можете получить к нему доступ только из приложения ChatGPT для iPhone и Android версии 1.2024.261 или более поздней. При этом ниже перечислены все возможности и функции, которые предлагает расширенный голосовой режим помимо стандартного голосового режима.

1. Новый пользовательский интерфейс для расширенного голосового режима

Первое, что вы заметите при переключении в расширенный голосовой режим, — это обновленный интерфейс. Вместо старых черных точек вы увидите динамическую синюю сферу, которая пульсирует по мере течения разговора. Небольшое изменение, которое помогает определить, используете ли вы расширенный голосовой режим или стандартный.

2. Улучшенные акценты и тон

Расширенный голосовой режим теперь обрабатывает акценты гораздо лучше, чем раньше, и поддерживает несколько других языков, помимо английского. Но это больше, чем просто понимание слов — он регулирует тон и просодию, чтобы давать ответы, которые кажутся естественными и человечными. Способность ИИ модулировать свой тон и подчеркивать ключевые фразы означает, что вы можете вести более плавные и увлекательные разговоры, независимо от вашего акцента.

Расширенная голосовая связь станет доступна всем пользователям Plus и Team в приложении ChatGPT в течение недели.

Пока вы терпеливо ждали, мы добавили пользовательские инструкции, память, пять новых голосов и улучшенные акценты.

Он также может сказать «Извините за опоздание» на более чем 50 языках. pic.twitter.com/APOqqhXtDg

— OpenAI (@OpenAI) 24 сентября 2024 г.

3. Поддержка прерывания

Одной из самых захватывающих функций является поддержка прерывания в реальном времени. Как и в обычном разговоре, вы можете прерваться на середине предложения, не дожидаясь, пока ChatGPT закончит свой ответ. Это делает обсуждения с ИИ более плавными и похожими на человеческие, особенно во время длинных ответов. Возможность прерывания — одна из функций, которая мне понравилась в Gemini Live больше, чем в ChatGPT, но теперь с расширенным голосовым режимом она доступна и в ChatGPT.

4. Новые голоса

OpenAI представила пять новых голосов: Arbor, Maple, Sol, Spruce и Vale, доведя общее число до девяти. Вот как OpenAI описывает свои голоса:

  • Arbor – легкий и универсальный
  • Бриз – Оживленный и серьезный
  • Cove – Сдержанный и прямой
  • Эмбер – Уверенный и оптимистичный
  • Можжевельник – Открытый и оптимистичный
  • Клен – Веселый и искренний
  • Сол – Разумный и расслабленный
  • Ель – Спокойствие и утверждение
  • Вейл – Яркий и любознательный

Чтобы изменить голос, откройте ChatGPT, перейдите в «Настройки» > «Голос» и выберите тот, который вам больше нравится.

5. Фоновое воспроизведение

Вот еще одна новая функция. Расширенный голосовой режим теперь поддерживает фоновое воспроизведение, позволяя вам продолжать разговоры, используя другие приложения на вашем телефоне или даже когда телефон заблокирован. Это полезно, если вы хотите открыть веб-страницу для исследования или использовать приложение заметок, чтобы записывать мысли во время разговора с ИИ. Чтобы включить фоновое воспроизведение, откройте ChatGPT > Настройки и включите переключатель для Фоновые разговоры.

6. Индивидуальные инструкции и память в голосовых разговорах

Ваши чаты с ChatGPT можно персонализировать с помощью пользовательских инструкций и функций памяти. Они позволяют вам указать, как ChatGPT должен отвечать, какой тон он должен использовать и что он должен помнить о вас. Хотя они не работают со стандартным голосовым режимом, расширенный голосовой режим полностью поддерживает пользовательские инструкции и память. Чтобы настроить их, откройте ЧатGPT приложение, перейти к Настройки > Персонализацияи настройте свои предпочтения.

7. Контролируйте данные своих голосовых записей

OpenAI выдвинул конфиденциальность пользователей на передний план в этом обновлении. Теперь у вас больше контроля над вашими голосовыми записями и вы можете удалять аудиозаписи ваших разговоров. Вы также можете выбрать, следует ли использовать ваши аудиозаписи для обучения ChatGPT. Чтобы удалить голосовую запись, просто удалите разговор, сделанный в голосовом режиме, и связанный с ним звук будет удален автоматически.

Как долго вы можете общаться в расширенном голосовом режиме?

Существует дневной лимит на то, как долго вы можете использовать расширенный голосовой режим, хотя OpenAI не предоставила конкретных подробностей. Когда у вас останется всего 15 минут до конца дня, вы получите уведомление. Как только вы достигнете дневного лимита, вы будете переключены обратно в стандартный голосовой режим. Стандартный голосовой режим также имеет дневной лимит, привязанный к вашему лимиту сообщений в день. Как только ваш дневной лимит в 40 сообщений будет достигнут, вы больше не сможете использовать стандартный голосовой режим.

Можно ли вести расширенные голосовые разговоры с помощью GPT?

Нет, вы не можете вести расширенные голосовые разговоры с GPT, независимо от того, создали ли вы их или используете те, что из GPTStore. При нажатии на значок голоса в GPT откроется стандартный голосовой режим вместо расширенного. Вы можете заметить разницу, поскольку стандартный голосовой режим использует черно-белый пузырьковый пользовательский интерфейс, тогда как расширенный режим использует новый синий анимированный пользовательский интерфейс.

Расширенный голосовой режим против стандартного голосового режима

Расширенный голосовой режим OpenAI — это значительный шаг вперед в том, чтобы сделать разговоры с ИИ более естественными и удобными для пользователя. Будь то возможность прерывания, диапазон голосовых опций или контроль над вашими данными, это обновление предлагает более персонализированный, похожий на человеческий опыт. Если вы являетесь пользователем ChatGPT Plus или Enterprise, стоит попробовать эту функцию, чтобы увидеть, как она может улучшить ваше взаимодействие.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *