Gemini Live против ChatGPT 4o Режим голосового чата: наш опыт

42

OpenAI представила ChatGPT 4.0 еще в мае с режимом голосового вызова. В отличие от существующих голосовых помощников, таких как Google Assistant, Alexa и Siri, он может лучше понимать контекст, участвовать в большем количестве двусторонних бесед и общаться более человеческим тоном. Это почти похоже на то, как будто вы разговариваете по телефону с ИИ, а не просто вызываете помощника ИИ для помощи.

Чтобы противостоять этому, Google представила Gemini Live в событии Pixel 9, которое очень похоже на голосовую модель ChatGPT 4.0. Я использовал Gemini Live больше недели, и вот мой опыт того, как они справляются.

Доступ и доступность

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Доступ к ChatGPT 4.0 Voice и Gemini Live можно получить через соответствующие приложения. Однако ChatGPT выделяется тем, что он доступен на более широком спектре платформ, включая Android, iOS и даже Mac (извините, Windows). Напротив, Gemini Live в настоящее время ограничен некоторыми устройствами Android, такими как телефоны Pixel и Samsung. Хотя ожидается, что со временем ситуация улучшится, на момент написания этого сравнения доступность Gemini Live остается ограниченной. Важно отметить, что обе службы доступны только подписчикам ChatGPT Pro или Gemini Advanced соответственно.

Первые впечатления

На первый взгляд Gemini Live выглядит более привлекательно, чем более простой интерфейс ChatGPT. Первый имеет анимированные градиентные огни на заднем плане, в то время как ChatGPT отображает простое белое пятно в центре экрана. Однако это белое пятно не просто статично — оно анимируется, когда ChatGPT говорит, и включает в себя визуализатор микрофона, который движется, когда вы говорите, указывая, что ChatGPT слушает. Таким образом, хотя Gemini может выглядеть лучше, ChatGPT предлагает более функциональную обратную связь через свой интерфейс. Оба сервиса позволяют вам приостанавливать или завершать голосовой чат в любое время. Хотя мы обнаружили, что оба сервиса похожи, когда дело касается тона или их разговорных возможностей, у них также есть свои уникальные особенности.

Преимущество голосового режима ChatGPT

Модели ИИ обычно отвечают сразу после того, как вы перестаете говорить. Время отклика быстрое и одинаковое на обеих платформах. Однако бывают моменты, когда вы можете сделать паузу, чтобы собраться с мыслями или вспомнить детали. В то время как человек распознает паузу и будет ждать, пока вы продолжите, эти модели ИИ часто этого не делают — они могут начать отвечать, услышав только часть вашего предложения.

Чтобы решить эту проблему, ChatGPT предлагает функцию ручного удержания. Удерживая палец в любом месте экрана, вы можете активировать режим удержания, который гарантирует, что ИИ прослушает все ваше предложение. Это позволяет вам не торопиться и делать паузы по мере необходимости. ChatGPT ответит только после того, как вы отпустите удержание. К сожалению, в Gemini этой функции нет, поэтому, когда мне нужно подумать на середине предложения, я обнаруживаю, что заполняю пробелы фразами-паразитами, такими как «что-то вроде этого» или «ты знаешь, что я имею в виду» и т. д.

Преимущество Gemini Live

С другой стороны, Gemini может работать в фоновом режиме, что является преимуществом. Это означает, что вы можете закрыть приложение Gemini и продолжать разговор, используя другие приложения на вашем телефоне. Многозадачность.

Например, на днях я проверял рецепт в интернете и мне нужно было развеять несколько сомнений по поводу недостающих ингредиентов. Я мог держать Gemini работающим в фоновом режиме, пока проверял рецепт. Всякий раз, когда у меня возникал вопрос, я просто спрашивал, и он отвечал в фоновом режиме. Это как будто моя мама разговаривает по телефону в фоновом режиме.

Другое преимущество Gemini в том, что он прекращает говорить, как только вы начинаете говорить. Хотя OpenAI объявила, что ChatGPT в конечном итоге получит эту функцию, она пока недоступна для публики. В настоящее время ChatGPT останавливается только при нажатии на экран. Однако Gemini также требуется некоторое время, чтобы распознать, что вы говорите, поэтому он может не остановиться немедленно. Несмотря на это, вам не придется повторяться — Gemini все равно может уловить ваши слова, даже когда отвечает.

Реальные примеры, подчеркивающие различия

За исключением нескольких функций и различий в пользовательском интерфейсе, оба сервиса на первый взгляд могут показаться похожими. Однако все начинает отличаться, когда дело доходит до понимания контекста, возможности вести беседы, языковой поддержки, точности информации и многого другого. Давайте рассмотрим эти различия на реальных примерах.

1. Мозговой штурм идей для истории

У меня есть привычка писать короткие истории ради развлечения. С момента запуска голосового режима ChatGPT я использую его для мозгового штурма идей. На прошлой неделе я пробовал Gemini Live. Для меня в этом аспекте есть явный победитель — ChatGPT.

При мозговом штурме с обратными разговорами я часто начинаю с определенной идеи, но меняю темп по мере развития обсуждения. ChatGPT постоянно поддерживает разговор и хорошо адаптируется к изменениям в контексте и теме. Однако с Gemini, когда я изначально предлагаю идею, а затем переключаюсь на что-то другое, он постоянно возвращается к первоначальной идее. Я обнаружил, что мне приходится повторять несколько раз, что я изменил свое мнение и что это новое направление, в котором я хочу двигаться. Эта проблема не ограничивается написанием историй; она случается и в других различных разговорах. Хотя оба голосовых бота могут понимать контекст, Gemini часто путается и с трудом удерживает ход разговора.

2. Перевод между языками

Мой родной язык — телугу, а мои друзья говорят на хинди, поэтому мы решили попробовать этих голосовых ботов в качестве переводчиков. Хотя ChatGPT справился с этой задачей довольно хорошо, Gemini оказался полным провалом. Хотя Gemini может отвечать на нескольких языках, включая те, которые нам нужны, он с трудом понимает что-либо, сказанное на языках, отличных от английского. Ваш опыт может отличаться в зависимости от используемого вами языка, но в нашем случае, поскольку Gemini не смог уловить языки, которые мы знаем, явным победителем является ChatGPT. Однако по сравнению с режимом разговора Google Translate даже ChatGPT еще предстоит долгий путь. Даже на бумаге Gemini поддерживает только 40 языков на данный момент, тогда как ChatGPT поддерживает примерно до 85 языков.

3. Изучение темы

По нашему опыту, и ChatGPT, и Gemini склонны к галлюцинациям, и ни один из них не является абсолютно точным. Это касается и их голосовых режимов. Однако, когда дело доходит до предоставления последней информации, Gemini имеет преимущество, так как он постоянно ищет ответы в Интернете. В отличие от этого, ChatGPT полагается на свою внутреннюю базу данных и проверяет веб-страницы в Интернете только при необходимости. В результате он иногда предоставляет устаревшую или совершенно неверную информацию. Например, когда я спросил Gemini и ChatGPT о характеристиках Pixel 9, Gemini предоставил точные данные, в то время как ChatGPT ошибочно поделился характеристиками Pixel 8.

Вы можете решить эту проблему, специально попросив ChatGPT проверить онлайн перед ответом. Когда я попробовал это сделать, он вернулся со спецификацией Pixel 9. Однако при повседневном использовании вероятность получения неверной информации от ChatGPT выше, чем от Gemini.

Тем не менее, обе модели ИИ эффективны в передаче информации, будь то с помощью примеров, аналогий или упрощения для 9-летнего ребенка. У каждой свой стиль, и мы обнаружили, что обе они довольно симпатичны. В целом, я предпочитаю полагаться на Gemini больше, чем на ChatGPT, особенно когда узнаю что-то новое или когда есть свежие обновления информации, которую я ищу.

Так что же лучше — голосовой режим ChatGPT или Gemini Live?

В целом, ChatGPT в настоящее время является лучшим голосовым помощником, чем Gemini Live. Его пользовательский интерфейс более функционален, он генерирует ответы немного быстрее и немного лучше справляется с поддержанием разговора. Однако Gemini Live является новым и имеет свои преимущества, такие как способность работать в фоновом режиме и предоставлять точную информацию из Интернета большую часть времени. Хотя ChatGPT может быть лучше на данный момент, разница незначительна, поэтому вы можете выбрать любой из них, основываясь на цене и преимуществах, которые предлагает каждый из них.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *