Новини

ChatGPT Voice отримав оновлення: голосовий режим тепер прямо в чаті та з картинками

⠀Поширити:

  • Голосовий режим ChatGPT тепер працює безпосередньо у вікні листування, а не в окремому повноекранному інтерфейсі.
  • Під час розмови користувач бачить живий транскрипт діалогу та візуальні доповнення (карти, фотографії).
  • Якщо новий формат не подобається, можна повернути старий інтерфейс “з бульбашкою” через налаштування.
  • Оновлення робить голосову взаємодію більш інформативною, наближаючи її до мультимодального досвіду.

OpenAI кардинально змінює логіку роботи голосового режиму ChatGPT у вебверсії та мобільному застосунку. Замість переходу в окремий повноекранний режим з абстрактною анімацією, тепер розмова відбувається безпосередньо в стрічці чату. Це перетворює голос із “фічі для розваги” на повноцінний робочий інструмент.

Раніше, натиснувши на іконку навушників, ви потрапляли в ізольований інтерфейс із “пульсуючою бульбашкою”. Тепер, активувавши іконку звукової хвилі (waveform), ви залишаєтесь у звичному вікні діалогу.

Головні зміни:

  • Живий транскрипт: Слова ШІ миттєво з’являються на екрані текстом. Це зручно, якщо ви пропустили частину фрази або хочете скопіювати інформацію.
  • Візуальний контекст: Оскільки ви залишаєтесь у чаті, ChatGPT може підкріплювати свої слова візуальними матеріалами. Наприклад, якщо ви обговорюєте пекарні, модель може одразу показати карту з локаціями або фотографії випічки, не перериваючи голосову сесію.

OpenAI передбачила можливість відкату. Якщо новий формат “inline” вам незручний і ви віддаєте перевагу повному зануренню без тексту перед очима, стару версію можна повернути. Для цього потрібно зайти в налаштування, обрати розділ Voice Mode та увімкнути перемикач Separate mode (Окремий режим).



Цей крок є логічним продовженням мультимодальної стратегії OpenAI. Компанія намагається зробити так, щоб голос не був відокремленим способом введення, а працював у синергії з текстом та зображеннями. Це відповідь на дії конкурентів, зокрема Google, який активно розвиває Gemini Live, додаючи можливості аналізу відео та зображень у реальному часі.

Хоча оновлення ChatGPT поки не дозволяє малювати поверх відео, як це робить Gemini, воно робить голосові діалоги значно змістовнішими та кориснішими для вирішення прикладних завдань.


Google News
Channel Tech в Google News Актуальні новини та аналітика
Читати


⠀Поширити:

Vitaliy Kairov

Засновник видання. Пишу про технології, гаджети та софт. Ціную об'єктивність, якісний звук та лаконічність.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *