ChatGPT Voice отримав оновлення: голосовий режим тепер прямо в чаті та з картинками
- Голосовий режим ChatGPT тепер працює безпосередньо у вікні листування, а не в окремому повноекранному інтерфейсі.
- Під час розмови користувач бачить живий транскрипт діалогу та візуальні доповнення (карти, фотографії).
- Якщо новий формат не подобається, можна повернути старий інтерфейс “з бульбашкою” через налаштування.
- Оновлення робить голосову взаємодію більш інформативною, наближаючи її до мультимодального досвіду.
OpenAI кардинально змінює логіку роботи голосового режиму ChatGPT у вебверсії та мобільному застосунку. Замість переходу в окремий повноекранний режим з абстрактною анімацією, тепер розмова відбувається безпосередньо в стрічці чату. Це перетворює голос із “фічі для розваги” на повноцінний робочий інструмент.
Раніше, натиснувши на іконку навушників, ви потрапляли в ізольований інтерфейс із “пульсуючою бульбашкою”. Тепер, активувавши іконку звукової хвилі (waveform), ви залишаєтесь у звичному вікні діалогу.
Головні зміни:
- Живий транскрипт: Слова ШІ миттєво з’являються на екрані текстом. Це зручно, якщо ви пропустили частину фрази або хочете скопіювати інформацію.
- Візуальний контекст: Оскільки ви залишаєтесь у чаті, ChatGPT може підкріплювати свої слова візуальними матеріалами. Наприклад, якщо ви обговорюєте пекарні, модель може одразу показати карту з локаціями або фотографії випічки, не перериваючи голосову сесію.
OpenAI передбачила можливість відкату. Якщо новий формат “inline” вам незручний і ви віддаєте перевагу повному зануренню без тексту перед очима, стару версію можна повернути. Для цього потрібно зайти в налаштування, обрати розділ Voice Mode та увімкнути перемикач Separate mode (Окремий режим).
Цей крок є логічним продовженням мультимодальної стратегії OpenAI. Компанія намагається зробити так, щоб голос не був відокремленим способом введення, а працював у синергії з текстом та зображеннями. Це відповідь на дії конкурентів, зокрема Google, який активно розвиває Gemini Live, додаючи можливості аналізу відео та зображень у реальному часі.
Хоча оновлення ChatGPT поки не дозволяє малювати поверх відео, як це робить Gemini, воно робить голосові діалоги значно змістовнішими та кориснішими для вирішення прикладних завдань.
