Новини

ChatGPT Voice отримав оновлення: голосовий режим тепер прямо в чаті та з картинками

⠀Поширити:

  • Голосовий режим ChatGPT тепер працює безпосередньо у вікні листування, а не в окремому повноекранному інтерфейсі.
  • Під час розмови користувач бачить живий транскрипт діалогу та візуальні доповнення (карти, фотографії).
  • Якщо новий формат не подобається, можна повернути старий інтерфейс “з бульбашкою” через налаштування.
  • Оновлення робить голосову взаємодію більш інформативною, наближаючи її до мультимодального досвіду.

OpenAI кардинально змінює логіку роботи голосового режиму ChatGPT у вебверсії та мобільному застосунку. Замість переходу в окремий повноекранний режим з абстрактною анімацією, тепер розмова відбувається безпосередньо в стрічці чату. Це перетворює голос із “фічі для розваги” на повноцінний робочий інструмент.

Раніше, натиснувши на іконку навушників, ви потрапляли в ізольований інтерфейс із “пульсуючою бульбашкою”. Тепер, активувавши іконку звукової хвилі (waveform), ви залишаєтесь у звичному вікні діалогу.

Головні зміни:

  • Живий транскрипт: Слова ШІ миттєво з’являються на екрані текстом. Це зручно, якщо ви пропустили частину фрази або хочете скопіювати інформацію.
  • Візуальний контекст: Оскільки ви залишаєтесь у чаті, ChatGPT може підкріплювати свої слова візуальними матеріалами. Наприклад, якщо ви обговорюєте пекарні, модель може одразу показати карту з локаціями або фотографії випічки, не перериваючи голосову сесію.

OpenAI передбачила можливість відкату. Якщо новий формат “inline” вам незручний і ви віддаєте перевагу повному зануренню без тексту перед очима, стару версію можна повернути. Для цього потрібно зайти в налаштування, обрати розділ Voice Mode та увімкнути перемикач Separate mode (Окремий режим).


Channel Tech в Telegram Актуальні новини та аналітика
Підписатися

Цей крок є логічним продовженням мультимодальної стратегії OpenAI. Компанія намагається зробити так, щоб голос не був відокремленим способом введення, а працював у синергії з текстом та зображеннями. Це відповідь на дії конкурентів, зокрема Google, який активно розвиває Gemini Live, додаючи можливості аналізу відео та зображень у реальному часі.

Хоча оновлення ChatGPT поки не дозволяє малювати поверх відео, як це робить Gemini, воно робить голосові діалоги значно змістовнішими та кориснішими для вирішення прикладних завдань.


Channel Tech в Google News Актуальні новини та аналітика
Читати


⠀Поширити:

Vitaliy Kairov

Засновник видання. Пишу про технології, гаджети та софт. Ціную об'єктивність, якісний звук та лаконічність.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *