ШІ

OpenAI додала голосовий переклад і транскрипцію в реальному часі до API

⠀Поширити:

  • OpenAI випустила три голосові моделі для Realtime API: GPT-Realtime-2, GPT-Realtime-Translate та GPT-Realtime-Whisper.
  • GPT-Realtime-2 побудована на міркуваннях класу GPT-5 і замінює GPT-Realtime-1.5.
  • GPT-Realtime-Translate підтримує понад 70 вхідних і 13 вихідних мов для синхронного перекладу.
  • GPT-Realtime-Whisper перетворює мовлення на текст у реальному часі під час розмови.

OpenAI додала до свого API нові функції голосового ШІ для розробників застосунків із можливостями розмови, транскрибування та перекладу.

  • GPT-Realtime-2 — оновлена голосова модель для реалістичного діалогу з користувачами. На відміну від попередника GPT-Realtime-1.5, вона побудована на базі міркувань класу GPT-5 і призначена для обробки складніших запитів.
  • GPT-Realtime-Translate забезпечує синхронний переклад у режимі розмови. Модель підтримує понад 70 вхідних мов і 13 вихідних.
  • GPT-Realtime-Whisper надає функцію перетворення мовлення на текст у реальному часі під час розмови.

Channel Tech в Telegram Актуальні новини та аналітика
Підписатися

Усі три моделі доступні в рамках Realtime API OpenAI. GPT-Realtime-Translate та GPT-Realtime-Whisper тарифікуються за хвилину використання, GPT-Realtime-2 — за споживання токенів.

OpenAI зазначає, що нові інструменти орієнтовані на компанії у сферах обслуговування клієнтів, освіти, медіа, організації заходів і креативних платформ. Компанія також повідомила про вбудовані механізми захисту від спаму, шахрайства та інших зловживань — розмови можуть автоматично припинятися при виявленні порушень правил контенту.


Channel Tech в Google News Актуальні новини та аналітика
Читати


⠀Поширити:

Vitaliy Kairov

Засновник видання. Пишу про технології, гаджети та софт. Ціную об'єктивність, якісний звук та лаконічність.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *