OpenAI додала голосовий переклад і транскрипцію в реальному часі до API
- OpenAI випустила три голосові моделі для Realtime API: GPT-Realtime-2, GPT-Realtime-Translate та GPT-Realtime-Whisper.
- GPT-Realtime-2 побудована на міркуваннях класу GPT-5 і замінює GPT-Realtime-1.5.
- GPT-Realtime-Translate підтримує понад 70 вхідних і 13 вихідних мов для синхронного перекладу.
- GPT-Realtime-Whisper перетворює мовлення на текст у реальному часі під час розмови.
OpenAI додала до свого API нові функції голосового ШІ для розробників застосунків із можливостями розмови, транскрибування та перекладу.
- GPT-Realtime-2 — оновлена голосова модель для реалістичного діалогу з користувачами. На відміну від попередника GPT-Realtime-1.5, вона побудована на базі міркувань класу GPT-5 і призначена для обробки складніших запитів.
- GPT-Realtime-Translate забезпечує синхронний переклад у режимі розмови. Модель підтримує понад 70 вхідних мов і 13 вихідних.
- GPT-Realtime-Whisper надає функцію перетворення мовлення на текст у реальному часі під час розмови.
Усі три моделі доступні в рамках Realtime API OpenAI. GPT-Realtime-Translate та GPT-Realtime-Whisper тарифікуються за хвилину використання, GPT-Realtime-2 — за споживання токенів.
OpenAI зазначає, що нові інструменти орієнтовані на компанії у сферах обслуговування клієнтів, освіти, медіа, організації заходів і креативних платформ. Компанія також повідомила про вбудовані механізми захисту від спаму, шахрайства та інших зловживань — розмови можуть автоматично припинятися при виявленні порушень правил контенту.
