DeepL запустив голосовий переклад у реальному часі для Zoom і Teams
- DeepL випустив інструменти голосового перекладу в реальному часі для відеоконференцій, мобільних розмов і групових сесій.
- Плагіни для Zoom і Microsoft Teams доступні в рамках програми раннього доступу за заявками.
- Система підтримує кастомну лексику: галузеві терміни, назви компаній і імена.
- Відкрито API для розробників — зокрема для інтеграції у кол-центри та кастомні застосунки.
DeepL, відомий своїми інструментами для перекладу тексту, випустив набір продуктів для голосового перекладу в реальному часі. Нові рішення охоплюють кілька сценаріїв: переклад у відеоконференціях, мобільні та веброзмови, а також групові бесіди для польових працівників через кастомні застосунки. Одночасно компанія відкрила API для зовнішніх розробників і бізнесів — зокрема для впровадження у кол-центрах. Про це пише TechCrunch.
Поточна система перетворює мовлення на текст, застосовує переклад, а потім конвертує текст назад у мовлення. Компанія зазначає, що завдяки багаторічному досвіду в текстовому перекладі має перевагу в якості результатів. Надалі DeepL планує розробити наскрізну голосову модель без проміжного кроку з текстом. Ключовою технічною проблемою при цьому є баланс між зниженням затримки та точністю перекладу.
DeepL випускає плагіни для Zoom і Microsoft Teams: слухачі можуть отримувати переклад у реальному часі або читати його як субтитри на екрані. Ця функція поки доступна за заявками в рамках програми раннього доступу. Також доступний продукт для групових бесід — учасники приєднуються через QR-код. Система підтримує навчання на кастомній лексиці: галузевій термінології, назвах компаній і іменах.
Серед конкурентів DeepL у цьому сегменті — стартап Sanas, який у реальному часі змінює акцент мовця; Camb.AI, що спеціалізується на дублюванні та локалізації відеоконтенту; і Palabra, яка зберігає оригінальний голос мовця під час перекладу.
