ElevenLabs випустила мобільний застосунок для генерації голосу з тексту на iOS та Android
- Компанія ElevenLabs випустила окремий мобільний застосунок для iOS та Android для генерації голосу з тексту.
- Застосунок дозволяє вводити текст, обирати голос та отримувати аудіокліп; безплатний план надає близько 10 хвилин генерації.
- Він надає доступ до моделі v3 alpha з керуванням виразами голосу та створений у відповідь на попит користувачів, які раніше користувалися мобільною версією сайту.
- ElevenLabs планує розвивати застосунок, додаючи розпізнавання мовлення та розмовний ШІ-асистент.
- Раніше компанія випустила застосунок Reader для прослуховування текстових файлів та модель Scribe для перетворення голосу в текст (понад 99 мов).
Компанія ElevenLabs, розробник голосового штучного інтелекту, представила окремий мобільний застосунок для iOS та Android. Тепер користувачі можуть створювати голосові кліпи з тексту прямо зі своїх смартфонів, тоді як раніше це було можливо лише через вебверсію сервісу.
Для роботи із застосунком достатньо ввести або вставити текст, обрати голос для озвучування й отримати готовий аудіокліп. Безплатний план надає приблизно 10 хвилин генерації голосу. Доступні різні моделі синтезу, що дозволяють обирати оптимальний баланс якості. Застосунок також надає доступ до останньої версії моделі v3 alpha, яка підтримує керування виразами голосу за допомогою тегів.
Джек МакДермотт, керівник напряму мобільного розвитку ElevenLabs, розповів TechCrunch, що створення окремого мобільного застосунку стало відповіддю на високий попит. Багато користувачів вже використовували мобільну версію сайту для генерації голосових кліпів, які потім інтегрували у відео для соцмереж, наприклад, у CapCut або Instagram. Застосунок покликаний надати швидший та зручніший спосіб роботи.
Це вже другий застосунок від ElevenLabs для користувачів; раніше компанія представила застосунок Reader для прослуховування текстових файлів на ходу. Нове рішення дозволяє ElevenLabs конкурувати з іншими сервісами для генерації та клонування голосів, такими як Speechify або Captions.
Надалі ElevenLabs планує розвивати застосунок, розширюючи його можливості. Серед майбутніх оновлень — розпізнавання мовлення (speech-to-text), розмовний ШІ-асистент та багато іншого.
Нагадаємо, у лютому компанія ElevenLabs запустила Scribe — модель для перетворення голосу в текст, що підтримує понад 99 мов. До речі, саме ШІ-сервіс ElevenLabs переклав інтерв’ю Зеленського Лексу Фрідману.
