ШІ-генератор від ElevenLabs створює вибухи та інші звукові ефекти за допомогою простої підказки
ElevenLabs вже пропонує версії людських голосів та музики, згенеровані штучним інтелектом. Тепер вона дозволить людям створювати звукові ефекти для подкастів, фільмів та ігор. Як повідомляє The Verge, новий інструмент Sound Effects може генерувати до 22 секунд звуків на основі підказок користувача, які можна комбінувати з голосовою та музичною платформою компанії, і він надає користувачам щонайменше чотири варіанти аудіокліпів, які можна завантажити.
Компанія заявляє, що працювала з медіаплатформою Shutterstock над створенням бібліотеки та тренуванням своєї моделі на своїх аудіокліпах. Shutterstock ліцензував свої бібліотеки контенту багатьом компаніям, що займаються штучним інтелектом, зокрема OpenAI, Meta і Google.
— ElevenLabs (@elevenlabsio) May 31, 2024
Sound Effects є безплатним для використання, але платні рівні можуть використовувати створені аудіокліпи з комерційними ліцензіями, тоді як безплатні користувачі “повинні посилатися на ElevenLabs, включивши “elevenlabs.io” в назві”. Користувачі ElevenLabs мають встановлений ліміт на кількість символів при написанні підказок, а безплатні користувачі отримують 10 000 символів на місяць. Щодо звукових ефектів, то на сторінці поширених запитань ElevenLabs зазначає, що якщо користувачі самі встановлюють тривалість аудіокліпу, то з виділеного ліміту буде використано 40 символів в секунду. Якщо використовується тривалість аудіо за замовчуванням, за кожен запит на підказку буде стягуватися 200 символів.
— ElevenLabs (@elevenlabsio) May 31, 2024
На ринку вже існують бібліотеки зі звуковими ефектами для творців, кінематографістів і розробників відеоігор. Але іноді вони можуть бути дорогими або мати проблеми з пошуком потрібного типу звуку. У своєму блозі ElevenLabs пише, що вони розробили Sound Effects “для швидкого, доступного і масштабного створення насичених і захоплюючих звукових ландшафтів”.
— ElevenLabs (@elevenlabsio) May 31, 2024
Інші розробники ШІ також створюють власні генератори для перетворення тексту в звук. Минулого року Stability AI випустила Stable Audio, який створює аудіокліпи з музикою та звуковими ефектами, а моделі AudioCraft від Meta генерують природні звуки (уявіть собі фонові шуми, такі як вітер або рух транспорту).