Розслідування The Atlantic виявило мільйони треків для навчання ШІ
- The Atlantic опублікувала бази з мільйонами треків, використаних для навчання ШІ.
- У списках є музика відомих артистів, зокрема Taylor Swift і Bad Bunny.
- Дані можуть стати доказами у судових спорах проти AI-платформ.
- Позови вже подані проти сервісів Suno та Udio через використання музики.
- Стримінги намагаються боротися з AI-контентом, але ефективність обмежена.
Журналісти The Atlantic опублікували результати розслідування щодо використання музики для навчання генеративних ШІ-моделей. Видання створило чотири відкриті бази даних, які дозволяють перевірити, які саме треки могли бути використані під час тренування алгоритмів.
Обсяги даних є значними: одна база містить близько 12 мільйонів композицій, інша — 9 мільйонів, а ще дві — приблизно по 100 тисяч треків кожна. У списках присутні записи відомих виконавців, зокрема Taylor Swift і Bad Bunny, що вказує на використання популярної музики, захищеної авторським правом.
Матеріали також описують юридичний контекст. Проти платформ генеративної музики, таких як Suno і Udio, вже тривають судові процеси. Компанії посилаються на принцип добросовісного використання (fair use), тоді як правовласники оскаржують використання контенту без дозволу. У схожій справі в галузі книговидавництва суд не підтримав позов щодо порушення авторських прав, однак звинувачення у піратстві виявилися більш переконливими. Остаточні рішення та компенсації у цій справі ще очікуються, хоча попередня сума врегулювання становила 1,5 мільярда доларів.
Опубліковані бази можуть використовуватися музичною індустрією як доказова база для подальших позовів проти розробників ШІ. Водночас стримінгові сервіси вже намагаються впроваджувати механізми виявлення або маркування контенту, створеного штучним інтелектом, але ці заходи не завжди ефективні.
Попри це, випадки створення імітацій відомих виконавців за допомогою ШІ продовжують з’являтися, що дозволяє зловмисникам отримувати вигоду від подібного контенту.
