Google Veo 3: чи стане нова ШІ-модель початком відтворюваних світів у відеоіграх
- Генеральний директор Google DeepMind Деміс Хассабіс натякнув на можливе використання нової відеогенеративної моделі Veo 3 для відеоігор.
- Google вже працює над перетворенням Gemini 2.5 Pro на модель світу та представила Genie 2, яка може генерувати “нескінченну” різноманітність відтворюваних світів.
- Veo 3, хоч і симулює реалістичну фізику та генерує відео зі звуком, поки що є “пасивною вихідною” генеративною моделлю, а не повноцінною моделлю світу.
- Модель може бути використана для кінематографічного оповідання в іграх (катсцени, трейлери), але для ігрового процесу потрібен перехід до активного, інтерактивного та передбачувального симулятора.
- Google може обрати гібридний підхід, поєднуючи Veo та Genie, щоб вирішити виклики створення реалістичної, послідовної та контрольованої симуляції в реальному часі.
- Google може зіткнутися з конкуренцією з боку Microsoft, Scenario, Runway, Pika та OpenAI (Sora).
Деміс Хассабіс, генеральний директор Google DeepMind, нещодавно натякнув, що Veo 3 — новітня модель Google для генерації відео — потенційно може бути використана у відеоіграх. Ця ідея виникла після того, як Хассабіс відповів на допис у соціальних мережах, де користувач висловив бажання “грати у відеогру зі своїх відео Veo 3”, запитуючи про “відтворювані моделі світу”. Керівник продукту Google AI Studio Логан Кілпатрік також додав інтриги своїм коментарем. Хоча ці дописи є радше жартівливими припущеннями, а представник Google зазначив, що компанія наразі не має що коментувати, створення відтворюваних моделей світу цілком входить у сферу можливостей технологічного гіганта.
Важливо розуміти, що моделі світу відрізняються від моделей генерації відео. Перші симулюють динаміку реального середовища, дозволяючи агентам передбачати, як світ буде розвиватися у відповідь на їхні дії. Моделі генерації відео ж синтезують реалістичні відеопослідовності.
Google має амбітні плани перетворити свою мультимодальну фундаментальну модель Gemini 2.5 Pro на модель світу, яка симулюватиме аспекти людського мозку. У грудні DeepMind вже представила Genie 2 — модель, здатну генерувати “нескінченну” різноманітність відтворюваних світів. Минулого місяця з’явилися повідомлення, що Google формує нову команду для роботи над ШІ-моделями, здатними симулювати реальний світ. Інші компанії також активно працюють у цьому напрямку, зокрема World Labs Фей-Фей Лі, яка створила власну ШІ-систему для генерації 3D-сцен, схожих на відеоігри, з одного зображення.
Veo 3, яка наразі перебуває на стадії публічного попереднього перегляду, може створювати не лише відео, але й супутній звук, від мови до саундтреків. Хоча Veo 3 генерує реалістичні рухи, симулюючи фізику реального світу, це ще не повноцінна модель світу. Її можна було б використовувати для кінематографічного оповідання в іграх, наприклад, для катсцен, трейлерів та прототипування наративів.
Проте модель залишається “пасивним вихідним” генеративним інструментом. Для перетворення на справжню модель світу, придатну для інтерактивних ігор, майбутнім поколінням Veo доведеться стати більш активними, інтерактивними та передбачувальними симуляторами. Справжній виклик у виробництві відеоігор полягає не лише у вражаючій візуалізації, а й у послідовній та керованій симуляції в реальному часі. Саме тому Google може розглянути гібридний підхід, який поєднає можливості Veo та Genie, якщо компанія вирішить зайнятися розробкою відеоігор або відтворюваних світів.
Google може зіткнутися з сильною конкуренцією з боку таких гравців, як Microsoft, Scenario, Runway, Pika, і, зрештою, моделі генерації відео Sora від OpenAI. Враховуючи заплановані кроки Google у сфері моделей світу та її репутацію щодо використання значних ресурсів для домінування на ринку, конкурентам у цьому просторі варто пильно стежити за розвитком подій.
