Незабаром Gemini знову буде генерувати ШІ-зображення людей за допомогою оновленого Imagen 3
Інструменти штучного інтелекту від Google отримують деякі з тих покращень, які компанія анонсувала на Google I/O. Починаючи з цього тижня, компанія випускає версію наступного покоління свого генератора зображень Imagen, який знову повертає можливість генерувати ШІ-людей (після прикрої суперечки на початку цього року). Чат-бот Gemini від Google також додає Gems – ботів з індивідуальними інструкціями, подібних до користувацьких GPT від ChatGPT. Про це пише Engadget.
Останні новини: Gemini AI від Google тепер автоматично робитиме нотатки під час відеозустрічей у Google Meet
Imagen 3 від Google – це оновлена версія генератора зображень, яка з’явиться в Gemini. Компанія заявляє, що модель ШІ наступного покоління «встановлює новий стандарт якості зображень» і побудована з обмеженнями, щоб уникнути надмірної корекції різноманітності, як, наприклад, химерні історичні зображення ШІ, які стали вірусними на початку цього року.
«У широкому діапазоні тестів Imagen 3 демонструє кращі результати порівняно з іншими доступними моделями генерації зображень», – написав у пресрелізі менеджер по продуктах Gemini Дейв Цитрон (Dave Citron). Інструмент дозволяє керувати процесом генерації зображень за допомогою додаткових підказок, якщо вам не подобається те, що він видає з першого разу.
Цитрон каже, що Imagen 3 «вигідно відрізняється» від конкурентів. Він також включає в себе інструмент SynthID від Google для накладання водяних знаків на зображення, щоб було зрозуміло, що вони створені штучним інтелектом, а не справжньою людиною.

Цитрон каже, що можливість генерувати людей повернеться найближчими днями для платних користувачів, через кілька місяців після того, як Google вилучив цю функцію. Він каже, що нові запобіжники запобігатимуть створенню «фотореалістичних, ідентифікованих особистостей» – це далеко від проблемних дипфейків, які генерує Grok Ілона Маска. Також під забороною перебувають діти та (як і в інших генераторах зображень) будь-які криваві, насильницькі або сексуальні сцени. Продакт-менеджер обґрунтовує очікування, кажучи, що зображення Gemini не будуть ідеальними, але він обіцяє, що компанія продовжуватиме прислухатися до відгуків користувачів і вдосконалюватиметься відповідно до них.
Читайте також: Новий інструмент “Reimagine” на Google Pixel 9 може змінити наше уявлення про правду
Починаючи з цього тижня, модель Imagen 3 буде доступна для всіх користувачів, але відновлення зображень за участю людей почнеться з платних користувачів. Англомовні користувачі Gemini Advanced, Business і Enterprise можуть очікувати, що генерація зображень з людьми повернеться «найближчими днями».

Вперше представлені на Google I/O 2024, Gems – це кастомні чат-боти Google зі створеними користувачем інструкціями. По суті, це відповідь Gemini на GPTs від OpenAI, які конкурент Google запустив наприкінці минулого року. Gems почне розгортатися в найближчі кілька днів.
«За допомогою Gems ви можете створити команду експертів, які допоможуть вам продумати складний проєкт, провести мозковий штурм ідей для майбутньої події або написати ідеальний підпис для посту в соціальних мережах», – пише Цитрон. «Ваш Gem також може запам’ятати детальний набір інструкцій, щоб допомогти вам заощадити час на нудних, повторюваних або складних завданнях».
На додаток до чистого аркуша кастомних Gems, Gemini включатиме готові, які «допоможуть вам розпочати роботу» та надихнуть на нові ідеї. Готові камені включають в себе:
- Навчальний коуч – допоможе вам розібратися в складних темах
- Мозковий штурм – для натхнення нових ідей
- Кар’єрний гід – допоможе вам підвищити кваліфікацію, прийняти рішення та поставити цілі
- Редактор текстів – надасть конструктивні поради щодо граматики, тональності та структури
- Партнер з кодування – покращить навички кодування для розробників та надихне на нові проєкти
Gems почали розгортатися вчора на десктопних та мобільних пристроях. Однак вони доступні лише для передплатників Gemini Advanced, Business та Enterprise, тому вам знадобиться платний тарифний план, щоб їх випробувати.