Google випускає модель мислення Deep Think для Gemini 2.5 Pro та покращеної версії 2.5 Flash

21 Травня, 2025 Vitaliy Kairov Gemini, Gemini 2.5, Gemini 2.5 Flash, Gemini 2.5 Pro, Google, ШІ385 переглядів 1 хв. читання

Google запускає нову модель Deep Think з глибоким аналізом, вдосконалює Gemini 2.5 Flash для швидшої роботи та розширює можливості голосового синтезу і вебагентів. Основні інновації поки що доступні лише обмеженому колу користувачів.

На цьогорічній конференції I/O компанія Google представила серйозне оновлення своїх ШІ-моделей Gemini. Найгучнішим анонсом стала нова модель під назвою Deep Think, яка додає глибоку багатокрокову логіку до Gemini 2.5 Pro. За словами генерального директора DeepMind Деміса Хассабіса, ця система вміє враховувати кілька гіпотез, перш ніж дати відповідь.

Google стверджує, що Deep Think показала вражаючий результат під час тестування на завданнях з олімпіади з математики США 2025 року. Але поспішати з широким запуском у компанії не планують — спершу її отримають лише перевірені тестери через Gemini API. Важливо провести додаткові перевірки безпеки та зібрати фідбек експертів.

Паралельно Google представила вдосконалену версію моделі Gemini 2.5 Flash — тепер вона стала ще швидшою та економнішою. Нова версія споживає менше токенів, але при цьому покращила результати в тестах на логіку, мультимодальність, роботу з кодом і довгими контекстами. Повноцінний запуск заплановано на початок червня, а поки що Flash 2.5 доступна в режимі попереднього перегляду через Google AI Studio, Vertex AI та в додатку Gemini.

Окремої уваги заслуговує те, що концепцію “Thinking Budgets”, яка дозволяє балансувати між швидкістю, точністю та обсягом обчислень, тепер буде реалізовано і в Gemini 2.5 Pro. Тобто користувачі зможуть краще контролювати витрати ресурсів моделі.

Ще один крок у розвитку — розширення доступу до проєкту Mariner. Це агент Gemini, який самостійно виконує завдання у веббраузері, ніби цифровий помічник. Його вже почали вбудовувати в Gemini API та Vertex AI. Масштабніший запуск очікується влітку.

І насамкінець — ще одна функція для обох моделей Gemini 2.5: попередній перегляд синтезу мовлення. В рамках API вже доступні дві голосові опції на 24 мовах.

Vitaliy Kairov

Залишити відповідь Скасувати коментар