Google випускає Gemini 2.5 Deep Think: ШІ для паралельного аналізу ідей

4 Серпня, 2025 Vitaliy Kairov Gemini, Gemini 2.5, Google, ШІ319 переглядів 3 хв. читання

⠀Поширити:

Google DeepMind запускає Gemini 2.5 Deep Think – свою найсучаснішу ШІ-модель для міркувань, здатну паралельно аналізувати ідеї.
Доступ до моделі отримали підписники Google Ultra ($250/міс) з 1 серпня.
Це перша публічно доступна багатоагентна модель Google, яка використовувалася для здобуття золотої медалі на Міжнародній математичній олімпіаді (IMO).
Gemini 2.5 Deep Think демонструє кращі результати на тестах Humanity’s Last Exam (HLE) та LiveCodeBench 6 порівняно з моделями від xAI та OpenAI.
Модель автоматично працює з інструментами, як-от виконання коду та Google Search, і здатна генерувати довгі, детальні відповіді.
Багатоагентні системи дорожчі в обслуговуванні, тому доступ до них буде обмеженим.

Google DeepMind випускає Gemini 2.5 Deep Think — свою найсучаснішу ШІ-модель для міркувань. Як повідомляє TechCrunch, вона може відповідати на запитання, досліджуючи та розглядаючи кілька ідей одночасно, а потім використовуючи ці результати для вибору найкращої відповіді.

Підписники тарифного плану Google Ultra (вартістю $250 на місяць) отримали доступ до Gemini 2.5 Deep Think у застосунку Gemini вже з п’ятниці, 1 серпня.

Вперше представлена в травні на Google I/O 2025, Gemini 2.5 Deep Think є першою публічно доступною багатоагентною моделлю Google. Такі системи генерують кілька ШІ-агентів для паралельного вирішення завдання. Це вимагає значно більше обчислювальних ресурсів, ніж робота одного агента, але зазвичай призводить до кращих відповідей.

Google використала модифікацію Gemini 2.5 Deep Think, щоб цього року здобути золоту медаль на Міжнародній математичній олімпіаді (IMO). Компанія також випускає модель, яка використовувалась на IMO, для обмеженої групи математиків та науковців. Google зазначає, що ця ШІ-модель “міркує годинами”, на відміну від споживчих ШІ-моделей, що працюють за секунди. Google сподівається, що модель IMO посилить дослідницькі зусилля та допоможе отримати відгуки для покращення багатоагентної системи в академічних цілях.

Google зазначає, що модель Gemini 2.5 Deep Think є значним покращенням порівняно з тим, що було анонсовано на I/O. Компанія також стверджує, що розробила “новітні методи навчання з підкріпленням”, щоб заохотити Gemini 2.5 Deep Think краще використовувати свої шляхи міркувань.

“Deep Think може допомогти людям розв’язувати проблеми, що вимагають креативності, стратегічного планування та покрокових покращень”, — заявили в Google у блозі, наданому TechCrunch.

Компанія стверджує, що Gemini 2.5 Deep Think досягає найкращих результатів на тесті Humanity’s Last Exam (HLE) – складному випробуванні, що вимірює здатність ШІ відповідати на тисячі питань з математики, гуманітарних наук та природничих наук. Модель Google набрала 34,8% на HLE (без інструментів), тоді як xAI Grok 4 – 25,4%, а OpenAI o3 – 20,3%.

Google також заявляє, що Gemini 2.5 Deep Think перевершує ШІ-моделі від OpenAI, xAI та Anthropic на LiveCodeBench 6 – складному тесті з конкурсних завдань кодування. Модель Google набрала 87,6%, тоді як Grok 4 – 79%, а OpenAI o3 – 72%.

Gemini 2.5 Deep Think автоматично працює з такими інструментами, як виконання коду та Google Search. Компанія заявляє, що модель здатна генерувати “набагато довші відповіді”, ніж традиційні ШІ-моделі. За результатами тестування Google, модель створювала детальніші та естетично привабливіші завдання веброзробки порівняно з іншими ШІ-моделями. Компанія стверджує, що модель може допомогти дослідникам і “потенційно прискорити шлях до відкриттів”.

Схоже, кілька провідних ШІ-лабораторій сходяться на багатоагентному підході. xAI Ілона Маска нещодавно випустила власну багатоагентну систему, Grok 4 Heavy, яка, за її словами, досягла провідних у галузі показників. Дослідник OpenAI Ноам Браун заявив, що нерелізна ШІ-модель, яку компанія використала для здобуття золотої медалі на Міжнародній математичній олімпіаді цього року, також була багатоагентною системою. Водночас, дослідницький агент Anthropic, що генерує ґрунтовні дослідницькі довідки, також працює на базі багатоагентної системи.

Попри високу продуктивність, багатоагентні системи виявляються дорожчими в обслуговуванні, ніж традиційні ШІ-моделі. Це означає, що технологічні компанії, ймовірно, триматимуть ці системи за найдорожчими планами підписки, як це вже зробили xAI, а тепер і Google.

Протягом найближчих тижнів Google планує надати Gemini 2.5 Deep Think обмеженій групі тестувальників через Gemini API. Компанія прагне краще зрозуміти, як розробники та підприємства можуть використовувати її багатоагентну систему.

⠀Поширити:

Vitaliy Kairov

Залишити відповідь Скасувати коментар