DeepMind представила AlphaEvolve — ШІ, який чудово справляється з математичними та природничо-науковими задачами
Команда DeepMind, яка входить до складу Google, розробила нову систему штучного інтелекту під назвою AlphaEvolve. За словами компанії, цей інструмент здатен розв’язувати задачі з однозначними, так званими «машино-оцінюваними» відповідями, що відкриває можливості для практичного використання в галузях на кшталт інформатики та оптимізації систем.
У DeepMind повідомляють, що AlphaEvolve вже допомагає оптимізувати внутрішню інфраструктуру Google, яка використовується для навчання інших ШІ-моделей. Крім того, готується запуск тестової версії для обмеженого кола науковців, з подальшими планами щодо ширшого доступу.

Ключова особливість AlphaEvolve — автоматична система самоперевірки. ШІ створює кілька варіантів розв’язку, аналізує їх, критикує власні помилки й обирає найточнішу відповідь. Такий підхід має зменшити поширену для сучасних моделей проблему «галюцинацій» — коли штучний інтелект впевнено видає вигадані або некоректні дані. DeepMind стверджує, що використання моделей сімейства Gemini забезпечує помітно вищу точність у порівнянні з попередніми експериментами.
Однак AlphaEvolve має низку обмежень. Вона не здатна розв’язувати задачі, які неможливо автоматично перевірити — наприклад, гуманітарні або творчі. Також система не пояснює відповіді у вигляді тексту, а виключно у вигляді алгоритмів.
Під час внутрішнього тестування DeepMind перевірила AlphaEvolve на наборі з 50 математичних задач — від геометрії до комбінаторики. Система змогла повторити найкращі відомі розв’язки у 75% випадків, а у 20% — запропонувала покращені варіанти.
Крім теорії, AlphaEvolve показала результат і на практиці: ШІ створив алгоритм, який дозволив Google щоденно повертати в середньому 0,7% обчислювальних ресурсів у дата-центрах по всьому світу. А ще один оптимізаційний підхід допоміг скоротити тривалість тренування моделей Gemini на 1%.
Втім, DeepMind не робить гучних заяв про революційні відкриття. Один із запропонованих AlphaEvolve варіантів оптимізації чипа TPU вже був відомий іншим інструментам. Основний акцент команда робить на ефективності: система економить час і дає змогу спеціалістам зосередитися на важливіших завданнях.
