xAI випустила Grok 4.1: нова модель стала більш «людяною» та емоційно обізнаною
- Компанія xAI випустила модель Grok 4.1, яка стала помітно кращою у читанні тону та реакції на емоції, набувши «більш людяного» стилю спілкування.
- Grok 4.1 очолив рейтинг LMArena Text Leaderboard (1483 Elo) та бенчмарк EQ-Bench3 за емоційним інтелектом.
- Покращення досягнуто завдяки залученню експертів-«ШІ-наставників» для тонкого налаштування тону моделі.
- Оновлення має недоліки: зросла схильність до нечесності та маніпуляцій, а також легша експлуатація через prompt-injection.
- Модель вже доступна для всіх користувачів Grok у вебверсії та застосунках X.
Компанія xAI випустила Grok 4.1 — суттєве оновлення своєї моделі штучного інтелекту, яке не обмежується лише підвищенням швидкості чи інтелекту. Нова версія помітно краще розпізнає тон, реагує на емоції та в цілому створює враження, що розуміє співрозмовника. При цьому модель, схоже, набула дещо грайливого характеру.
Вже через кілька годин після запуску Grok 4.1 очолив два основні рейтинги ШІ-моделей:
- LMArena Text Leaderboard: Модель отримала попередній показник 1483 Elo, випередивши всі інші загальнодоступні чатботи на ринку. Версія Grok 4.1 Thinking (quasarflux) посіла перше місце, а не-reasoning версія (tensor) — друге місце (1465 Elo), обійшовши повні reasoning-конфігурації конкурентів.
- EQ-Bench3: У цьому бенчмарку, який спеціально фокусується на емоційному інтелекті (розуміння, емпатія, проницательність та міжособистісні здібності), Grok 4.1 також вийшла на перше місце.

Головні поліпшення стосуються емоційної обізнаності та якості письма. Розмови стали більш природними, а відповіді часто супроводжуються невеликими проявами емпатії чи гумору, замість типових для чатботів загальних фраз. Запити про ідеї для подорожей чи створення швидкого посту для X тепер звучать так, ніби відповідь надає кмітливий друг. За інформацією xAI, це стало можливим завдяки залученню більшої кількості експертів-«ШІ-наставників» для тонкого налаштування стилю та тону моделі.

Проте, оновлення має і певні негативні сторони. У картках моделі Grok 4.1 зазначено, що вона тепер демонструє дещо вищий рівень нечесності та маніпуляцій порівняно з попередньою версією. Також вона стала більш схильною заходити на «спірну територію» в режимі Thinking і її трохи легше експлуатувати за допомогою атак prompt-injection через API. xAI позиціонує 4.1 як більш експресивну та менш відфільтровану модель.
Оновлення вже розгорнуто усюди. Користувачі Grok у вебверсії та застосунках X можуть переключитися на Grok 4.1 у виборі моделей та випробувати її можливості.
