ШІ

xAI випустила Grok 4.1: нова модель стала більш «людяною» та емоційно обізнаною

⠀Поширити:

  • Компанія xAI випустила модель Grok 4.1, яка стала помітно кращою у читанні тону та реакції на емоції, набувши «більш людяного» стилю спілкування.
  • Grok 4.1 очолив рейтинг LMArena Text Leaderboard (1483 Elo) та бенчмарк EQ-Bench3 за емоційним інтелектом.
  • Покращення досягнуто завдяки залученню експертів-«ШІ-наставників» для тонкого налаштування тону моделі.
  • Оновлення має недоліки: зросла схильність до нечесності та маніпуляцій, а також легша експлуатація через prompt-injection.
  • Модель вже доступна для всіх користувачів Grok у вебверсії та застосунках X.

Компанія xAI випустила Grok 4.1 — суттєве оновлення своєї моделі штучного інтелекту, яке не обмежується лише підвищенням швидкості чи інтелекту. Нова версія помітно краще розпізнає тон, реагує на емоції та в цілому створює враження, що розуміє співрозмовника. При цьому модель, схоже, набула дещо грайливого характеру.

Вже через кілька годин після запуску Grok 4.1 очолив два основні рейтинги ШІ-моделей:

  • LMArena Text Leaderboard: Модель отримала попередній показник 1483 Elo, випередивши всі інші загальнодоступні чатботи на ринку. Версія Grok 4.1 Thinking (quasarflux) посіла перше місце, а не-reasoning версія (tensor) — друге місце (1465 Elo), обійшовши повні reasoning-конфігурації конкурентів.
  • EQ-Bench3: У цьому бенчмарку, який спеціально фокусується на емоційному інтелекті (розуміння, емпатія, проницательність та міжособистісні здібності), Grok 4.1 також вийшла на перше місце.
xAI випустила Grok 4.1: нова модель стала більш «людяною» та емоційно обізнаною

Головні поліпшення стосуються емоційної обізнаності та якості письма. Розмови стали більш природними, а відповіді часто супроводжуються невеликими проявами емпатії чи гумору, замість типових для чатботів загальних фраз. Запити про ідеї для подорожей чи створення швидкого посту для X тепер звучать так, ніби відповідь надає кмітливий друг. За інформацією xAI, це стало можливим завдяки залученню більшої кількості експертів-«ШІ-наставників» для тонкого налаштування стилю та тону моделі.

xAI випустила Grok 4.1: нова модель стала більш «людяною» та емоційно обізнаною

Channel Tech в Telegram Актуальні новини та аналітика
Підписатися

Проте, оновлення має і певні негативні сторони. У картках моделі Grok 4.1 зазначено, що вона тепер демонструє дещо вищий рівень нечесності та маніпуляцій порівняно з попередньою версією. Також вона стала більш схильною заходити на «спірну територію» в режимі Thinking і її трохи легше експлуатувати за допомогою атак prompt-injection через API. xAI позиціонує 4.1 як більш експресивну та менш відфільтровану модель.

Оновлення вже розгорнуто усюди. Користувачі Grok у вебверсії та застосунках X можуть переключитися на Grok 4.1 у виборі моделей та випробувати її можливості.

Подобається Channel Tech? Ви можете підтримати незалежний проєкт
Підтримати
⠀Поширити:

Vitaliy Kairov

Засновник видання. Пишу про технології, гаджети та софт. Ціную об'єктивність, якісний звук та лаконічність.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *