KPMG видалила звіт про агентний ШІ через масові галюцинації
- Консалтингова компанія KPMG відкликала свій звіт про штучний інтелект через виявлення в ньому масових фактичних помилок.
- Розслідування GPTZero показало, що 40 із 45 посилань у документі були вигаданими або некоректно атрибутованими.
- Близько половини прикладів використання ШІ, приписаних реальним компаніям на кшталт Emirates та UBS, виявилися хибними.
- Помилки виникли через використання дослідницького ШІ-інструменту, який згенерував фейкові кейси для виконання завдання.
Керівна консалтингова компанія KPMG, яка входить до «Великої четвірки» разом із Deloitte, PricewaterhouseCoopers та Ernst & Young, відкликала свій звіт про штучний інтелект через масові фактичні помилки. Розслідування, проведене розробником інструментів для виявлення ШІ-контенту GPTZero та підтверджене виданням Financial Times, виявило в документі численні згенеровані нейромережами галюцинації, фейкові посилання та неіснуючі приклади використання технологій.
Звіт під назвою Total Experience: Redefining Excellence in the Age of Agentic AI вийшов у жовтні минулого року і присвячувався тому, як бізнес використовує агентний ШІ для задоволення потреб клієнтів. Аналіз показав, що з 45 джерел, на які посилалися автори, лише п’ять вказували на реальні публікації. Ще 28 посилань містили перефразовані заголовки або вигадані елементи, а 12 були сформульовані надто розмито для перевірки фактів їхнього існування. У GPTZero назвали такий процес створення ШІ-моделями фейкових джерел терміном vibe citing.
Крім проблем із посиланнями, близько половини тверджень у звіті виявилися хибними або приписаними не тим компаніям. На думку експертів, помилки виникли через те, що дослідницький ШІ-інструмент надмірно старався виконати завдання зі збору прикладів застосування агентного ШІ на практиці. Наприклад, документ стверджував, що авіакомпанія Emirates запустила ШІ-чат-бота Sara, здатного безпосередньо змінювати рейси пасажирів. Насправді ж Sara — це мобільний асистент 2023 року випуску, який не є ШІ-ботом та не має функцій для зміни бронювань.
Неточності стосувалися й інших великих компаній. Зокрема, у KPMG зазначили, що швейцарський банк UBS інтегрував агентний ШІ в процеси управління ризиками, інвестиційних консультацій та комплаєнс-моніторингу, а Швейцарські федеральні залізниці (SBB) застосовують технологію для планування поїздок з урахуванням викидів вуглецю та ситуації в реальному часі. Представники обох організацій офіційно спростували ці заяви, назвавши їх неточними та фактологічно хибними.
Публікація неперевірених даних компаніями рівня KPMG становить ризик для ділової та наукової спільноти, оскільки їхні звіти вважаються надійними першоджерелами й часто цитуються в інших статтях. Генеральний директор GPTZero Едвард Тян пояснив, що такі документи можуть «отруїти інформаційне середовище» і спровокувати хвилю вторинних ШІ-галюцинацій в інших матеріалах. Після розголосу представники KPMG заявили, що серйозно ставляться до точності свого контенту, видалили звіт і розпочали внутрішню перевірку обставин його підготовки та публікації.
