ChatGPT, Gemini, Copilot та інші чат-боти на основі ШІ роблять серйозні помилки при підсумовуванні новин – дослідження BBC
Новий звіт BBC підкреслює, що популярні чат-боти зі штучним інтелектом, такі як ChatGPT від OpenAI, Copilot від Microsoft, Gemini від Google та Perplexity AI, не завжди точно підсумовують новини. Попри те, що ці системи постійно покращуються, дослідження показало значні проблеми в їхніх відповідях.
Журналісти BBC протестували чат-ботів, задаючи їм 100 запитань, що стосувалися актуальних новин, і попросили їх використовувати BBC як джерело. Результати виявили, що в 91% випадків чат-боти допускали хоча б незначні помилки, а в 51% — суттєві проблеми. Це включало фактичні помилки, такі як неправильні цифри, дати або заяви.
Однією з основних проблем була неправильна інтерпретація джерел або змішування різних новин. Наприклад, ChatGPT і Gemini іноді використовували старі новини BBC, представляючи їх як актуальні, або поєднували нові дані з застарілими фактами.
Ще однією серйозною проблемою було те, що чат-боти не завжди могли чітко розрізнити факти та авторську думку. У ході дослідження BBC виявило щонайменше 23 випадки, коли думка журналістів подавалася як факт.
Хоча ChatGPT та Perplexity мали менше суттєвих помилок, Copilot і Gemini продемонстрували більше серйозних неточностей, особливо в питаннях, що стосуються актуальних новин.
