ІнтернетНовиниШІ

Майбутнє пошуку: ШІ-системи віддають перевагу маловідомим сайтам, ігноруючи популярні джерела

⠀Поширити:

  • Дослідження Рурського університету та Інституту Макса Планка показало, що ШІ-пошукові системи (Google AI Overviews, Gemini 2.5 Flash, GPT-4o) частіше цитують менш популярні вебсайти, які не входять навіть у топ-100 традиційної пошукової видачі Google.
  • Медіанний рейтинг джерел Gemini був поза топ-1000 найпопулярніших доменів.
  • ШІ-відповіді зберігають інформаційну різноманітність, але можуть втрачати менші або неоднозначні деталі через стиснення великих обсягів даних в один узагальнений текст.
  • ШІ-пошукові інструменти погано справляються з темами, що швидко змінюються, та актуальною інформацією.
  • Це свідчить про те, що ШІ-пошук може створювати новий веб, який цінує синтез інформації вище за її популярність.

Нове дослідження виявило, що пошукові системи на базі штучного інтелекту цитують менш відомі вебсайти значно частіше, ніж традиційні та популярні ресурси, такі як Google. Дослідники з Рурського університету в Бохумі та Інституту програмних систем Макса Планка детально описали ці висновки у своїй роботі під назвою «Характеристика вебпошуку в епоху генеративного ШІ», повідомляє Ars Technica.

Команда вчених порівняла стандартну пошукову видачу Google з відповідями, які генеруються AI Overviews від Google, моделлю Gemini 2.5 Flash, а також двома варіантами вебпошуку GPT-4o. Аналіз засвідчив, що ШІ-системи регулярно посилаються на джерела, які займають значно нижчі позиції в рейтингах популярності. У багатьох випадках ці сайти взагалі не з’являються у першій сотні (топ-100) результатів традиційного пошуку Google за тим же запитом.

Дослідники використовували різноманітні тестові запити, включаючи реальні питання від користувачів ChatGPT, політичні теми з ресурсу AllSides та продукти, які найчастіше шукають на Amazon. Згідно з даними інструменту ранжування доменів Tranco, джерела, які використовували ШІ-системи, мали значно нижчий середній рейтинг, ніж джерела з топ-результатів Google. Наприклад, медіанний рейтинг доменів, які цитував Gemini, знаходився за межами першої тисячі найпопулярніших сайтів.

Понад половина джерел, на які посилається Google’s AI Overviews, були відсутні навіть у традиційних топ-10 результатах. Близько 40 відсотків цих джерел не були присутні у топ-100 традиційної видачі взагалі. Водночас, таке зміщення до маловідомих вебсайтів, схоже, не погіршує якості наданої інформації. Моделі на базі GPT частіше посилалися на корпоративні сайти та енциклопедичний контент, уникаючи при цьому соціальних мереж.

Майбутнє пошуку: ШІ-системи віддають перевагу маловідомим сайтам, ігноруючи популярні джерела

Дослідження показало, що згенеровані ШІ-відповіді містять приблизно той самий діапазон ідентифікованих «концепцій», що й традиційний пошук. Це свідчить про те, що ШІ-системи підтримують порівнянний рівень інформаційної різноманітності.

Однак, оскільки ці моделі узагальнюють інформацію замість того, щоб надавати перелік окремих джерел, вони часто стискають великі обсяги даних у коротші відповіді. Це стиснення може призводити до втрати менших або більш двозначних деталей, які зазвичай все ще можна знайти у традиційних результатах пошуку.

Дослідники також звернули увагу на те, що ШІ-пошукові інструменти мають проблеми з темами, які швидко змінюються або є чутливими до часу. Наприклад, гібридний режим GPT-4o іноді не зміг надати найбільш актуальну інформацію, відповідаючи на запити про останні події чи трендові теми.

Майбутнє пошуку: ШІ-системи віддають перевагу маловідомим сайтам, ігноруючи популярні джерела


Висновки роботи свідчать, що майбутнє пошуку полягає не стільки у якості, скільки у відмінності. Якщо це дослідження є точним, то штучний інтелект, можливо, будує мережу, яка цінує синтез інформації вище за популярність джерела, що докорінно змінює правила онлайн-авторитетності.

В інших новинах зі світу ШІ, компанія Google представила Vibe Coding в AI Studio — нову функцію, що дозволяє розробникам створювати повністю функціональні ШІ-застосунки з одного текстового запиту. Тим часом, компанія ByteDance запустила Seed3D 1.0 — інструмент, здатний миттєво конвертувати будь-яку 2D-фотографію у реалістичну 3D-модель.


Google News
Channel Tech в Google News Актуальні новини та аналітика
Читати

⠀Поширити:

Vitaliy Kairov

Віталій — автор та головний редактор Channel Tech.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *