Користувачі Gemini скаржаться на швидку втрату контексту в чаті
- Користувачі повідомляють, що Gemini швидко забуває контекст у чаті.
- Google заявляє про контекст до 1 млн токенів у підписках.
- Фактично чат зберігає лише близько 16 тисяч токенів.
- Проблему також обговорюють користувачі Reddit та X.
- Google поки не пояснила розбіжність у роботі моделі.
Користувачі Gemini повідомляють про розбіжність між заявленими можливостями моделі та фактичною роботою чат-інтерфейсу, зокрема щодо обсягу контексту, який система може утримувати під час діалогу. Про це пише Android Authority.
У матеріалах Google зазначається, що підписки Pro та Ultra підтримують контекстне вікно до 1 мільйона токенів, що еквівалентно приблизно 1500 сторінкам тексту або 30 тисячам рядків коду. Проте, за словами користувачів, у реальних чатах модель починає втрачати попередній контекст значно раніше.
Зокрема, один із користувачів стверджує, що хоча система може обробити великий обсяг даних під час першого запиту, активна «пам’ять» у діалозі обмежується приблизно 16 тисячами токенів або 25–30 повідомленнями. У результаті модель поступово забуває попередні інструкції, код або обмеження в межах тієї ж розмови.
Подібні зауваження також з’являлися на Reddit, де користувачі відзначали різницю між можливостями API або платформи AI Studio та поведінкою чат-версії Gemini.
Ця ситуація пов’язана з різницею між загальним контекстним вікном моделі та обсягом контексту, який фактично використовується в чаті під час діалогу. У відкритій документації Google наводить технічні параметри для розробників, зокрема щодо обмежень вхідних і вихідних токенів, однак не деталізує ці відмінності для кінцевих користувачів.
Станом на зараз компанія не надала офіційного пояснення щодо цієї різниці або можливих змін у відображенні характеристик контекстного вікна в чаті.
