Anthropic планує відкрити доступ до моделей рівня Mythos
- Anthropic готується відкрити доступ до моделей пошуку вразливостей Mythos.
- Наразі система доступна лише обмеженим користувачам через Project Glasswing.
- Модель уже виявила понад 6200 критичних і високих вразливостей.
- Компанія визнає відсутність достатніх механізмів захисту від зловживань.
- Знайдені помилки створюють додаткове навантаження на фахівців безпеки.
Anthropic заявила про намір у майбутньому відкрити публічний доступ до моделей рівня Mythos, які здатні виявляти вразливості в програмному коді, після розробки належних механізмів безпеки. Наразі такі моделі доступні лише обмеженому колу користувачів у межах програми Project Glasswing, повідомляє The Register.
Модель Mythos, представлена у квітні, здатна знаходити та експлуатувати вразливості, тому її доступ обмежили через ризик використання кіберзлочинцями. Учасники Project Glasswing повідомляють, що модель виявляє значну кількість помилок, хоча багато з них могли бути знайдені людьми за наявності достатніх ресурсів. Водночас обсяг виявлених вразливостей ускладнює їх оперативне виправлення.
Поява Mythos викликала реакцію урядів. У Японії ініціювали перевірку кібербезпеки, а в Індії фінансові установи отримали вказівки щодо термінового усунення вразливостей. Anthropic визнає, що наразі жодна компанія не має достатніх механізмів захисту, щоб повністю запобігти зловживанню подібними моделями.
Компанія повідомила, що планує розширити доступ до Project Glasswing для урядів США та союзників. У майбутньому, після створення ефективніших обмежень, такі моделі можуть стати доступними ширшому колу користувачів, однак конкретні терміни не називаються.
За даними Anthropic, модель перевірила понад 1000 проєктів із відкритим кодом і виявила 6202 вразливості високого або критичного рівня, а загалом — 23 019 помилок. Після перевірки 1752 вразливостей 90,6% підтвердилися як реальні, а 62,4% з них класифіковані як високого або критичного рівня.
Серед знайдених проблем — критична вразливість у криптографічній бібліотеці wolfSSL, яка використовується в мільярдах пристроїв. Вона дозволяла створювати підроблені сертифікати, що могли використовуватися для імітації легітимних сайтів. Вразливість уже виправлено.
Anthropic зазначає, що наразі виправлено 75 із 530 вразливостей високого або критичного рівня, про які повідомила компанія. Частина з них ще перебуває в межах 90-денного періоду розкриття. Значна кількість знайдених помилок створює додаткове навантаження на фахівців із безпеки.
Компанія також вказує, що для реагування на зростання кількості вразливостей можуть застосовуватися інструменти на базі штучного інтелекту, зокрема можливості моделі Claude для допомоги розробникам.

