JetBrains випускає Mellum — “відкриту” ШІ-модель для програмування
Перша відкрита ШІ-модель від відомого розробника інструментів для програмування
У середу компанія JetBrains, відома своїми популярними засобами розробки програмного забезпечення, зробила важливий крок у сфері штучного інтелекту. Розробник відкрив доступ до своєї ШІ-моделі Mellum на платформі Hugging Face, яка раніше була інтегрована лише в їхні власні продукти для розробки програмного забезпечення.
Mellum — це не просто чергова ШІ-модель. Навчена на понад 4 трильйонах токенів, вона має 4 мільярди параметрів і спеціально розроблена для автозавершення коду на основі контексту. Для розуміння масштабу: один мільйон токенів відповідає приблизно 30 000 рядків коду, а кількість параметрів безпосередньо пов’язана зі здатністю моделі вирішувати складні завдання.
“Модель розроблена для інтеграції в професійні інструменти розробників, як-от інтелектуальні підказки коду в інтегрованих середовищах розробки, ШІ-асистенти для програмування та дослідження розуміння й генерації коду. Mellum також добре підходить для освітніх цілей та експериментів із точним налаштуванням”, — пояснює JetBrains у технічному звіті.
Компанія повідомляє, що навчання Mellum, яка розповсюджується під ліцензією Apache 2.0, відбувалося на наборах даних, що включають код із дозвільними ліцензіями з GitHub та статті з англомовної Вікіпедії. Процес навчання тривав близько 20 днів на кластері з 256 графічних процесорів Nvidia H200.
Варто зазначити, що Mellum потребує додаткової роботи перед запуском. Базову модель неможливо використовувати без попереднього налаштування. Хоча JetBrains надала кілька версій Mellum, налаштованих для Python, компанія застерігає, що вони призначені для “оцінки потенційних можливостей”, а не для впровадження в робоче середовище.
ШІ-генерований код безсумнівно змінює способи створення програмного забезпечення, але також створює нові проблеми безпеки. За даними дослідження платформи безпеки розробників Synk кінця 2023 року, понад 50% організацій іноді або часто стикаються з проблемами безпеки в коді, створеному штучним інтелектом.
JetBrains визнає, що Mellum може “відображати упередження, присутні у публічних кодових базах” (наприклад, генерувати код, подібний за стилем до репозиторіїв з відкритим кодом), і що її пропозиції коду не обов’язково будуть “безпечними чи вільними від вразливостей”.
“Це лише початок”, — написала JetBrains у своєму блозі. “Ми не женемося за універсальністю — ми будуємо фокусованість. Якщо Mellum спровокує хоча б один значущий експеримент, внесок чи співпрацю, ми вважатимемо це перемогою”.
