Укрдержархів передав 10 ТБ даних для навчання українського ШІ Сяйво
- Укрдержархів вперше передав 10 терабайтів архівних даних для навчання національної мовної моделі Сяйво.
- Дані включають історичні документи, рукописи, закони, судові рішення, медіаматеріали та словники.
- Понад 50 партнерів — медіа, університети і бібліотеки — вже надають матеріали для моделі.
- До кінця 2026 року кількість оцифрованих архівних копій зросте зі 150 млн до понад 200 млн одиниць.
Державна архівна служба України вперше передала 10 терабайтів унікальних даних для навчання національної мовної моделі Сяйво. До масиву увійшли історичні матеріали, державні документи, наукові тексти, рукописи, закони, судові рішення, медіаматеріали та словники.
За словами в. о. міністра цифрової трансформації Олександра Борнякова, більшість глобальних ШІ-помічників генерують відповіді англійською і перекладають їх українською, часто втрачаючи контекст. Навчання Сяйво на українських даних має зробити модель надійним джерелом інформації для людей і бізнесу.
Голова Укрдержархіву Анатолій Хромов зазначив, що це перший випадок, коли архів надає свої дані для розвитку цифрових сервісів в Україні. До кінця 2026 року кількість цифрових копій держархівів планується збільшити зі 150 млн до понад 200 млн одиниць.
Наразі матеріали для навчання моделі надають вже понад 50 партнерів — медіа, університети, бібліотеки та інші організації. Після запуску моделі буде оприлюднений повний перелік установ та осіб, які долучилися до створення національного українського ШІ.
