DeepSeek Janus Pro — нова модель ШІ для генерації зображень, яка перевершує DALL-E 3 та Stable Diffusion
Китайська компанія DeepSeek оприлюднила технічний звіт, у якому стверджує, що її нова модель штучного інтелекту Janus Pro перевершила конкурентів у створенні зображень за текстовими запитами. Про це пише Reuters.
Переваги нової моделі DeepSeek Janus Pro
Janus-Pro-7B показала кращі результати порівняно з DALL-E 3 від OpenAI та Stable Diffusion від Stability AI. Модель є вдосконаленою версією Janus, представленої наприкінці минулого року.

Читайте також: Китайський ШІ-стартап DeepSeek обігнав ChatGPT у рейтингу Apple App Store
DeepSeek досягла покращення завдяки:
- Вдосконаленню процесів навчання
- Підвищенню якості даних
- Збільшенню розміру моделі
- Додаванню 72 мільйонів якісних синтетичних зображень
- Збалансуванню даних з реального світу

Нова версія моделі містить 7 мільярдів параметрів, що забезпечило вищу швидкість навчання та точність у генерації зображень за текстовим описом.
Варто зазначити, що успіх DeepSeek вплинув на фондовий ринок — акції технологічних компаній Nvidia та Oracle знизились після оприлюднення новини про лідерство моделі DeepSeek-V3 серед відкритих моделей.