Китайская компания DeepSeek представила новые мультимодальные модели Janus Pro, которые, по утверждению стартапа, превосходят Stable Diffusion 3 Medium и DALL-E 3 от OpenAI. Эти ИИ-модели для генерации изображений с открытым исходным кодом доступны для бесплатного использования на платформе Hugging Face. DeepSeek позиционирует Janus Pro как более мощную версию своей предыдущей модели Janus.
Модели Janus Pro имеют размер от 1 до 7 миллиардов параметров и обладают возможностями анализа изображений и генерации новых. Однако на данный момент они ограничены разрешением 384×384 пикселей. Самая мощная версия, Janus-Pro-7B, продемонстрировала высокие результаты в тестировании GenEval и DPG-Bench, что свидетельствует о ее способности конкурировать с другими популярными моделями.
Запуск Janus Pro совпал с недавним успехом DeepSeek, так как 27 января 2025 года приложение стартапа стало самым популярным бесплатным приложением в американском App Store, обогнав даже ChatGPT от OpenAI. Однако это привело к некоторым вызовам, таким как сбои у пользователей и временные ограничения на регистрацию из-за кибератаки. Важно отметить, что подобный успех вызвал падение акций американских компаний, работающих в ИИ и разработке чипов.
В процессе обучения моделей использовались 72 миллиона высококачественных синтетических изображений, сопоставленных с реальными данными. Это значительно повысило качество генерации изображений по сравнению с предыдущими версиями. Глава OpenAI Сэм Альтман прокомментировал успех DeepSeek, назвав новую модель “впечатляющей” и отметив, что появление сильного конкурента вдохновляет их на дальнейшее развитие.
Несмотря на впечатляющие результаты, у Janus-Pro также есть свои ограничения. Например, большинство моделей работают только с небольшими изображениями, но специалисты отмечают, что такие характеристики являются достойным достижением для моделей с небольшим размером. При этом DeepSeek продолжает оптимизацию процессов обучения и качества данных, что положительно сказывается на их продуктах. Следующий этап развития компании будет интересен, и остаётся лишь наблюдать, как она справится с вызовами и сможет ли сохранить свои позиции в условиях растущей конкуренции на рынке ИИ.
