Сегодня команда Яндекса представила обновлённые модели генерации изображений YandexART 2.5, которые уже доступны в ‘Чате с Алисой’ и среди пользователей ‘Шедеврума’. Базовая версия позволяет пользователям испытать новые функции, включая более точное создание изображений и улучшенные генеративные возможности. Pro-версия, доступная по подписке ‘Шедеврум Про’, предлагает дополнительно повышенное качество генерации и эксклюзивные функции.
Основным обновлением стало расширение обучающего датасета до 1 миллиарда пар изображений и текстов, что позволяет нейросети точнее соответствовать запросам пользователей. В результате тестирования YandexART 2.5 Pro продемонстрировала значительные улучшения по сравнению с конкурентами такими как Midjourney и Dall-E 3. Один из ключевых факторов — применение визуально-языковой модели (VLM), которая помогает детализировать описания изображений и улучшает качество генерации.
В процессе улучшения также был заменён автокодировщик, что увеличило разрешение модели и позволило лучше работать с мелкими деталями. Новая технология дистилляции оказалась успешной, ускорив генерацию изображений в 9 раз по сравнению с предыдущей версией. Кроме того, оптимизация активации нейросети позволила избежать проблем при инференсе, что ранее приводило к выводу некорректных изображений.
Модели YandexART 2.5 отличаются улучшенной способностью следовать инструкциям пользователей, что позволяет создавать реалистичные изображения с необходимыми формами и цветами. В результате, производимые изображения стали менее перенасыщенными фантазийными элементами и обеспечивают более качественные надписи на латинице. Эти изменения могут быть особенно полезны для дизайнеров и художников, которым нужно создавать оригинальные книжные обложки и логотипы.
Последние улучшения в генерации контента могут изменить подход к разработке визуального контента и использования нейросетей в художественной и коммерческой деятельности. Пользователи подписки ‘Шедеврум Про’ получат значительно больше возможностей, включая доступ к 4K разрешению и безлимитным генерациям изображений. Это делает YandexART 2.5 не только мощным инструментом для создания изображений, но и важным шагом в развитии технологий компьютерного зрения.
