Компания Alibaba представила четыре варианта новой модели искусственного интеллекта: T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P. Эти модели способны создавать как изображения, так и видео на основе текстовых или графических запросов. Число «14B» в названии моделей свидетельствует о наличии 14 миллиардов параметров, что значительно увеличивает точность обработки данных и позволяет выдавать реалистичные результаты. Модели стали доступны на платформе Alibaba Cloud ModelScope и в сервисе Hugging Face, включая возможность коммерческого использования.
Первый раз Alibaba представила свою модель в январе, после чего сократила ее название с Wanx до Wan. Компания уверяет, что ее ИИ занимает лидирующие позиции на VBench — рейтинге генеративных видео-моделей, особенно в области обработки взаимодействия нескольких объектов. Новая нейросеть Wan 2.1 способна генерировать как видео, так и изображения, и включает три версии: I2V-14B, T2V-14B и T2V-1.3B. Первые две версии поддерживают генерацию роликов в разрешении от 480p до 720p, а T2V-1.3B — только в разрешении 480p.
Согласно информации от Alibaba, модель T2V-1.3B требует всего 8,19 ГБ видеопамяти, что делает её подходящей для большинства доступных графических процессоров. «Wan 2.1 последовательно превосходит существующие модели с открытым исходным кодом и современные коммерческие решения по различным показателям», — отметили представители компании. Данная версия ИИ доступна для бесплатной загрузки на платформах GitHub и Hugging Face.
В конце января Alibaba также выпустила другую модель ИИ — Qwen 2.5-Max, которая была заявлена как превосходящая новейшие разработки от OpenAI, DeepSeek и Meta в числе прочих. Более того, компания объявила о планах инвестировать $53 млрд в развитие искусственного интеллекта и облачных технологий, что является самым большим объемом инвестиций за последние десять лет в этих областях. Кроме того, председатель совета директоров Alibaba Джо Цай сообщил о намерении объединиться с Apple для внедрения ИИ-технологий в iPhone в Китае.
