Китайская компания DeepSeek выпустила обновлённую версию своей reasoning-модели R1 под названием R1-0528. Модель уже доступна на платформе Hugging Face, однако официального анонса и подробностей от разработчиков пока не последовало.
Несмотря на это, предварительные тесты показывают, что R1-0528 демонстрирует улучшенные способности в генерации кода и структурировании ответов. Согласно результатам бенчмарка LiveCodeBench, разработанного университетами Беркли, MIT и Корнеллом, обновлённая модель R1 занимает позицию сразу за o4-mini и o3 от OpenAI, опережая при этом Grok 3 mini от xAI и Qwen 3 от Alibaba.
Это свидетельствует о том, что DeepSeek продолжает укреплять свои позиции в области ИИ, несмотря на отсутствие подробностей об обновлении. Ранее, в январе 2025 года, DeepSeek представила первую версию модели R1, которая была полностью открыта и лицензирована по MIT. Модель отличалась высокой эффективностью в задачах, связанных с математикой, программированием и логикой, и предлагала пользователям 50 бесплатных запросов в день.
Кроме того, R1 использовала инновационный подход к обучению с подкреплением, что позволило ей достигать высоких результатов при минимальных затратах. Ожидается, что в ближайшее время DeepSeek представит более продвинутую модель R2, которая была запланирована к выпуску в мае. Пока же обновлённая версия R1-0528 продолжает демонстрировать конкурентоспособность китайских разработок в сфере искусственного интеллекта.
Исходная версия R1 была выпущена в январе и вызвала сильные изменения котировок на мировых рынках акций, обвалив стоимость американской Nvidia за одну сессию почти на $600 млрд. Будучи сопоставимой с разработками OpenAI, она требовала гораздо меньше затрат на обучение. После этого технологии DeepSeek стали активно внедрять в Китае в различных секторах – от здравоохранения до органов власти.
