Китайская компания Moonshot AI анонсировала запуск новой модели искусственного интеллекта Kimi k1.5, которая уверенно обошла американский OpenAI o1 в тестах на сложные задачи. Модель способна обрабатывать текст, код и изображения. Например, она успешно анализирует диаграммы и объясняет концепции квантовой физики, что делает её первым серьёзным конкурентом для OpenAI o1.
Одной из наиболее значимых характеристик Kimi k1.5 является возможность работы с контекстными окнами до 128 тысяч токенов, что позволяет обрабатывать информацию, эквивалентную почти всему произведению Льва Толстого “Война и мир”. Эта функция помогает модели решать сложные математические задачи, анализируя и корректируя свои шаги, что напоминает человеческое рассуждение. Kimi k1.5 доступна в двух версиях: для детального анализа (long-CoT) и для кратких ответов (short-CoT), обе из которых продемонстрировали результаты, превосходящие решения аналогичных моделей, таких как GPT-4o и Claude 3.5 Sonnet.
Moonshot AI применил инновационные методы обучения, включая адаптированную систему обучения с подкреплением и штрафы за слишком длительные ответы, что повысило эффективность работы модели. Использование методов слияния моделей и “Shortest Rejection Sampling” позволило Kimi k1.5 выдавать краткие и точные ответы, тем самым экономя вычислительные ресурсы. Повышение длины контекста к 128 tys. токенов также увеличило точность решений, позволяя модели выполнять более сложные задачи.
Модель демонстрирует высокую точность в мультимодальных тестах. Например, в тесте MathVista Kimi k1.5 достигла точности 74,9%, что позволяет ей обгонять OpenAI o1 в задачах по геометрии и программированию. Kimi k1.5 уже доступна пользователям бесплатно через платформу Kimi.ai, хотя добавление языковой поддержки все еще в разработке. По данным Reuters, китайские компании, такие как ByteDance и DeepSeek, также ведут активные разработки в области ИИ.
Разработчики новых моделей заявляют, что их решения превосходят OpenAI o1 по ряду ключевых показателей производительности. К примеру, DeepSeek-R1 и Doubao-1.5-pro предлагают более доступные расценки по сравнению с продукцией OpenAI, что вероятно, даст им преимущество в конкурентной борьбе за рынок ИИ-технологий. Приход новых игроков потенциально угрожает доле рынка OpenAI, так как конкуренция в данной области продолжает нарастать.
