Компания Google представила обновленную версию своей языковой модели Gemini 2.5 Pro, которая улучшает производительность в генерации кода и устраняет недостатки предыдущих сборок. Модель достигла рекордных 82,2% в бенчмарке Aider Polyglot, опередив конкурентов от OpenAI, Anthropic и DeepSeek.
По словам Логана Килпатрика, представителя Google, команда учла отзывы пользователей после релиза 03-25 и новая версия “устраняет регрессии” в производительности, улучшая креативность и форматирование ответов. Кроме того, для разработчиков добавлена поддержка конфигурируемых вычислительных бюджетов.
Gemini 2.5 Pro демонстрирует отличные результаты в пользовательских тестах LMArena и WebDevArena, увеличив свои позиции на 24 и 35 пунктов Elo соответственно. Хотя модель все еще находится в статусе “Preview”, ожидается, что релиз 06-05 станет финальной стабильной версией, которая в ближайшее время будет внедрена в основное приложение Gemini и веб-интерфейс.
Основная проблема, на которую отвечает Google, заключается в растущих требованиях к ИИ-моделям. Компании нуждаются в более мощных, быстрых и эффективных моделях для разработки сложных приложений. Gemini 2.5 Pro призвана стать таким решением, готовым к масштабированию в бизнесе. Тесты показывают серьезный прогресс в производительности.
В числах новая модель продемонстрировала рост на 24 пункта в рейтинге Elo на LMArena, достигнув 1470, и 35 пунктов на WebDevArena, что довело результат до 1443. Gemini 2.5 Pro лидирует в бенчмарках по генерации кода, а также показывает высокие результаты в тестах по математике, научным знаниям и логике, таких как GPQA и Humanity’s Last Exam.
В обновленной версии Gemini 2.5 Pro Google не только улучшила производительность, но и учла отзывы пользователей о предыдущих версиях. Были доработаны стиль и структура ответов, что сделали их более креативными и форматированными. Ключевой функцией для разработчиков стало внедрение “бюджетов мышления”, что позволяет лучше контролировать затраты и задержку при работе с моделью, что крайне важно для коммерческих проектов.
Разработчики могут начать работать с обновленной моделью Gemini 2.5 Pro уже сегодня через Gemini API в Google AI Studio и Vertex AI. Эта модель также станет доступной в приложении Gemini.
