Компания «Яндекс» представила новую языковую модель — YandexGPT 5 Pro, которая теперь доступна через голосового помощника «Алиса». Эта модель обещает выполнять широкий спектр задач — от личных и учебных до профессиональных. Пробные запросы можно отправлять прямо в чате, в то время как бизнес может интегрировать модель через Yandex Cloud. По заявлению представителей компании, эта модель отвечает на запросы «на уровне лучших мировых аналогов», а в некоторых аспектах превосходит их.
С YandexGPT 5 Pro «Алиса» стала более функциональной, позволяя пользователям задавать вопросы на русском и английском языках. Модель демонстрирует умение писать код, решать логические задачи и суммировать тексты, выбирая при этом наиболее актуальные источники для российской аудитории. «Яндекс» также выделяет улучшения в точности ответов, что делает «Алису» более полезной.
Семейство моделей YandexGPT 5 включает в себя как Pro, так и облегченную модель Lite. Согласно внутренним замерам, YandexGPT 5 Pro в 64% случаев показывает лучшие результаты по сравнению с китайской моделью Qwen2.5 в решении стандартных задач. Кроме того, «Яндекс» публикует в открытом доступе YandexGPT 5 Lite Pretrain — модель с 8 млрд параметров, предназначенную для дообучения под специфические задачи. Эта версия содержит обширные объемы знаний и может быть применена в различных областях.
Модель YandexGPT 5 Lite была обучена на масштабном датасете, что позволяет ей понимать контекст и закономерности языка. Процесс обучения состоял из двух этапов: первый — на русскоязычных и англоязычных текстах, второй — на высококачественных данных образовательной тематики. При этом «Яндекс» оптимизировал отбор данных, чтобы повысить качество модели.
По сравнению с предыдущим поколением YandexGPT 4 Lite, новая модель демонстрирует явное улучшение в решении математических задач и написании программного кода. В дополнение к этому, YandexGPT 5 Lite Pretrain превышает многие зарубежные аналоги, такие как LLaMa3.1-8B, во множестве задач. «Яндекс» также применил усовершенствованные методы обучения, что позволило снизить потребность в вычислительных ресурсах на 25%.
В результате внедрения этих инноваций, «Яндекс» продолжает расширять спектр доступных инструментов для разработчиков, рассматривая YandexGPT 5 как важный шаг в эволюции языковых моделей. Теперь доступ к этим технологиям открыт для большего числа пользователей и компаний как через облачные сервисы, так и через общеизвестные платформы, такие как HuggingFace.
