Большая языковая модель A-Vibe от «Авито» заняла первое место среди облегченных моделей (до 10 млрд параметров) в независимом российском бенчмарке MERA, обойдя международные аналоги от OpenAI, Google и Anthropic. По оценке MERA, A-Vibe лучше аналогичных моделей понимает запросы, генерирует код и поддерживает осмысленный диалог. Технология уже работает в сервисах «Авито», например, помогает продавцам писать продающие описания и быстрее договариваться о сделке в мессенджере.
До конца года «Авито» планирует добавить еще 20 новых сценариев, а в будущем может открыть код модели для всех. «Первое место доказывает, что оптимизированная архитектура и качественные данные могут обеспечить отличные результаты даже при небольшом размере модели», – отметил Андрей Рыбинцев, старший директор по данным и аналитике «Авито». Он также добавил, что компания планирует вложить в GenAI около 12 млрд руб. и заработать более 21 млрд руб. к 2028 году.
A-Vibe обошла такие модели, как GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku и Mistral Large. Тестирование включало задачи различной сложности – от базового понимания текста до продвинутых лингвистических задач, требующих глубокой работы с контекстом. Результаты показали, что A-Vibe в генерации кода на 25% лучше Gemini 1.5, в диалогах на 32% точнее Llama 3.1, и на 23% точнее Claude 3.5 Haiku по анализу смысла текста.
Разработчики «Авито» проводили «русификацию» модели, заменив стандартный токенизатор на собственный, который умеет работать с русским языком. Это дало два ключевых преимущества: ускорение работы – модель обрабатывает русский текст быстрее на 100%, и повышение качества понимания и генерации текста. A-Vibe может одновременно обрабатывать до 32 тыс. текстовых фрагментов, что позволяет эффективно работать с объемными текстами.
«Мы рассматриваем возможность выпуска модели в открытый доступ, что станет нашим вкладом в развитие российского рынка ИИ», – сказала Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито». Это может помочь малому бизнесу внедрять передовые технологии без значительных инвестиций и образовательным учреждениям создавать прикладные программы на базе отечественных технологий.
