Google представила третье поколение языковой модели с открытым исходным кодом Gemma. Она предназначена для быстрой работы непосредственно на устройствах: от смартфонов и ноутбуков до рабочих станций. Благодаря поддержке более чем 140 языков, эта модель может использоваться по всему миру.
В основе Gemma 3 лежат те же исследования и технологии, что и в Gemini 2.0. Существует четыре размера Gemma 3: с 1, 4, 12 и 27 миллиардами параметров. По заверениям Google, новая модель предлагает самую высокую производительность для своих размеров, превосходя Llama-405B, DeepSeek-V3 и o3-mini.
По шкале оценки Chatbot Arena Elo, новая Gemma 3 с 27 миллиардами параметров превосходит более крупные модели и требует для работы всего один графический процессор NVIDIA H100, тогда как конкурентам требуется до 32 ускорителей.
Gemma 3 предлагает контекстное окно размером 128 тысяч токенов. Благодаря этому можно создавать приложения, которые анализируют изображения, текст и короткие видеоролики; также Gemma 3 позволяет автоматизировать разные задачи.
Опробовать Google Gemma 3 можно прямо в браузере. Она понимает текст и изображения, имеет контекст до 128 тыс. токенов, а также поддерживает функциональное программирование.
НЬЮ-ЙОРК, 12 марта. /ТАСС/. Американская корпорация Google представила третье поколение своих открытых ИИ-моделей Gemma 3, которые можно запускать как на персональных устройствах, так и через облачные сервисы. Об этом сообщила пресс-служба компании.
По заявлению компании, открытая модель создана на той же основе, что и Gemini 2.0. Gemma 3 доступна в нескольких вариантах, включая версии с 1, 4, 12 и 27 млрд параметров. В компании считают, что это позволит разработчикам выбрать оптимальную модель в зависимости от мощности оборудования. Google утверждает, что Gemma 3 по результатам пользовательских тестов опережает конкурентов, таких как Llama-405B и DeepSeek-V3.
Модель понимает текст и изображения, работает на 140 языках, имеет контекст до 128 тыс. токенов, а также поддерживает функциональное программирование, что помогает создавать умные ИИ-ассистенты.
Открытая ИИ-модель (open-source AI model) – это система искусственного интеллекта, код и архитектура которой доступны для широкого использования и модификации. В отличие от закрытых коммерческих моделей, таких как GPT-4 от OpenAI, открытые модели позволяют разработчикам адаптировать и настраивать их под специфические задачи. Это делает их популярными в исследовательской среде и среди технологических компаний, работающих над кастомизированными ИИ-решениями.
