OpenAI анонсировала Aardvark, автономного ИИ-агента, который анализирует код, ищет уязвимости и предлагает исправления. Он работает на базе GPT-5 и уже используется внутри компании.
В данный момент Aardvark доступен в режиме закрытого бета-тестирования, и присоединиться к тестированию можно по заявке через сайт OpenAI. Агент подключается к репозиториям, например, на GitHub, и самостоятельно изучает кодовую базу проекта. Он анализирует структуру кода, выделяет потенциально уязвимые участки и тестирует их в изолированной среде, чтобы подтвердить наличие ошибки.
После проверки Aardvark формирует отчёт, классифицируя найденные проблемы по уровню риска — от низкого до критического. Когда уязвимость подтверждается, в процесс включается модель Codex, которая предлагает варианты исправлений, генерирует патчи и даже комментирует код, объясняя причину проблемы.
Функционал Aardvark сочетает навыки аудитора, тестировщика и помощника-разработчика. Агент сканирует код и новые коммиты на наличие уязвимостей, проверяет их на возможность эксплуатации, оценивает уровень риска и формирует отчёты. Он также может интегрироваться с системами CI/CD, чтобы реагировать на изменения кода в реальном времени.
Этот инструмент ориентирован на разработчиков, команды DevSecOps и аудиторов безопасности. Он особенно полезен для компаний с большими кодовыми базами, где ручная проверка занимает значительное время, а также для open-source проектов, нуждающихся в защитных мерах. По данным OpenAI, Aardvark обнаружил 92% известных и синтетических уязвимостей во время тестирования, что значительно превышает результаты традиционных статических анализаторов.
Ранее OpenAI тестировала такую модель, как Codex, и ChatGPT-агентов для автоматизации программирования и технической поддержки. Новый проект делает шаг в сторону автоматизированной кибербезопасности, где ИИ не просто анализирует текст, а активно взаимодействует с кодом и инструментами разработчиков.
В настоящее время Aardvark работает в закрытой бета-версии, и OpenAI приглашает команды, готовые тестировать агента на своих репозиториях и делиться результатами. Все операции проходят в защищённой песочнице, а данные пользователей, по утверждениям компании, не используются для обучения моделей.
Таким образом,Aardvark представляет собой не просто помощника для программистов, а первого ИИ, который реально работает как разработчик, понимая код, находя ошибки и предлагая их исправление без участия человека.
