OpenAI представила ИИ-агента с названием agent, который интегрирован прямо в интерфейс ChatGPT. Новый инструмент способен выполнять сложные задачи от имени пользователя, сочетая возможности ChatGPT, Operator и Deep Research. Теперь ChatGPT может не просто отвечать на вопросы, а автоматически обрабатывать различные запросы, такие как создание исследовательских отчётов, разработка кода и оформление онлайн-заказов.
Агент может подключаться к Gmail, календарю и GitHub, извлекая необходимую информацию непосредственно из этих источников. Инструмент осуществляет взаимодействие с приложениями через API, веб-браузер и терминал, что позволяет ему фактически управлять компьютером пользователя. Важно, что агент запрашивает разрешение на выполнение ключевых действий и дает возможность пользователю следить за процессом.
По утверждению OpenAI, агент продемонстрировал успехи на сложных тестах, набрав 41,6% баллов, что значительно превышает результаты предыдущих моделей. Доступ к новому режиму получили пользователи подписок Pro, Plus и Team, которые могут активировать агента через контекстное меню инструмента.
Ранее ChatGPT мог только находить информацию, но не мог ее применять для решения практических задач. Новый режим объединяет эти функции, обеспечивая пользователей расширенными возможностями внутри одной платформы. Теперь ChatGPT может анализировать данные и представлять их в виде редактируемого слайд-шоу, обеспечивая при этом полный контроль для пользователей, которые должны подтверждать важные действия.
Эти новшества также открывают новые возможности для монетизации ChatGPT, делая платные тарифы более привлекательными для пользователей за счет автоматизации рутинных задач. OpenAI выделяет выдающиеся результаты производительности: агент набрал 45.5% на бенчмарке SpreadsheetBench, в то время как Copilot в Excel получил только 20%.
Тем не менее, новые возможности несут определённые риски, в том числе связанные с безопасностью. OpenAI уже внедрила многоуровневые меры защиты, чтобы предотвратить инъекции промптов и другие виды атак. Это включает в себя подтверждение пользователем критических действий и отказ от выполнения задач, представляющих высокий риск, таких как банковские переводы.
