Компания искусственного интеллекта Илона Маска xAI представила обновление своего чат-бота Grok, позволяющее ему «видеть» окружающий мир. Эта новая функция позволяет чат-боту обрабатывать и интерпретировать визуальные входные данные, что является еще одним важным шагом во взаимодействии искусственного интеллекта и человека.
«Представляем Grok Vision, многоязычный звук и поиск в реальном времени в голосовом режиме. Обновление уже доступно», — заявили в компании. Улучшенный чат-бот Grok использует передовую технологию компьютерного зрения для анализа изображений и видео, предоставляя ответы с учетом контекста. Например, пользователи могут загрузить фотографию продукта, а Grok может идентифицировать его, предложить варианты использования или даже порекомендовать похожие товары. Это делает Grok более универсальным и интуитивно понятным.
С этим обновлением xAI позиционирует себя как сильного конкурента в области ИИ, бросая вызов таким устоявшимся игрокам, как OpenAI и Google. Пару дней назад мы уже сообщали о том, что компания тестирует эту функцию. Чат-бот Grok от xAI теперь может отвечать на вопросы о том, что видно на камере вашего смартфона, аналогично функциям распознавания в реальном времени, доступным для Gemini и ChatGPT от Google.
Во вторник xAI анонсировала запуск Grok Vision, который позволяет пользователям наводить телефон на такие объекты, как товары, вывески и документы, и задавать о них вопросы. Grok Vision доступен в приложении Grok для iOS, но пока недоступен для Android. Другие новые возможности, которые запустили в Grok вчера, включают многоязычное аудио и поиск в режиме реального времени в голосовом режиме Grok. Пользователи Grok на Android могут использовать их, но только в том случае, если они подписаны на тарифный план SuperGrok от xAI стоимостью 30 долларов в месяц.
В Grok постоянно добавляются новые функции. Ранее в этом месяце xAI добавила в Grok компонент «памяти», который позволяет боту использовать детали из прошлых разговоров. В Grok также появился инструмент, похожий на холст, для создания документов и приложений.
