Китайская компания Baidu зарегистрировала патент на систему, способную распознавать звуки животных и переводить их в человеческую речь. Заявка была подана в декабре 2024 года и недавно опубликована Национальным управлением интеллектуальной собственности Китая. Об этом сообщает South China Morning Post.
Разработка анализирует звуки, поведение и физиологические сигналы животных, чтобы определить их эмоциональное состояние. Затем эта информация преобразуется в понятную форму с помощью алгоритмов машинного и глубокого обучения, а также технологий обработки естественного языка.
Если система сталкивается с новым типом сигнала, который не совпадает с известными эмоциями, данные вручную помечаются и позже используются для дообучения модели.
Проект находится на ранней стадии, но уже вызвал реакцию в китайских соцсетях. Часть пользователей обрадовалась идее «переводчика для питомцев», другие усомнились в его реальности и применимости. Когда система появится на рынке — неизвестно. Рассмотрение патентной заявки может занять несколько лет.
Китайский гигант искусственного интеллекта Baidu намерен получить патент на технологию искусственного интеллекта, предназначенную для перевода звуков животных на человеческий язык. Интернет-гигант поиска подал заявку на патент в декабре, но она была опубликована Национальным управлением интеллектуальной собственности Китая только в мае.
Метод перевода работает путём сбора различных типов данных от животного, включая «голос, язык тела, поведенческие изменения и другие биологические признаки». Затем он определяет «эмоцию», анализируя данные перед их преобразованием в язык. Технология использует машинное и глубокое обучение, а также обработку естественного языка.
Если голос не соответствует ни одной ранее выявленной «эмоции», то команда вручную помечает голосовые данные, обновляет образец и корректирует параметры модели. Baidu отметила, что современные переводчики языков животных в основном используют два подхода: распознавание голосовых отпечатков и изучение выражений лиц. Оба подхода ограничены в понимании эмоций животных.
Патентную заявку пока лишь опубликовали, но её одобрение может занять ещё некоторое время, возможно, годы. Baidu не разъяснила свои намерения относительно применения технологии, например, планирует ли она выпустить новое приложение. «В настоящее время решение находится на стадии исследований. Как компания ИИ, мы постоянно стремимся применять новые технологии в различных вариантах использования», — заявили там.
Учёные и компании по всему миру уже работают над переводом звуков животных. В 2001 году японский производитель игрушек Takara выпустил Bowlingual — портативное устройство, которое переводило лай собак. В 2014 году небольшая скандинавская исследовательская лаборатория собрала более $22 тысяч для устройства No More Woof. С 2020 года международные исследователи из проекта CETI используют ИИ, чтобы понять, как общаются кашалоты.
