Яндекс научит машины понимать речь человека


Яндекс запустил облачный сервис распознавания речи SpeechKit Cloud. С его помощью разработчики, в том числе из Беларуси, смогут научить свои продукты понимать человеческий голос. Об этом сообщили БЕЛТА в пресс-службе компании Яндекс.

Облачный сервис распознавания речи уже использует Cubic Robotics - разработчик домашнего робота CUBIC. Дроид понимает заданные голосом вопросы и отвечает на них. А вот компания Oktell, выпускающая программное обеспечение для колл-центров, использует технологию Яндекса, чтобы распознавать речь звонящего в колл-центр человека и соединять его с нужным специалистом.

"В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую Яндекс запустил в 2013 году, - рассказали в компани. - Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Поддержку SpeechKit Cloud можно добавить в самые разные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы".

Качество распознавания речи зависит от тематики запроса. Если вы диктуете смс или заметку, оно составляет 82%, если произносите короткий запрос - 85%. А "географические" запросы (например, адреса и названия организаций) Yandex SpeechKit понимает с точностью, близкой к способностям человека, - 95%.

"В мире есть всего несколько разработчиков систем распознавания голоса - некоторые из них используются, например, в приложениях для смартфонов и планшетов. Однако систем, понимающих русскую речь, значительно меньше: адаптация подобной технологии под конкретный язык занимает очень много времени, так что иностранные разработчики до нашего языка часто "не доходят", - отметил руководитель отдела разработки голосовых сервисов и продуктов Яндекса Денис Филиппов.

SpeechKit Cloud понимает русский и турецкий языки, однако в планах Яндекса "обучить" технологию и другим языкам. Обработка голосовых запросов производится на серверах Яндекса, рассчитанных на высокие нагрузки. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Разработчикам предоставили возможность бесплатно использовать SpeechKit Cloud в течение месяца.

Новости по теме

Новости других СМИ