Posted 4 марта 2020,, 13:09

Published 4 марта 2020,, 13:09

Modified 17 сентября 2022,, 16:51

Updated 17 сентября 2022,, 16:51

ВКонтакте тестирует собственную технологию для распознавания голосовых сообщений

4 марта 2020, 13:09
ВКонтакте начала тестировать распознавание голосовых сообщений на русском языке и вскоре предложит для этой функции собственную технологию.

Узнать содержание записи можно будет даже тогда, когда не хочется или не получается её послушать — достаточно нажать кнопку и прочитать расшифрованный текст.

Пока новинка доступна только участникам VK Testers — программы тестирования ВКонтакте. Сейчас функция работает на iOS на базе сторонней технологии: разработчики изучают, как ей пользуются тестировщики, и собирают обратную связь.

На втором этапе тестирования будет задействована собственная разработка ВКонтакте для распознавания речи. Это нейросетевое решение, которое обучается русскоязычному сленгу, легко масштабируется и гибко настраивается. В дальнейшем эта технология может стать основой для нового инструмента — поиска по сообщениям с учётом голосовых.

Павел Калайдин, директор по исследованиям в области искусственного интеллекта ВКонтакте:

«Ежемесячно 30 миллионов человек обмениваются голосовыми сообщениями ВКонтакте. Для такого высоконагруженного сервиса требовалось решение, способное обрабатывать огромное количество входящей информации без потери качества. Поэтому мы создали его сами. Ещё одним серьёзным вызовом стал разговорный язык. Записывая голосовые сообщения, люди редко выражаются как персонажи классической русской литературы — напротив, они используют много сленга и заимствованной лексики. Готовые решения на наших тестах плохо справлялись с распознаванием таких слов, но мы учли специфику современного русского языка при разработке собственной технологии».

Ранее VK представила нейросеть, генерирующую новостные заголовки, внедрила модели машинного обучения в модерацию контента и определение тематики публикаций, а также открыла в МФТИ собственную лабораторию искусственного интеллекта.

"