Смотреть ролики в «VK Видео» стало еще удобнее

Теперь речь говорящего оформляется в текстовые субтитры в виде предложений со знаками препинания и заглавными буквами. При этом аудиопоток из видео проходит несколько этапов обработки. В первую очередь нейросеть убирает посторонние звуки, выделяет речь и преобразует ее в слова, а другие модели превращают расшифровку в текст. В финале получившийся текст синхронизируется с аудиодорожкой.
Отмечается, что AI-модель, занимающаяся этой работой, допускает на 30 процентов ошибок меньше, чем аналогичные модели генерации субтитров в других сервисах.
Такая технология будет особенно удобна людям с нарушениями слуха, а также когда пользователь не может просматривать ролики со звуком по каким-либо причинам, подчеркнули в пресс-службе компании.
Читайте также
Комментарии (0)