Студенты НГТУ НЭТИ создают высокоскоростное приложение для транскрибации аудио

На базе Новосибирского государственного технического университета НЭТИ ведётся разработка нового программного обеспечения, способного в кратчайшие сроки преобразовывать аудиофайлы в текст. Инициативу реализуют студенты вуза, объединившие усилия для создания инновационного инструмента, предназначенного для быстрой и точной транскрибации аудиоконтента — от подкастов и лекций до интервью и медиаматериалов.

Разработка направлена на решение актуальной задачи: автоматизации расшифровки аудиоинформации, которая востребована в образовательной и медийной среде. Представители вуза сообщили, что на сегодняшний день программное обеспечение уже демонстрирует впечатляющие результаты. Один из студентов, участвующих в проекте, отметил, что двухчасовой аудиофайл система способна обработать всего за одну минуту, что на порядок быстрее, чем при использовании большинства доступных на рынке решений.

В пресс-службе НГТУ НЭТИ уточнили, что новая программа может стать особенно полезной для преподавателей, которые получают возможность быстро готовить текстовые версии своих лекций, для студентов, нуждающихся в структурировании учебного материала, а также для журналистов и представителей медиаиндустрии, которым важно оперативно работать с большими объемами интервью и речевых записей. Ожидается, что благодаря такому инструменту существенно сократится время на подготовку текстовых публикаций и научных материалов.

Разработка ведётся с опорой на современные технологии машинного обучения и обработки естественного языка. Проект получил поддержку университета в рамках программы поощрения студенческих ИТ-инициатив, а также вызвал интерес у ряда потенциальных партнеров, рассматривающих возможность внедрения технологии в корпоративную среду. Сейчас команда работает над улучшением качества распознавания речи и расширением языковой базы. В перспективе создатели планируют интеграцию сервиса в облачные платформы и расширение функциональности — в том числе за счёт внедрения системы автоматического перевода.