Открытие новых возможностей в аудиоаналитике: Сервис KSA от МТУСИ
В научно-исследовательском отделе разработки прикладного и системного программного обеспечения под руководством Мкртчяна Грача Маратовича был разработан сервис KSA - Keyword spotting application.
Keyword spotting (распознавание ключевых слов) в аудиоаналитике - это технология, которая позволяет автоматически находить и извлекать ключевые слова из аудио-материалов. Данная разработка может применяться в различных областях: безопасность, медицина, производство и реклама. Keyword spotting может помочь в обеспечении безопасности на производстве путем автоматического мониторинга аудиопотоков на предмет ключевых слов, связанных с опасными ситуациями или небезопасными действиями. При обнаружении таких ключевых слов система автоматически отправляет предупреждения на мониторы безопасности или к другим ответственным лицам на производстве. Это позволяет оперативно реагировать на возможные угрозы и принимать меры для предотвращения возможных несчастных случаев. Кроме того, система может использоваться для голосового управления техникой и решения широкого спектра технических задач.
В системе используются такие методы машинного обучения, как транслируемые сверточные сети последнего поколения BC-Resnet. Данные модели в текущий момент являются одними из лидеров в показателях точности в задаче KWS (Keyword spotting) в бенчмарке Google Speech Command. Модель, используемая в данном сервисе, обучена на специально собранном DataSet и имеет точность 91.86% по метрике ROC-AUC.
Развитие данной системы крайне важно, поскольку она улучшает эффективность и точности анализа данных. Это помогает сократить время и ресурсы, затрачиваемые на ручной анализ, и повысить качество получаемых результатов. Более точные и эффективные системы могут существенно повысить безопасность и качество жизни людей в различных областях.