ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Мэл-частотные кепстральные коэффициентыДанный метод извлечения признаков является одним из самых распространённых как в системах распознавания дикторов, так и в системах распознавания речи. На вход алгоритма подаётся последовательность отсчётов участка сигнала, исследуемого на данной итерации, x0,..., xN-1. К данной последовательности применяется весовая функция и затем дискретное преобразование Фурье. Весовая функция используется для уменьшения искажений в Фурье анализе, вызванных конечностью выборки. На практике в качестве весовой функции часто используется окно Хэммига, которое имеет следующий вид:
где N — длина окна, выраженная в отсчётах. Тогда дискретное преобразование Фурье взвешенного сигнала можно записать в виде
Значения индексов k соответствуют частотам
Математические структуры и моделирование. 2011. Вып. 24. 45 где Fs — частота дискретизации сигнала. Полученное представление сигнала в частотной области разбивают на диапазоны с помощью банка (гребёнки) треугольных фильтров. Границы фильтров рассчитывают в шкале мэл. Данная шкала является результатом исследований по способности человеческого уха к восприятию звуков на различных частотах. Перевод в мэл-частотную область осуществляют по формуле Обратное преобразование выражается как Пусть NFB — количество фильтров (обычно используют порядка 24 фильтров), (flow, fhigh) — исследуемый диапазон частот. Тогда данный диапазон переводят в шкалу мэл, разбивают на NFB равномерно распределённых перекрывающихся диапазона и вычисляют соответствующие границы в области линейных частот. Обозначим через Hm,k — весовые коэффициенты полученных фильтров. Фильтры применяются к квадратам модулей коэффициентов преобразования Фурье. Полученные значения логарифмируются Заключительным этапом в вычислении MFCC коэффициентов является дискретное косинусное преобразование Коэффициент с0 не используется, так как представляет энергию сигнала. Количество коэффициентов NMFCC на практике выбирают порядка 12. Не нашли, что искали? Воспользуйтесь поиском:
|