Extracción de características basada en NMF para la clasificación de especies de aves usando señales de audio

Loading...
Thumbnail Image
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Católica San Pablo
Abstract
Habitualmente para sistemas de clasificación de audio, por ejemplo, para la clasificación acústica de especies de aves, las técnicas de parametrización basadas en los Coeficientes Cepstrales a escala de Frecuencias Mel (MFCC) se usan en la fase de extracción de características. Sin embargo, sucede que aunque esta técnica proporciona buenos resultados, no es muy adecuada, ya que fue creada para el reconocimiento automático de la voz humana (ASR). En esta tesis de grado, se busca mejorar el proceso de extracción de características mediante una nueva parametrización utilizando el método basado en la Factorización de Matrices No Negativas (NMF), específicamente en la mejora del banco de filtros convencional a escala Mel, utilizado para obtener los coeficientes cepstrales. NMF ha demostrado ser una herramienta fundamental para la representación de señales de audio. Los resultados experimentales han demostrado que el aprendizaje del banco de filtros auditivo basado en la técnica NMF, en comparación con el banco de filtros a escala Mel, proporciona mejores tasas de clasificación, considerando un esquema de clasificación basado en la Máquina de Vectores de Soporte (SVM).
Description
Citation
Collections