Biblioteca76.869 documentos en línea

Artículo

Optimized Mahalanobis–Taguchi System for High-Dimensional Small Sample Data ClassificationSistema Mahalanobis-Taguchi optimizado para la clasificación de datos de muestras pequeñas de alta dimensión

Resumen

El sistema Mahalanobis-Taguchi (MTS) es una tecnología de diagnóstico y predicción de datos multivariados, que se utiliza ampliamente para optimizar datos de muestras grandes o datos desequilibrados, pero rara vez se utiliza para datos de muestras pequeñas de alta dimensión. En este trabajo, el MTS optimizado para la clasificación de datos de muestras pequeñas de alta dimensión se discute desde dos aspectos, a saber, la inestabilidad de la matriz inversa de la matriz de covarianza y la inestabilidad de la selección de características. En primer lugar, basándose en técnicas de regularización y suavización, este trabajo propone una métrica de Mahalanobis modificada para calcular la distancia de Mahalanobis, cuyo objetivo es reducir la influencia de la inestabilidad de la matriz inversa en condiciones de muestras pequeñas. En segundo lugar, se introduce el algoritmo de mínima redundancia-máxima relevancia (mRMR) en el MTS para el problema de inestabilidad de la selección de características. Utilizando el algoritmo mRMR y la relación señal-ruido (SNR), se propone un método de selección de características en dos etapas: el algoritmo mRMR se utiliza primero para eliminar el ruido y las variables redundantes; a continuación, la tabla ortogonal y la SNR se utilizan para seleccionar la combinación de variables que contribuyen en gran medida a la clasificación. A continuación, se demuestra la viabilidad y simplicidad del MTS optimizado en cinco conjuntos de datos de la base de datos de la UCI. La distancia de Mahalanobis basada en técnicas de regularización y suavización (RS-MD) es más robusta que la distancia de Mahalanobis tradicional. El método de selección de características en dos etapas mejora la eficacia de la selección de características para el MTS. Por último, el MTS optimizado se aplica a la clasificación de correos electrónicos del conjunto de datos Spambase. Los resultados muestran que el MTS optimizado supera al MTS clásico y a los otros 3 algoritmos de aprendizaje automático.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento