Para subsanar la deficiencia del algoritmo fuzzy c-means (FCM) de tener que conocer de antemano el número de conglomerados, este artículo propone un nuevo método autoadaptativo para determinar el número óptimo de conglomerados. En primer lugar, se propuso un algoritmo basado en la densidad. El algoritmo, de acuerdo con las características del conjunto de datos, determinó automáticamente el posible número máximo de clusters en lugar de utilizar la regla empírica n y obtuvo los centroides de clusters iniciales óptimos, mejorando la limitación del FCM de que los centroides de clusters seleccionados aleatoriamente llevan el resultado de convergencia al mínimo local. En segundo lugar, este trabajo, introduciendo una función de penalización, propuso un nuevo índice de validez de clustering difuso basado en la compacidad y la separación difusas, que aseguraba que cuando el número de clusters rozaba el de objetos en el conjunto de datos, el valor del índice de validez de clustering no disminuía monotónicamente y se acercaba a cero, de modo que el número óptimo de clusters perdía robustez y función de decisión. A continuación, basándose en estos estudios, se propuso un algoritmo FCM autoadaptativo para estimar el número óptimo de conglomerados mediante el proceso iterativo de prueba y error. Por último, se realizaron experimentos con los conjuntos de datos de la UCI, la Copa KDD 1999 y conjuntos de datos sintéticos, que demostraron que el método no sólo determinaba eficazmente el número óptimo de clusters, sino que también reducía la iteración de FCM con el resultado de clustering estable.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Localización de nodos Monte Carlo basada en la optimización mejorada de QUARTE
Artículo:
Aprendizaje de campo de batalla en línea habilitado por gemelos digitales con conjuntos finitos aleatorios
Artículo:
Agroecología vs biotecnología : consideraciones sobre la polémica
Artículo:
Reconocimiento de acciones deportivas basado en la red neuronal GB-BP y el análisis de Big Data
Artículo:
Incorporación de películas nanohíbridas de sílice en una matriz de poliestireno reciclado
Folleto:
Análisis de rentabilidad económica y financiera
Artículo:
Emisiones globales de gases de efecto invernadero provenientes de materiales de construcción residencial y comercial: estrategias de mitigación para 2060
Guía:
Manual de operaciones de destilación
Artículo:
¿Por qué debemos conservar la fauna silvestre?