Aunque en esta era de Big Data ha sido más fácil construir grandes conjuntos de datos de rostros mediante la recopilación de imágenes de Internet, el proceso de anotación manual, que consume mucho tiempo, impide a los investigadores construir otros más grandes, lo que hace que la limpieza automática de etiquetas ruidosas sea muy deseable. Sin embargo, la identificación de rostros mal etiquetados por la máquina es bastante desafiante porque la diversidad de las imágenes de la cara de una persona que se capturan salvajemente en todas las edades es extraordinariamente rica. En vista de ello, proponemos un método de limpieza basado en gráficos que emplea principalmente el algoritmo de detección de comunidades y modelos CNN profundos para eliminar las imágenes mal etiquetadas. Como la diversidad de rostros se conserva en múltiples comunidades grandes, nuestros resultados de limpieza tienen tanto una alta limpieza como una rica diversidad de datos. Con nuestro método, limpiamos el amplísimo conjunto de datos de rostros MS-Celeb-1M (aproximadamente 10 millones de imágenes con etiquetas ruidosas) y obtenemos una versión limpia del mismo denominada C-MS-Celeb (6.464.018 imágenes de 94.682 celebridades). Al entrenar un modelo de red única con nuestro conjunto de datos C-MS-Celeb, sin ajuste fino, conseguimos un 99,67
t en la prueba de referencia de reconocimiento facial LFW, que es comparable a otros resultados del estado del arte. Esto demuestra los efectos positivos de la limpieza de datos en el entrenamiento del modelo. Hasta donde sabemos, nuestro C-MS-Celeb es el mayor conjunto de datos limpios de rostros que está disponible públicamente hasta ahora, lo que beneficiará a los investigadores de reconocimiento de rostros.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Nanopartículas de oro huecas cargadas con L-butionina-sulfoximina como nuevo nanomedicamento para la terapia celular del cáncer in vitro
Artículo:
Crecimiento catalizado por oro de nanorods de óxido de zinc dopados con aluminio mediante el método de sputtering
Artículo:
Estimación de datos y canales ciegos mediante la optimización de enjambre de partículas mutantes basada en el aprendizaje opuesto potenciado por la lógica difusa
Video:
Seminario web: Preparación de datos de imágenes diagnosticas para aprendizaje automático por Martin Willemink
Artículo:
Predicción de los parámetros geológicos durante la excavación de un túnel mediante el análisis de series temporales de datos in situ
Libro:
Metodología del marco lógico para la planificación, el seguimiento y la evaluación de proyectos y programas
Presentación:
Estudio de movimientos y tiempos
Tesis:
Materiales y prácticas de construcción sostenible
Artículo:
Emisiones globales de gases de efecto invernadero provenientes de materiales de construcción residencial y comercial: estrategias de mitigación para 2060