El artículo presenta el desarrollo y uso de un algoritmo híbrido de aprendizaje computacional para la tarea de relleno de valores faltantes realizada durante la fase de preparación de datos. En primer lugar, se aborda el problema a resolver, el que está orientado al estudio y análisis de diferentes técnicas para el relleno de valores faltantes, con el fin de proponer una técnica híbrida como producto de esta investigación para dicha tarea y asociarla con la tecnología OLAP (Procesamiento Analítico en Línea). Luego, se justifica la metodología de investigación (científica descriptiva-exploratoria con enfoque experimental) aplicada en este proyecto. Se realizó la revisión de técnicas utilizadas en el relleno de valores faltantes; con base en la verificación de las técnicas y los casos de estudio, se seleccionaron métodos basados en vecindad y redes neuronales artificiales, y se propuso una técnica híbrida (KMediasSom) aplicada a un conjunto de datos sintético y a uno real, provenientes de una aplicación OLAP. En seguida, se plantean las pruebas de análisis y resultados con el fin de precisar su aplicabilidad en cuanto a efectividad y complejidad algorítmica se refiere. Finalmente, se presentan las conclusiones, donde se demostró que la técnica híbrida genera mejores resultados que las técnicas usadas por separado.
INTRODUCCIÓN
El volumen de datos que manejan las organizaciones cada vez es más grande, no sólo porque sus sistemas guardan transacciones más detalladas sino porque actualmente la información histórica también está siendo utilizada como soporte en la toma de decisiones. Para realizar tareas de proyección, las empresas se están valiendo, cada día con mayor frecuencia, de tecnologías de análisis de datos como OLAP o minería de datos. Dentro del tratamiento de datos lo que se denomina limpieza de datos, agrupa tareas como el relleno de valores faltantes que tiene como uno de sus propósitos ayudar en el mejoramiento de la calidad de los datos. Existen diversas técnicas utilizadas para el relleno de valores faltantes, las que se usan dependiendo de algunos factores como la naturaleza de los datos. Asimismo, al verificarse el funcionamiento de las técnicas podría existir la posibilidad de generar una técnica híbrida que produjera mejoras a alguna de ellas y que al realizar la evaluación de indicadores se pudiera establecer la pertinencia de su aplicabilidad, la viabilidad de su implementación y la opción de adaptarla a aplicaciones de tecnología OLAP.
Con este artículo se plantea una técnica híbrida con base en la comparación de técnicas de aprendizaje computacional que suelen ser utilizadas en el relleno de valores faltantes y que puedan enfocarse a aplicaciones OLAP.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Procedimiento jerárquico basado en optimización y simulación para la gestión de vehículos en sistemas automatizados de manufactura
Artículo:
SMELLWARE: un juego para la enseñanza de buenas prácticas en el proceso de desarrollo de software
Artículo:
Un filtro de proyección oblicua generalizado con parámetros flexibles para la supresión de interferencias
Artículo:
Un marco automático que utiliza el procesamiento espacio-temporal y TR-MUSIC para la obtención de imágenes multiobjetivo bajo la superficie y a través de la pared
Artículo:
Selección de mensajes de modo S usando FPGA
Libro:
Metodología del marco lógico para la planificación, el seguimiento y la evaluación de proyectos y programas
Presentación:
Estudio de movimientos y tiempos
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Tesis:
Materiales y prácticas de construcción sostenible