Biblioteca73.326 documentos en línea

Artículo

Scalable web data extraction for online market intelligenceExtracción escalable de datos de internet para inteligencia de mercados en línea

Resumen

La inteligencia de mercados en línea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un área de aplicación muy importante para extracción de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnología de extracción de datos. Requieren tareas de navegación y extracción sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extraídos que se originen de varios sitios web y almacenamiento de los datos resultantes en un depósito que permita someterlos a análisis de inteligencia de mercados.

En este artículo los autores muestran cómo Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extracción de datos. Asimismo, se presenta cómo se logró la escalabilidad a través de la computación en la nube. También se exhibe un estudio de caso a partir del mercado de computadores y productos electrónicos.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño:1250 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento