Ficha técnica

155 | 3

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Este artículo presenta una característica basada en estadísticas de palabras desconocidas (fuera del vocabulario) quecomplementa las fuentes de información usadas en la decisión por parte de los filtros anti-spam actuales. Los experimentosincluyeron filtros anti-spam disponibles libremente como referencia: SpamAssassin, Bogofilter, SpamBayes y SpamProbe,así como también un clasificador puramente bayesiano. Los resultados muestran que la decisión basada en la característicapropuesta mejora el rendimiento de todos los filtros anti-spam sujetos a estudio.

INTRODUCCIÓN

El correo electrónico comercial no solicitado, comúnmente conocido como spam, sigue siendo un problema importante para los usuarios de Internet. Los principales efectos molestos del spam son la disminución de la productividad de los empleados, el desperdicio de un valioso espacio de almacenamiento en los servidores de correo, el perjuicio para el tráfico de Internet y el aumento de la posible pérdida de información en función de las políticas de filtrado. Por ejemplo, los autores de este trabajo estuvieron a punto de perder un correo electrónico de aceptación de trabajos debido a los filtros de spam.

Según varias fuentes de información, como Softscan [1] o Marshal [2], más del 90% del tráfico de correo electrónico es spam, con un índice de volumen creciente durante los últimos años. Los mayores porcentajes proceden de Europa y Asia (65% según las estadísticas de Marshal), seguidos de Norteamérica (18%).

Los spammers utilizan la estrategia de enviar una gran cantidad de correos electrónicos prácticamente sin coste, con un alto beneficio probable. Si un spammer obtiene tan sólo 100 respuestas por cada 1.000.000 de mensajes de correo electrónico, puede obtener un atractivo beneficio. Para más detalles, puede leer "Inside the SPAM Cartel: Trade Secrets From the Dark Side" [3].

En la literatura encontramos dos tendencias principales sobre técnicas de filtrado de spam: enfoques basados en reglas y en el aprendizaje [4-10].

Los filtros de spam basados en reglas analizan tanto la cabecera como el cuerpo de los mensajes de correo electrónico en busca de contenido sospechoso. Cada regla activada suma una puntuación al correo electrónico. Si la puntuación alcanza un valor umbral, el correo electrónico se clasifica como spam.

Las reglas abarcan diferentes amenazas, como el formato sospechoso (las partes de HTML y de texto son diferentes o el cuerpo del mensaje tiene entre un 80 y un 90% de líneas en blanco), un origen débil propenso a enviar spam (el remitente es un relé abierto confirmado o el remitente es un proxy abierto), palabras comunes en el spam (contiene una versión enmascarada de cialis o viagra), codificaciones o caracteres ilegales (demasiados caracteres ilegales en bruto en el asunto), etc [11].

Autor:Tulli, Juan Carlos Bonadero, Juan Carlos Liberatori, Monica Castiñeira Moreira, Jorge Agüero, Pablo Daniel.
Categoría:Ciencias naturales y subdisciplinas
Subcategoría:Matemáticas
Año de publicación:2009.
Editor:Universidad de Tarapacá

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño:146 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Improving the performance of anti-spam filters using out-of-vocabulary statistics

DC.Title.eng

Mejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

DC.Creator

Tulli, Juan Carlos Bonadero, Juan Carlos Liberatori, Monica Castiñeira Moreira, Jorge Agüero, Pablo Daniel

DC.Subject.snpi.spa

Gestión de información Estadística Vocabularios

DC.Subject.snpi.eng

Information management Statistics Vocabularies

DC.Subject.spa

Spam, filtrado, palabras desconocidas.

DC.Subject.eng

Spam, filtering, out-of-vocabulary.

DC.Description.spa

INTRODUCCIÓN

En la literatura encontramos dos tendencias principales sobre técnicas de filtrado de spam: enfoques basados en reglas y en el aprendizaje [4-10].

DC.Source

https://www.ingeniare.cl/index.php?option=com_ingeniare&view=d&doc=66/art12.pdf&aid=168&vid=66&lang=es

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/mejora-del-desempe-o-de-filtros-anti-spam-usando-estad-sticas-de-palabras-fuera-de-vocabulario

DC.Identifier.issn-isbn

ISSN:0718-3305 (Versión electrónica); 0718-3291 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Diciembre 2009, Ingeniare. Revista chilena de ingeniería Vol. 17 Núm. 3

DC.Language

Inglés

DC.Relation

DC.Publisher

Universidad de Tarapacá

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2009

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

47695.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Biblioteca76.869 documentos en línea

Ficha técnica

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Vehículos y almacenes automatizados

Transporte y contaminación

Introducción al movimiento pendular

Evaporación por lotes

Medición de caudales

La miel

Pista de juego de proporciones

Videos

Webinar: Minería de datos de desarrollo para comprender y mejorar los procesos de ingeniería de software

Pruebas en túnel de viento de un mecanismo de control de potencia en microaerogeneradores sometidos a sobrevelocidades de viento

Milirrobots biomiméticos

Resiliencia ecológica: ¿concepto significativo para la regulación de recuperación?

Relleno Sanitario Ecológico en la Ciudad de Medellin TvAgro por Juan Gonzalo Angel

Comentarios respecto a la situación actual de la maca y la quinua en el Perú

WEBINAR:

Documentos más descargados

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca76.869 documentos en línea

Ficha técnica

Improving the performance of anti-spam filters using out-of-vocabulary statisticsMejora del desempeño de filtros anti-spam usando estadísticas de palabras fuera de vocabulario

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Vehículos y almacenes automatizados

Transporte y contaminación

Introducción al movimiento pendular

Evaporación por lotes

Medición de caudales

La miel

Pista de juego de proporciones

Videos

Webinar: Minería de datos de desarrollo para comprender y mejorar los procesos de ingeniería de software

Pruebas en túnel de viento de un mecanismo de control de potencia en microaerogeneradores sometidos a sobrevelocidades de viento

Milirrobots biomiméticos

Resiliencia ecológica: ¿concepto significativo para la regulación de recuperación?

Relleno Sanitario Ecológico en la Ciudad de Medellin TvAgro por Juan Gonzalo Angel

Comentarios respecto a la situación actual de la maca y la quinua en el Perú

WEBINAR:

Documentos más descargados

2024-02-15Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil