Sábado, 28 de octubre de 2006
Una nueva clase de spam
No sé si les ha llegado ya algún mensaje del siguiente género: una lista de palabras que no forman frases coherentes (generalmente ordenadas alfabéticamente) pero que son relativamente comunes y muy utilizadas en el vocabulario de la Web. Por ejemplo a mí me llegó un mensaje que dice "Nifty or upscaler Worlds is a podcast handson special debate".
La explicación a estos mensajes es interesante. Hace ya mucho tiempo quedó claro que la mejor manera de filtrar spam es analizar el vocabulario que usa el mensaje. Las notas que hace sobre esto Paul Graham son formidables "el spam tiene la obligación de vender u ofrecer algo, y ese es su talón de Aquiles: que usa siempre el lenguaje propio de vender u ofrecer algo." Entonces los filtros antispam (los más efectivos) están basados en evaluar cuántas palabras dentro de un determinado mensaje son "típicas de un mensaje de ventas" y cuántas son "típicas de cualquier otra clase de conversación" (por ejemplo, es muy difícil que un mensaje de spam contenga la palabra "furioso" o "piedad"). Hasta ahí, la batalla estaba ganada (todos los que usamos Gmail lo sabemos).
Sin embargo, a los spammers se les ocurrió algo nuevo: crear mensajes con palabras al azar, particularmente palabras no relacionadas con ventas (ver el ejemplo en el primer párrafo). ¿Entonces cómo venden, cómo transmiten su mensaje? ¡Con una imagen (un gif) adjunto que contiene el texto de la propaganda/engaño/etc!
El problema del spam deja de estar resuelto y nos propone una nueva frontera: ¿machine vision...?, ¿mayor control legal internacional? Creo que la temática más que interesante es uno de esos accidentales motores de las revoluciones.
Por: Ignacio Nicolás Rodríguez | Tecnología | Comentarios (0) | Referencias (0)
Comentarios
Comentar




