Combatiendo el SPAM

De un tiempo a esta parte, poco a poco, y gracias a la confianza que muchos de vosotros habéis ido depositando en esta nuestra comunidad, OboLog ha crecido mucho más de lo que hubiera podido imaginar: Más de 400 blogs creados, casi 200.000 usuarios únicos, sobre 1 millón de páginas vistas durante este mes pasado, y unos cuantos miles de páginas indexadas en Google , muy bien indexadas , por cierto, para determinadas búsquedas.

Aparte de confirmar que finalmente OboLog es una herramienta útil de comunicación para un montón de personas, cosa que me enorgullece enormemente _no podéis ni imaginaros cuánto :')_ también significa que los blogs de OboLog han empezado a ser atractivos para cierto tipo de individuos y empresas, que ven en ellos un lugar perfecto para lanzar ataques masivos de SPAM y llegar a la mayor cantidad de gente posible.

Si tu eres de los que tiene un blog alojado con nosotros, sabrás de lo que hablo: Anuncios de viagra, largas ristras de enlaces, mensajes absurdos y cortos seguidos de publicidad... La intensidad de comentarios de SPAM estaba llegando a unos límites incontrolables a través de la revisión manual diaria, y resultaba especialmente molesta al ensuciar las conversaciones y llenar los buzones de avisos falsos.

Durante el último mes hemos ido aplicando progresivamente varias medidas para automatizar, en la medida de lo posible, el filtrado de este tipo de mensajes.

Las más relevantes:

  1. Filtrado de comentarios a través de listas negras: de emails, de dominios, de IPs y de palabras. Esto consigue filtrar la mayor parte del spam, aunque sólo en un primer momento. Los spammers, o las aplicaciones que usan, aprenden rápido qué es lo que funciona y qué es lo que no, y pueden generar pequeñas variaciones en los contenidos que envían para saltarse las protecciones.

  2. Marcas de moderación: de manera similar al punto anterior, a través de una serie de patrones y una lista algo más agresiva, se permite que entren determinados mensajes, pero quedan marcados como "sospechosos". Podéis ver y moderar esos mensajes desde vuestro panel de control. Mensajes >> Comentarios Sospechosos

  3. Captcha: A través de una pregunta sencilla en el formulario de comentario, intentamos asegurarnos de que realmente hay una persona escribiendo. Normalmente los captchas consisten en una imagen que contiene una serie de letras distorsionadas, que una aplicación de reconocimiento de texto automático sería _en principio_ incapaz de descifrar, pero que una persona sí podría identificar.
    Lo que suele pasar con estos sistemas es que, en ocasiones, ni una persona es capaz de saber qué letras se estan mostrando en esos galimatías. Para nuestro caso opté por una solución algo más simple, realizar una pregunta acerca de una operación matemática sencilla, incrustada en una imagen. Es simple y no está sujeto al idioma o la cultura de la persona que quiera dejar su comentario.

Queda por ver la efectividad real de estas herramientas combinadas. No querría que este tipo de cosas pudieran entorpecer el normal funcionamiento de vuestros blogs, así que os agradeceré cualquier comentario, apunte o sugerencia al respecto. Maldito SPAM, verdad? Indeciso

Actualización ( 03/06/2006 ):

Debido a una configuración excesivamente severa en el filtro antispam que implementamos durante el día 1 de Junio, se perdieron algunos comentarios en varios blogs. Ayer recuperamos la mayoría de ellos desde la copia de seguridad de la mañana del propio día 1. De todas formas, es posible que se perdiera alguno de los comentarios nuevos realizado entre las 11h y las 23h del día 1.

Si es vuestro caso, os pido disculpas por el error técnico. Triste