Público
Público

Un filtro para frenar la estupidez

Crean un programa para bloquear mensajes ‘tontos' en web, foros y blog

MIGUEL ÁNGEL CRIADO

Si hay programas que combaten los virus informáticos o el correo basura, ¿por qué no hacer un filtro que bloquee los comentarios estúpidos, irrelevantes e impertinentes que se hacen en blog, foros y noticias? Esa es la pregunta que se hicieron los dos jóvenes de Albuquerque (EEUU) que han creado crear Stupid Filter.

Gabriel Ortiz y Paul Starr se han propuesto diseñar un sistema que filtre los mensajes que llegan a las páginas web y que, antes que facilitar la comunicación, sólo crean ruido. Para ello, se han fijado en la forma de trabajar de los programas anti spam que usan los proveedores de acceso o se instalan en los servidores de correo electrónico.

Para detectar el correo basura, recurren a elementos de la teoría de probabilidad (como el teorema de Bayes ). Su objetivo es detectar palabras o signos que se repiten en los diferentes correos y establecer un patrón para diferenciar un mensaje pertinente del que no lo es.

Cuidado de las formas

La versión en pruebas de Stupid Filter analiza la forma, no el contenido del comentario, y la compara con una base de datos antes de calificarlo de estúpido. Ortiz y Starr, con la ayuda de centenares de voluntarios que se han apuntado al proyecto, han recopilado mensajes de foros, blogs y sitios populares como Youtube, donde los usuarios dejan comentarios. Han creado así un archivo de la estupidez en la Red.

Ellos mismos explican en la web del proyecto como funciona: 'Igual que se programa cómo reconocer el spam, nosotros miramos lo que caracteriza a la estupidez y asignamos un valor diferente basado en las veces que se repite en los ejemplos de comentarios idiotas que seleccionamos'.

El derroche de faltas de ortografía, el abuso de las mayúsculas, la abundancia de signos de exclamación o las recurrentes onomatopeyas del tipo de ‘JAJAJAJA' (el acrónimo LOL, en inglés) hacen que el comentario tenga todas las papeletas para ser catalogado como estúpido, y bloqueado.

Versión en español

Ortiz explica porqué es necesario Stupid Filter. 'La avalancha de contenido y usuarios ha hecho que la relación entre señal y ruido en Internet haya bajado, y la moderación humana es imposible, dada la escala del problema'. Insiste en recordar que lo suyo es el rigor formal del mensaje, no en su contenido. 'Para eso necesitaríamos sistemas de inteligencia artificial', que no existen.

En una entrevista anterior concedida a un medio estadounidense, Starr (el otro creador del programa) explica que la forma 'está íntimamente ligada al contenido; el cómo te expresas afecta a las conclusiones de lo que expresas'.

¿Habrá versión en español? A Ortiz le gustaría. 'Pero dependerá de la demanda, si hay suficientes interesados, lo haremos'.

El programa ya se puede descargar de su web. Es una versión alpha (muy básica e inicial) que puede cometer errores de clasificación.
La base de datos de Stupid Filter ya cuenta con varios miles de palabras y expresiones en su ‘lista negra'.

Los dos elementos básicos con los que trabaja el programa son un clasificador Bayes simple (que se basa en la frecuencia con la que aparece una palabra en un texto) y el discriminador CRM114 (un programa usado para el reconocimiento de correo basura que analiza cadenas de hasta cinco palabras).

Los responsables de la página web sólo tienen que descargar el programa e instalar una copia de CRM114.

En la página del proyecto hay una versión web para probar el programa antes de instalarlo. También tienen un generador de ejemplos de comentarios estúpidos.

El programa tiene varios niveles de filtrado, midiendo la estupidez en grados. La escala tiene cinco puntos. Cero se corresponde con un comentario pertinente, siendo cinco, lo más tonto. 

¿Te ha resultado interesante esta noticia?