He hablado muchas veces de filtros bayesianos, con el ya célebre ensayo de Paul Graham para combatir el spam, pero hay otras aplicaciones que pueden ser interesantes.
Hace tiempo estuve mirando una de ellas que me pareció muy curiosa: un filtro bayesiano de logs.
Se trata de una prueba del concepto, o más bien que no tiene demasiada utilidad real más que demostrar que es posible. Enseñamos al filtro qué eventos son importantes y eso nos permite procesar los logs para que el programa discrimine lo que a priori no nos interesa.
Me he acordado de btail porque ayer mismo leía como Miguel nos presentaba una pequeña aplicación con filtros bayesianos para clasificar feeds de una forma más o menos automática :).
Además el mismo autor nos habla de otra iniciativa llamada tu periódico que también implementa la idea, aunque el código de Miguel es lo suficientemente simple como para parecerme sexy (está en ruby), así que recomiendo echarle un vistazo rápido.
La verdad es que también soy de la opinión de que entrenar el script puede ser un poco tedioso, pero quizás se pueda realizar algún tipo de educación rápida como se hace con bogofilter. Algo así como pasarle de forma automatizada un conjunto de entradas interesantes y no tan interesantes, lo que nos daría un buen punto de partida al que haríamos correcciones con el uso diario.
Muy interesante. Estaría genial que los lectores de sumarios emplearan estas tecnologías para ayudarnos a lidiar con el problema de la infoxicación que tendemos a sufrir todos cuando seguimos más feeds de los que nuestro tiempo nos permite digerir.

![[xml]](/images/xml.gif)
