Open Refine, también conocido como Google Refine, es el software aliado de los periodistas que trabajan con bases de datos para limpiar las informaciones que les entregan en formatos abiertos. Al pasar los datos por Refine, los periodistas se aseguran de que no haya erratas: errores de tipeo, por ejemplo, en los nombres de ciudades (en vez de Barranquilla, Barranquillla y al sumar el número de subsidios dados por el Distrito contaríamos 32 y no 33 por cuenta de la l que sobra) o celdas que el sistema no reconoce como campos numéricos debido a separaciones de decimales y millares mal colocadas. Las operaciones en este caso tampoco darían cifras precisas al ignorarse esas cantidades sin el formato adecuado.
Open Refine además es una herramienta que sirve para dar un primer vistazo a los datos y comenzar a obtener a través de las facetas que permite hacer, es decir, grupos de elementos bajo ciertas características, informaciones que nos dan pistas de las noticias escondidas en ese océano de cifras. Continue reading →