En esta primera parte: rasgado de información, formato de los datos en hoja de cálculo y subida de la tabla final a Fusion Tables.
Por @Tatta25
Sin ser aún una experta en el manejo de Fusion Tables, servicio gratuito de Google que permite la personalización de mapas, comparto el ‘paso a paso’ del primer proyecto que creé con esta herramienta. El proceso, como todo trabajo periodístico, se inició con la recolección y verificación de datos. Le siguió luego la estructuración de la información en una hoja de cálculo y el montaje con las configuraciones estéticas necesarias hasta lograr una visualización publicable.
El mapa hizo parte del módulo de Visualización, del máster en Periodismo de Investigación, Datos y Visualización que curso en Madrid desde octubre pasado, y hace un recorrido por los accidentes e incidentes aéreos ocurridos en España entre 1933 y 2013. Después de cuatro días de trabajo, el resultado final fue este:
¿Cómo comenzó el proceso?
Encontrar las fuentes y contrastar los datos para alimentar con ellos una hoja de cálculo en programas como Excel, Numbers, Open Office o alguno similar fue la primera tarea. En este caso, los accidentes e incidentes aéreos procedieron del sitio web Aviation Safety Database, en el apartado geográfico de país. Para lograr ese conjunto informativo en un archivo reutilizable como el .csv utilicé la extensión de Google Chrome Data Miner, que me permitió rasgar la información de la web [scraping en inglés] y visualizarla en Excel. La aplicación permite visualizar los datos en cualquier otro programa de hojas de cálculo, como los antes mencionados, o en la nube con Google Spreadsheet.
1. Después de haber instalado la aplicación inicié el scraping seleccionando la información en el sitio web de Aviation Safety Database. Di clic derecho sobre la selección y luego clic en Data Miner – Get Similar.
2. La información aparecerió configurada como una tabla y con la posibilidad de descargarla.
3. Una vez descargada en formato .csv, los datos se mostraron desorganizados en una hoja de cálculo de Excel, como se ve en la imagen siguiente. Para poder visualizar la información adecuadamente hice los siguientes seis pasos:

(Tres primeras imágenes, de izquierda a derecha)
(1.) Al abrirse por defecto los datos descargados en .csv en Excel y aparecer desorganizados, (2.) debe darse ‘Guardar como’ manteniendo el formato csv. (3.) Guardada la información, se cierra ese archivo y se abre un nuevo documento en Excel. Se da clic en el menú ‘Datos’ y luego en ‘Desde texto’. Se desplegará una ventana como la de la tercera imagen y se seleccionará la opción ‘Delimitados’. Debe escogerse en ‘Origen del archivo’ la opción Unicode UTF8 para evitar que la información salga con tildes mal puestas o caracteres inválidos como Mar#ia en vez de María.
(Tres imágenes de abajo, de izquierda a derecha)
(4.) Al dar clic en ‘Siguiente’ se seleccionará la opción ‘Coma’ para que aparezca la información organizada en columnas. (5.) En el paso siguiente se dejará seleccionado el formato ‘General’ del texto y al dar clic otra vez en ‘Siguiente’, el sistema preguntará desde qué ubicación de la hoja de cálculo se querrá colocar la información. (6.) Al darle ‘Aceptar’ a la ubicación preestablecida, es decir, columna A – celda 1, aparecerá la tabla adecuadamente visualizada.
4. La información ahora está legible y divida en sus respectivas columnas. En este primer rasgado los datos se visualizaron en la hoja de cálculo sin cabecera, es decir, sin una primera fila que especificara a qué correspondía cada columna, además determinados datos no aparecieron colocados en sus respectivas celdas sino pegados junto a otros en una misma celda. El primer problema lo solucioné poniéndole la cabecera a la tabla [se agrega una fila y se coloca en cada una de sus celdas, según corresponda, los nombres, en este caso, ‘fecha’, ‘aerolínea’, ‘tipo de accidente’, ‘muertos’, etc]. El segundo problema, poniendo cada dato en su correspondiente celda.
5. Como el resto de la información de accidentes aparecía en una segunda página del sitio web Aviation Safety Database, volví a repetir todos los pasos anteriores, es decir, una vez más rasgué los datos con Data Miner, les di el formato adecuado para visualizarlos sin problemas en Excel y finalmente los uní con los primeros que descargué.
La tabla la seguí alimentando para que tuviera más valor periodístico. ¿Cómo? Agregándole más datos y quitando lo que fuera necesario. Para obtener más datos y corroborar la autenticidad de los mismos, recurrí a otras bases de datos y a archivos de prensa, especialmente aquellos que detallaban los accidentes de aviación más fatídicos. Este proceso de limpieza lo hice directamente en Excel, pero me tomó un poco más del tiempo que me hubiera tomado realizarlo con Open Refine, programa especializado en limpieza de datos. Mi tabla final terminó luciendo así: [La base de datos puede descargarse]
6. Al estar satisfecha con los datos obtenidos, abrí Google Drive para iniciar el montaje del mapa en Fusion Tables. Para subir la base de datos debe darse clic en Create, Google Fusion Table. Si no está la app entre el menú de opciones, entonces debe darse clic en Conect more apps, en la parte inferior del menú que se despliega al dar clic en Create. Se escribe en el buscador Fusion Tables y se da clic para que la aplicación quede conectada con el Drive. En adelante, cada vez que queramos crear un documento aparecerá Fusion Table junto a Document, Spreadsheet o Form.
7. Seleccionada la opción Create, Fusion Table, se despliega una nueva ventana que pide la ubicación de la hoja de cálculo de la que se obtendrán los datos para crear el mapa. En este caso, como no estaba aún subida a Google Spreadsheet sino alojada en mi PC, di clic en Choose file from this computer.
8. En la siguiente ventana el sistema pregunta en qué fila están los nombres de las columnas. Por defecto sugiere ‘1’ y como ya en el Excel se habían colocado los nombres en la primera fila entonces se deja la opción ‘1’. Al corroborar que Google ha identificado de manera correcta la ubicación de los nombres de cada columna se da clic en ‘Siguiente’.
9. En esta nueva ventana, Google pedirá información para terminar de configurar la tabla con nuestros datos: nombre, en este caso Base completa de accidentes aéreos; si permitiremos que sea descargable o no una vez esté publicada. Lo mejor es decir que sí en aras de contribuir con la cultura de open data y de libre distribución; la fuente a la que se le atribuyen los datos, Aviation Safety Network en este ejemplo; el sitio web de donde se obtuvieron los datos y la descripción de dicha información.
10. Se da clic en Finish. De esta manera nuestro set de datos está alojado en Google Fusion Tables y deben aparecernos como se muestran a continuación:
Ahora estamos listos para comenzar a configurar nuestro mapa.
En la segunda parte de este tutorial: geolocalización de la información, configuración de los iconos de visualización y distribución de la información por colores.
AMIGO ME GUSTARÍA SABER COMO ES QUE PONES EL ICONO DEL AVIÓN. YO ESTOY HACIENDO UN PROYECTO PARECIDO PERO NO PUEDO AGREGAR ICONOS DIFERENTES SOLO LO QUE VIENEN POR DEFAULT EN GOOGLE FUSION