Los datos utilizados provienen todos de documentos de la Oficina Nacional de Estadísticas e Información de Cuba (ONEI).
Las cifras por provincia relativas al color de la piel se obtuvieron del reporte El Color de la Piel según
el Censo de Población y Vivienda de 2012. Los datos relativos a la población rural fueron obtenidos del
Anuario Estadístico de Cuba 2017 publicado en 2018. Los números por provincia sobre salario medio,
migración interna
y relación de dependencia por la edad se obtuvieron de los distintos Anuarios Provinciales de 2016.
La relación de dependencia por la edad indica, aproximadamente, la carga o presión sobre los recursos laborales de un territorio
o dado y su tendencia está asociada al proceso de envejecimiento poblacional. Esta se calcula, para una región, dividiendo el número de habitantes
de 0 a 14 años más los de 60 años o más entre los de 15 a 59. Con está fórmula se calcularon los valores de dependencia por la edad para
Holguín y Granma pues no aparecían en sus repespectivos anuarios provinciales.
Se añadió como criterio, a la hora de determinar los grupos, si se incluía o no a los municipios de La Habana. Esto se decidió por las
diferencias obvias que posee la capital con respecto al resto del país. De esta manera, se pueden hacer los análisis teniendo en cuenta o no
a los municipios capitalinos.
Para determinar los grupos de municipios, según los criterios especificados, se utilizaron dos algoritmos de clasificación no supervisada.
MeanShift para clasificar en grupos automáticamente y
KMeans
para segmentar en tres grupos. Los grupos, para cada combinación posible, fueron precalculados y estructurados en un fichero JSON. Para
precalcularlos se utilizó Python y las implementaciones de los algoritmos mencionados que provee Scikit-Learn. Asímismo, como existían
diferencias de escalas entre los distintos indicadores, cuando se determinaron grupos en base a dos de ellos fue necesario, para obtener
mejores resultados, llevarlos a una misma escala. Para ello se utilizó la implementación de RobustScaler también presente en Scikit-Learn.
Con Scikit-Learn, también fueron calculados los centroides de los grupos obtenidos en los distintos
agrupamientos. Estos centroides se pueden considerar como el valor o conjunto de valores centrales o característicos de
cada grupo.
En la implementación de la herramienta se utilizó Leaflet para el trabajo con los mapas,
C3JS para las gráficas y Tablesorter para
las tablas interactivas. Esto fue programado en directamente en Javascript utilizando JQuery.
Para la historia sonora se utilizó Soundcloud para la reproducción del audio y su Widget API para realizar las interacciones con la herramienta
en funcion del contenido del audio. Todo ello también fue programado directamente en Javascript utilizando JQuery.
Volver a explorar