La base de datos de ETECSA
Por Saimi Reyes
Una base de datos es el punto de partida
Foto: Yudivián Almeida

Hace poco tiempo comenzó a difundirse en la Isla una nueva versión -la cuarta, según nuestra cuenta- de la conocida Base de Datos de ETECSA. Se trata de una especie de guía telefónica informal que no solo contiene los números fijos, habituales en esas publicaciones, sino que también muestra los números de celulares de todos los usuarios registrados en la única compañía telefónica del país: la Empresa de Telecomunicaciones de Cuba (ETECSA), lo que resulta un problema evidente de violación de la privacidad.

La Base ETECSA 2016, no es tal, pues los números registrados desde enero de este año y hasta la fecha no aparecen, pero está bastante actualizada, porque contiene información que fue registrada hasta diciembre de 2015. Los datos que almacena la base son los nombres, apellidos, dirección, número de carné de identidad (CI), y, por supuesto, los números de teléfono de todos los que han sido registrados.

Si se estudiara esta información, se podrían responder -con valor estadístico- interrogantes como ¿cuál es el nombre más usado entre las mujeres de Cuba? o ¿en qué mes son más frecuentes los nacimientos? Las otras fuentes posibles para obtener respuestas a las misma preguntas, no son públicas, así que decidimos intentarlo, pero sin compartir en ningún momento en nuestro sitio la Base de Datos de ETECSA, por cuestiones obvias de privacidad.

Para analizar la Base de ETECSA, se extrajo la información correspondiente a los usuarios de la telefonía móvil. Esto se debe a que la manera en que se registraron esos datos no resulta uniforme y, a diferencia de los números de celulares, los de teléfonos fijos tienen menos contenidos asignados.

De esta forma, se acumularon los datos de alrededor de 3 700 000 clientes de la telefonía móvil, y de ellos se trabajó únicamente con las entradas que contenían datos de identidad válidos, verificados a partir del número de Carné de Identidad (CI). Se eliminaron todos los contactos cuyo número de identidad estaba repetido, pues se asumió que se trataba de la misma persona con dos celulares registrados y se desecharon los usuarios con este en blanco, por considerar que se trataba de teléfonos pertenecientes a empresas estatales, o similares.

Se reunieron en total los datos de 3 106 933 personas, lo que representa alrededor del 30% de los habitantes de la Isla. Toda la información está referida a mayores de 18 años, porque ETECSA no permite que los menores de esa edad contraten sus servicios de telefonía móvil.

Como el penúltimo dígito del número de identidad corresponde en Cuba a la asignación del género -si la cifra es par se trata de un hombre y si es impar la persona es mujer, se pudo conocer en qué medida los hombres y las mujeres de la Isla utilizan celulares. A este dato se le sumó la información de los rangos etarios, para tener un panorama bastante claro de la utilización del servicio.

Total de entradas analizadas de la base de datos de ETECSA
Número de líneas móviles por rangos etarios

Los datos muestran cifras bastante parejas: lo primeros, representan alrededor del 49% de los abonados, mientras que ellas son el 51% de los usuarios de móviles.

También es apreciable que las personas entre 41 y 50 años suman en total la mayor cantidad de usuarios de la telefonía móvil y de estos son más mujeres que hombres. Aún así, hay poca diferencia entre ese grupo y el conformado por sujetos con edades entre los 21 y 30 años. Los jóvenes con edades inferiores a los 20 años hacen minoría. Esto se debe a que la mayoría de los adolescentes que utilizan móviles en la Isla, poseen cuentas a nombre de adultos de su entorno.

Luego de hecha la diferenciación por género y edad, se analizó la antroponimia cubana para saber por ejemplo, la frecuencia con que se utiliza cada letra inicial, el primer nombre, el segundo nombre, el primer apellido, el segundo apellido, y la fecha de nacimiento, identificada a partir de los primero dígitos del número de identidad.

Debido a la manera desigual en que los datos fueron ingresados a la Base de ETECSA fue preciso homogeneizarlos. Por ese motivo, los nombres y apellidos que utilizamos para nuestros análisis, no contienen tildes, ni letras mayúsculas.

Además del listado de los nombres más comunes en Cuba a lo largo de 67 años, se detectaron algunas características curiosas de la antroponimia cubana como el retorno a la popularidad de los nombres compuestos, sobre todo en los hombres.

Evolución del uso de los nombres compuestos desde 1930 hasta 1997

Antes del año 1959, más de la mitad de las personas en Cuba tenían nombres compuestos. Estos eran más frecuentes por esas fechas entre las mujeres, a juzgar por los datos que se extrajeron del análisis de la Base de ETECSA.

Sin embargo, el segundo nombre cayó en desuso: solo el 19% de los nacidos en el año 1982 tenían nombres compuestos. Este fue el punto más bajo del uso de dos nombres en la Isla, porque a partir de ese momento se retomó la costumbre, cobrando mayor fuerza entre los hombres –a diferencia de épocas anteriores-. El 40% de los usuarios registrados en la Base de ETECSA nacidos en el año 1997 fueron bautizados con dos nombres.

Los apellidos registrados en nuestra fuente de información también sirvieron para tener una dirección acerca de qué nombres de familias predominan en Cuba. Así, en un ranking de apellidos, Rodríguez se ubicó en la cima, siendo utilizado indistinta y frecuentemente en las dos posiciones, con un total de apariciones de 229 622, que superó con creces a su sucesor en cantidad: Pérez.

Ranking de apellidos

Si ninguno de sus dos nombres de familia está en esta lista, puede considerarse una persona bastante singular en Cuba. Los 5 primeros de la lista suman más de un 25% del total de los sujetos registrados en la Base de Datos de ETECSA. Entonces, no es difícil pensar que uno de cada cuatro nacidos en este país lleva, detrás de su nombre, alguno de estos apellidos.

Con los datos obtenidos del análisis se contabilizó también el número de nacimientos por cada mes, para definir en qué época del año tienden a nacer más los niños (y también cuándo los padres son más cariñosos entre sí, de tal manera que engendran a los futuros bebés).

Octubre es el mes rey de los nacimientos en Cuba, pero está seguido muy de cerca por septiembre. Al parecer, el invierno, y las fiestas de fin de año y de San Valentín, son algunas de las posibles causas de que nueve meses después lleguen tantos niños a la Isla.

Número de nacimientos por meses

El estudio y la posterior interpretación de los datos almacenados en la Base de ETECSA, además de resultar pasos de un proceso interesante, ofrecieron resultados relevantes que permitieron acercarse más a la tipificación de los sujetos como individuos, y como parte de una nación con formas de hacer –y de nombrar- únicas.

Así, un resultado que parecía ser solo numérico, derivó en otras historias acerca de la identidad, de la privacidad y de la evolución de los nombres en Cuba.

También en este número: