Los Juegos de la XXXII Olimpiada estuvieron a punto de no ocurrir debido a la pandemia de la Covid-19. Planificados para efectuarse un año atrás, finalmente, fueron inaugurados en Tokio este 23 de julio.
Como en cada edición olímpica, millones de personas en el mundo estarán al tanto del medallero. Seguirán, jornada a jornada, las preseas que gana su país, o la nación de su preferencia. Mientras, no pocos harán sus predicciones precompetencia. Realizar un pronóstico certero es complicado, pero hacerlo luego de que el mundo, incluido el deporte, estuvo detenido por casi en año lo hace mucho más difícil.
Si se observa los 10 primeros países del medalleros en las últimas 5 olimpiadas se podrá notar que este varía de edición en edición. Cambian no solo las posiciones, sino también el número de medallas que obtiene cada nación. Un ejemplo es Cuba, que en Sidney 2000 fue 9na en el medallero y en Río 2016 concluyó en el lugar 18, con menos de la mitad de medallas que alcanzó en la urbe australiana.
Sin embargo, el reto de realizar el pronóstico de la tabla de medallas completa de Tokio 2020 es demasiado atractivo como para no intentarlo.
País | Oro | Plata | Bronce | Total | |
1 | Estados Unidos | 46 | 37 | 38 | 121 |
2 | Reino Unido | 27 | 23 | 17 | 67 |
3 | China | 26 | 18 | 26 | 70 |
4 | Rusia | 19 | 17 | 20 | 56 |
5 | Alemania | 17 | 10 | 15 | 42 |
6 | Japón | 10 | 18 | 14 | 42 |
7 | Francia | 10 | 18 | 14 | 42 |
8 | Corea del Sur | 13 | 9 | 8 | 30 |
9 | Italia | 9 | 3 | 9 | 21 |
10 | Australia | 8 | 11 | 10 | 29 |
... | |||||
18 | Cuba | 5 | 2 | 4 | 11 |
Para el pronóstico asumimos un enfoque global. O sea: no se predicen las medallas analizando uno a uno todos los eventos de la olimpiada, sino que se trata de predeccir un comportamiento general de los países.
La hipótesis aquí es que los resultados de un país en la edición olímpica previa, más los resultados alcanzados en los distintos campeonatos mundiales en los años entre olimpiadas, permiten predecir los resultados en la siguiente cita olímpica.
Para ello colectamos toda la información relativa a los deportes convocados para Japón. Los datos los compilamos desde la edición de Sidney 2000 en adelante. Seguimos este enfoque porque en los años 80s hubo muchos países que, por un motivo u otro, no asistieron a las citas de 1980, 1984 y 1988. Mientras tanto, en los 90s ocurrió una modificación significativa de la geopolítica de distintas naciones. Es entonces a partir del año 2000 que comienza a existir cierta estabilidad relativa que no incorpora grandes ruidos a un esquema predictivo.
El pronóstico se basó en la construcción de un modelo predictivo para cada tipo de medalla. Este modelo para poder predecir debe recibir como entrada las medallas de oro, plata y bronce que obtuvo cada país en la olimpiada anterior, así como una aproximación normalizada de la cantidad de medallas de oro, plata y bronce que obtuvo en los eventos mundiales, o de un calibre similar, del período. Asimismo, para tener una visión de sus posibilidades más recientes, se adicionó el número de medallas de cada color que obtuvo cada nación en el último evento en cada deporte.
El poder contabilizar las medallas de los eventos mundiales conllevaba una dificultad adicional, pues el número de eventos en estas citas no siempre coincide con los eventos que se convocan en la cita olímpica. Para ello se relativizaron las cantidades. Se determinó el porciento de medallas de cada tipo, respecto al total, que ganó cada país en cada deporte y luego, esto se escaló al número de preseas de ese deporte en la olimpiada a predecir.
Para realizar las predicciones por cada medalla se optó por utilizar un modelo de regresión. Se consideraron tres alternativas: Ridge, Lasso y ElasticNet. Con todos los datos compilados se construyó el modelo para las medallas de oro, así como uno para la plata y otro para el bronce. Ya con los datos de cada país en el período 2017-2021 y sus resultados en Río 2016 se podía obtener su posible resultado en Tokio.
Sin embargo, lo arrojado por estos modelos no mostraba algo que ocurre habitualmente: los países tienen una actuación significativamente mejor cuando son sede. Por este motivo se añadió al vector de características si el país era sede o no. Esto solo haría que existieran, para entrenar el modelo, solo 4 vectores con esa característica: los que reflejaban a Grecia en el 2004, China en el 2008, Reino Unido en el 2012 y Brasil en el 2016.
Con esto la diferencia se hizo notar. Para Japón, en el modelo que usa Ridge como regresor, si no se consideraban el factor sede se predecían 13 medallas de oro, 11 de plata y 15 de bronce para el lugar 7 del medallero. Sin embargo, cuando se consideró que sería la sede ya se predijeron 19 títulos, 12 subtítulos y 16 metales bronceados que llevarían a los nipones hasta el 4to lugar del medallero.
Entre los tres modelos de regresión que se analizaron se decidió apostar por Ridge pues este es el que mejor expresa el factor sede y es, además, el que obtuvo mejor valor R-cuadrado, que es un indicador estadístico que permite valorar la calidad de la predicción de los valores.
En términos generales, los tres modelos predictivos creados ubican a Estados Unidos al frente del medallero con China de segundo y Reino Unido de tercero. Asimismo, los tres ven, aunque en diferente orden, a los mismos países encabezando el Top 10 del listado.
Para Cuba, el modelo Ridge predice 3 títulos, 3 medallas de plata y 4 de bronce para el lugar 21 del medallero. Mientras que los otros dos modelos le otorgan a la mayor de las Antillas un título más y coinciden en que terminaría en el lugar 18 de la tabla de medallas. Estos números son bastante cercanos a lo que se ha valorado por varios expertos.
Pos. | País | Oro | Plata | Bronce | Total |
Este trabajo es el resultado de una colaboración con el Grupo de Inteligencia Artificial de la Facultad de Matemática y Computación de la Universidad de La Habana.