Introducción
La Organización Mundial de la Salud (OMS) se vio forzada a declarar el estado de pandemia por la COVID-19 (enfermedad infecciosa ocasionada por el coronavirus SARS-CoV-2) desde el 11 de marzo del año 2020 (Vega, Castro, y Romero, 2020), siendo una seria amenaza, tanto para la salud física como mental (Pérez, Noroña, y Vega, 2021), la cual, además, trae como repercusión desaceleraciones económicas universales (Vega, Navarro, Pérez, y Guerrero, 2020).
Estudios realizados evidencian, que cada mes adicional de pandemia, como promedio, representa entre el 2,5% y el 3% del Producto Interno Bruto (PIB) mundial (Fernandes, 2020) y su impacto económico es muy incierto, lo cual obstaculiza la formulación efectiva de políticas macroeconómicas en cada país (McKibbin, y Fernando, 2020), ocasionando grandes afectaciones e impacto en la sociedad (Salvador-Moreno, Torrens-Pérez, Vega-Falcón, y Noroña-Salcedo, 2021).
El impacto económico de la COVID-19 se evidencia en todos los sectores y países, siendo el turismo uno de los más afectados. Las restricciones de viajes internacionales afectan muchísimo el nivel de las actividades económicas y de los principales índices bursátiles (Ozili, y Arun, 2020). Como ejemplos del impacto negativo en el turismo, puede citarse que prestigiosos destinos turísticos como Roma, Madrid, París, Venecia, New York, entre otros, están a un bajísimo porciento de aprovechamiento de sus capacidades y cifras históricas; se cancelan sistemáticamente ferias y eventos, y los cruceros y líneas aéreas cierran u operan a baja escala.
Resulta de especial interés el Global COVID19 Tourism Index (Haryanto, 2020) para examinar el nivel de depresión del turismo, siendo una variable estadística que permite cuantificar el grado de recuperación del turismo en oposición con el "tiempo normal" sin la existencia de la COVID-19. En el resultado de su métrica, un valor equivalente a 100 expresa la recuperación al nivel normal correspondiente al año 2019, con un ajuste por el cambio interanual en enero 2020.
Según Vega, Castro, y Romero (2020), el Global COVID19 Tourism Index incluye cinco subíndices que especifican niveles de recuperaciones del turismo: (1) Índice de Pandemia (refleja el nivel de la pandemia a partir de nuevos casos COVID-19 por millón de turistas entrantes); (2) Índice de Interés (calcula el interés online de búsquedas de potenciales turistas); (3) Índice de Movilidad (refleja el nivel de movilidad en lugares afines con el turismo; (4) Índice de Aviación (computa el vuelo aéreo, indicado como el volumen de salidas en los principales aeropuertos internacionales de cada país); (5) Índice de Hotel (refleja el nivel de rendimiento hotelero de los principales hoteles y cadenas hoteleras de cada nación). El presente estudio solo se centra en la medición general del Global COVID19 Tourism Index.
Evidentemente, la pandemia COVID-19 trae como resultado una marcada reducción de la actividad turística, la cual no tiene la misma connotación en todos los países y regiones.
Existe una problemática en este contexto y se refiere a que todas las regiones del mundo no han manejado igual la pandemia, apreciándose decisiones gubernamentales y poblacionales diversas, entre áreas geográficas, como por ejemplo, las características de las campañas de vacunación; el rigor del confinamiento; la infraestructura hospitalaria y capacidad de utilización de medicamentos a gran escala; la cultura respecto al distanciamiento y las medidas sanitarias, entre otras.
En el presente estudio, el factor que se investiga es la región geográfica (en este caso representado a través de los cinco continentes) el cual parece tener influencia sobre el resultado de la reducción de la actividad turística, expresada a través del Global COVID19 Tourism Index.
Cuando se requiere comparar dos grupos y la variable a contrastar es una variable numérica se utiliza como herramienta estadística la t de Student para muestras independientes, pero si los grupos a comparar son más de dos, se utiliza el análisis de la varianza (ANOVA por su acrónimo en inglés ANALYSYS OF VARIANCE) con un factor, llamado también análisis de la varianza de una vía. El ANOVA es una de las técnicas más utilizadas en numerosas disciplinas (Eisenhart, 1947).
El problema de investigación que enfrenta el presente estudio es: ¿Cómo demostrar que existen diferencias en el Global COVID19 Tourism Index entre los continentes? Para solucionar el problema, se utiliza el análisis de la varianza (ANOVA) con un factor.
Las hipótesis del investigador es que existen diferencias estadísticamente significativas entre las medias de los cinco continentes en el Global COVID-19 Tourism Index; por ello, el objetivo del estudio fue demostrar las diferencias en el Global COVID-19 Tourism Index entre los continentes.
Desarrollo
Método
Taxonomía de la investigación
Se desarrolló un estudio de tipo analítico (el análisis estadístico fue bivariado), observacional (no hubo intervención en la población de estudio); transversal (la variable fue medida en un solo momento, en este caso el 13 de marzo de 2021), y retrospectivo (los datos que se tomaron ya existían en el momento del estudio), correspondiente al nivel relacional (Supo y Zacarías, 2020).
Población de estudio
La población de estudio estuvo conformada por 100 países, desglosados en cinco continentes: África (14); América (21); Asia (30); Europa (32), y Oceanía (3). No fue necesario calcular una muestra al disponerse de los datos de toda la población.
Se tuvo en cuenta como único criterio de inclusión, que sea un país que tuviera calculado su Global COVID-19 Tourism Index con fecha 13 de marzo de 2021 en el sitio web de Yang, (2020).
Variables de estudio
La variable de supervisión (de resultado) fue el Global COVID 19 Tourism Index, de naturaleza numérica aleatoria, mientras que la variable asociada (clasificatoria) fue los continentes, dado que representó el criterio de conformación de grupos.
Herramientas estadísticas
Teniendo en cuenta que el tipo de variable de resultado fue cuantitativa (Global COVID-19 Tourism Index) y que el propósito era mostrar diferencias de tres o más grupos independientes a los que se les comparó las varianzas, se seleccionó como herramienta estadística a la prueba paramétrica ANOVA de un factor.
Hipótesis de los supuestos de la estadística paramétrica
Al ser un procedimiento del tipo de estadística paramétrica, se tuvo en cuenta los supuestos de la misma:
1. La variable de resultado o dependiente (Global COVID19 Tourism Index) es cuantitativa, es decir, está en un nivel de medición de intervalo o de razón. Este supuesto se cumple por la propia naturaleza de dicha variable, que es numérica.
2. Se cuenta con más de 30 datos. Se cumple este supuesto al ser exactamente 100 datos.
3. La distribución de los datos se comportó de manera normal. Al tratarse de grupos de datos menores de 50, se utilizó la prueba de Shapiro Wilk y se analizó una hipótesis para la misma, verificada durante el estudio.
4. Los grupos (continentes) tuvieron homocedasticidad, es decir, igualdad de varianzas a lo largo de la distribución de los valores. Se analizó una hipótesis para la misma.
Por lo antes expuesto, se partió de las siguientes hipótesis de los supuestos 3 y 4 de la estadística paramétrica:
● Hipótesis de normalidad de los datos (supuesto 3):
✓ H0: Los datos siguen una distribución normal.
✓ H1: Los datos no siguen una distribución normal.
Para la comprobación de la hipótesis de normalidad de los datos se utilizó la prueba de Shapiro Wilk como contraste de ajuste utilizado para evidenciar si los datos determinados fueron extraídos de una población normal, siendo adecuada para muestras pequeñas (n<50), lo cual se cumple en el presente estudio, donde el tamaño de ninguno de los grupos rebasa esta cifra.
● Hipótesis de homocedasticidad (supuesto 4):
✓ H0: grupos (continentes) no tienen homocedasticidad.
✓ H1: los grupos (continentes) tienen homocedasticidad.
Para la comprobación de la hipótesis de homocedasticidad, se utilizó el estadístico de la prueba de Levene por ser el estadístico F de ANOVA para probar igualdad de medias aplicado a las desviaciones absolutas (Tabla 3), o sea, igualdad de varianzas en la distribución de los valores.
Para identificar entre cuáles continentes se presentaron las diferencias estadísticamente significativas, se utilizaron pruebas post hoc. Inicialmente se utilizó la prueba de Tukey, porque ayuda a reducir el riesgo del error de tipo I o de primera especie, el cual se produce cuando la prueba detecta diferencias significativas y se rechaza la H0 (o se acepta la H1) pero, realmente, tales diferencias no existen (H0 verdadera); además, porque esta prueba es recomendable cuando el tamaño de los grupos es diferente. Adicionalmente, con el mismo propósito, se utilizó la prueba de Scheffé porque ayuda a reducir el error de tipo II o de segunda especie, que se produce cuando la prueba concluye que no hay diferencias estadísticamente significativas y no se rechaza la H0 (se rechaza H1), pero en realidad existen diferencias.
Se trabajó con un nivel de confianza del 95%.
Ritual de la significancia estadística
Teniendo en cuenta que la intención analítica fue la prueba de hipótesis, se siguieron los pasos del ritual de la significancia estadística:
La hipótesis bilateral o a dos colas quedó planteada de la forma siguiente:
✓ H0: No existen diferencias estadísticamente significativas entre las medias de los cinco continentes en el Global COVID-19 Tourism Index (hipótesis nula).
✓ H1: Existen diferencias estadísticamente significativas entre las medias de los cinco continentes en el Global COVID-19 Tourism Index (hipótesis alterna o del investigador).
● Establecimiento del nivel de significancia: se definió un nivel de significancia del 5% (0,05).
● Elección del estadístico de prueba: el estadístico de prueba seleccionado fue la prueba estadística análisis de la varianza ANOVA de un factor.
● Lectura al p-valor calculado: se analizó la probabilidad de error según el valor final que se obtuvo.
● Decisión estadística: se partió del criterio de que si el p-valor es menor que 0,05 se rechaza la hipótesis nula y se acepta la hipótesis del investigador.
Los datos fueron procesados con el paquete de software IBM SPSS Statistics (v. 25.0, Edición de 64 bits), utilizándose preliminarmente Microsoft Excel 2019 para crear una base de datos que contuviera toda la información estadística del estudio.
Resultados
La decisión sobre las hipótesis de los supuestos de la estadística paramétrica arrojó los resultados siguientes:
La normalidad de los datos fue comprobada mediante la prueba de Shapiro Wilk, que arrojó normalidad en los casos de África (p-valor de 0,213); América (p-valor de 0.420); y Oceanía (p-valor 0,364), es decir, el p-valor en esos tres casos fue mayor que 0,05, por lo que se aceptó la hipótesis nula de que la variable Global COVID-19 Tourism Index en esos grupos tuvo distribución normal. No obstante, en los casos de Asia (p-valor de 0,010) y Europa (p-valor de 0,002), al ser el p-valor menor que 0,05 se debe rechazar la hipótesis nula y concluir que sus datos no siguen una distribución normal.
A pesar de estos dos últimos resultados (Asia y Europa), los autores consideraron que es posible obtener resultados apropiados con datos no normales cuando la muestra es lo suficientemente grande (un tamaño de 20 es adecuado), en concordancia con Minitab; es decir, si los tamaños de los grupos son grandes, el estadístico F se comporta razonablemente, inclusive con distribuciones poblacionales que no tengan normalidad, como ocurre en este caso donde Asia está conformado por 30 países y Europa por 32. Por ello, se asumió que se cumplió H0, es decir, los datos siguen una distribución normal. (Alin, 2010).
● Hipótesis de homocedasticidad (supuesto 4): se evidenció que las varianzas son iguales (Tabla 3), por lo que se cumple H1, o sea, los grupos (continentes) tienen homocedasticidad.
Una vez verificadas las hipótesis de los supuestos de la estadística paramétrica, se muestran los resultados obtenidos en el estudio.
En la Tabla 1 se muestra el Global COVID-19 Tourism Index por continentes y países (con fecha 13/03/2021), ordenados de forma decreciente.
No. | Continente | País | Global COVID19 Tourism Index (%) |
---|---|---|---|
1 | Asia | Islas Maldivas | 54,10 |
2 | Asia | Catar | 51,76 |
3 | Oceanía | Australia | 51,07 |
4 | Asia | China | 47,97 |
5 | Oceanía | Nueva Zelanda | 46,76 |
6 | América | El Salvador | 44,15 |
7 | América | Nicaragua | 42,62 |
8 | América | México | 42,08 |
9 | América | República Dominicana | 41,07 |
10 | África | Guinea | 40,85 |
11 | Asia | Emiratos Árabes Unidos | 40,78 |
12 | África | Papúa Nueva Guinea | 40,55 |
13 | Europa | Bielorrusia | 40,26 |
14 | África | Kenia | 38,71 |
15 | Asia | Baréin | 38,57 |
16 | América | Panamá | 38,29 |
17 | América | Estados Unidos | 37,63 |
18 | América | Bahamas | 37,17 |
19 | África | Etiopía | 37,13 |
20 | Asia | Líbano | 36,52 |
21 | Asia | Singapur | 36,14 |
22 | Asia | Turquía | 36,04 |
23 | América | Costa Rica | 35,92 |
24 | África | Egipto | 35,37 |
25 | Europa | Ucrania | 34,55 |
26 | Asia | Kazajistán | 33,84 |
27 | América | Trinidad y Tobago | 32,90 |
28 | América | Honduras | 32,40 |
29 | Europa | Bulgaria | 31,99 |
30 | América | Guatemala | 31,98 |
31 | Asia | Corea del Sur | 31,50 |
32 | Asia | Arabia Saudita | 31,03 |
33 | África | Zambia | 30,80 |
34 | Europa | Croacia | 30,52 |
35 | Europa | Rusia | 30,36 |
36 | Asia | India | 29,73 |
37 | América | Colombia | 29,71 |
38 | Asia | Japón | 29,61 |
39 | Oceanía | República de Fiyi | 29,59 |
40 | América | Chile | 29,48 |
41 | Asia | Vietnam | 29,44 |
42 | Asia | Armenia | 28,42 |
43 | África | Túnez | 27,65 |
44 | América | Ecuador | 27,46 |
45 | Asia | Omán | 27,04 |
46 | Asia | Bangladesh | 26,53 |
47 | América | Jamaica | 26,42 |
48 | Asia | Laos | 26,09 |
49 | Europa | Luxemburgo | 25,31 |
50 | Europa | Suiza | 25,27 |
51 | África | Botsuana | 24,87 |
52 | Asia | Georgia | 24,82 |
53 | Asia | Azerbaiyán | 24,42 |
54 | América | Canadá | 23,95 |
55 | Asia | Jordania | 23,48 |
56 | América | Perú | 23,24 |
57 | África | Sudáfrica | 22,93 |
58 | Europa | Montenegro | 22,89 |
59 | África | Argelia | 22,66 |
60 | Asia | Kuwait | 22,62 |
61 | Asia | Cambodia | 22,60 |
62 | Asia | Sri Lanka | 22,28 |
63 | América | Argentina | 21,99 |
64 | Europa | España | 21,94 |
65 | África | Namibia | 21,83 |
66 | África | Marruecos | 21,71 |
67 | África | Seychelles | 21,70 |
68 | Asia | Filipinas | 21,50 |
69 | América | Uruguay | 21,35 |
70 | Asia | Tailandia | 21,02 |
71 | Europa | Holanda | 20,37 |
72 | Europa | Rumania | 19,91 |
73 | Europa | Lituania | 19,59 |
74 | Asia | Israel | 19,57 |
75 | Europa | Francia | 19,54 |
76 | Europa | Finlandia | 19,43 |
77 | Asia | Indonesia | 18,99 |
78 | Asia | Malasia | 18,88 |
79 | Europa | Dinamarca | 18,71 |
80 | Europa | Estonia | 18,16 |
81 | América | Barbados | 17,89 |
82 | Asia | Myanmar | 17,86 |
83 | América | Brasil | 17,77 |
84 | Europa | Bélgica | 17,71 |
85 | Europa | Grecia | 17,71 |
86 | Europa | Portugal | 17,45 |
87 | Europa | Polonia | 17,30 |
88 | Europa | Gran Bretaña | 17,10 |
89 | Europa | Eslovenia | 17,01 |
90 | Europa | Alemania | 16,68 |
91 | Europa | Italia | 16,64 |
92 | Europa | Suecia | 15,99 |
93 | Europa | Irlanda | 15,90 |
94 | Europa | Austria | 15,84 |
95 | Europa | Malta | 15,67 |
96 | Europa | Letonia | 14,28 |
97 | Europa | Hungría | 13,78 |
98 | África | Mauricio | 11,33 |
99 | Europa | República Checa | 10,96 |
100 | Europa | Eslovaquia | 8,89 |
Fuente: elaboración propia.
La Figura 1 refleja los valores medios del Global COVID-19 Tourism Index de cada continente.
En la Tabla 2 se presenta el valor medio del Global COVID-19 Tourism Index en los cinco continentes, con sus respectivos intervalos de confianza para la media (95%). Los intervalos de confianza interesan como instrumentos para medir la incertidumbre (Vega, 1998).
Continentes | N | Media | Desviación Estadístico | Desviación Error | 95% del intervalo de confianza para la media | |
Límite inferior | Límite superior | |||||
África | 14 | 28,44 | 8,94232 | 2,38993 | 23,2719 | 33,5981 |
América | 21 | 31,21 | 8,26342 | 1,80323 | 27,4514 | 34,9743 |
Asia | 30 | 29,77 | 9,58163 | 1,74936 | 26,1938 | 33,3495 |
Europa | 32 | 20,24 | 6,87563 | 1,21545 | 17,7620 | 22,7199 |
Oceanía | 3 | 42,47 | 11,36350 | 6,56072 | 14,2448 | 70,7018 |
Total | 100 | 27,22 | 9,84672 | 0,98467 | 25,2646 | 29,1722 |
Fuente: elaboración propia.
En la Tabla 3 se muestra la prueba de homogeneidad de varianzas, relacionada con su respectiva hipótesis de homocedasticidad (supuesto 4).
Estadístico de Levene | gl1 | gl2 | Sig. | ||
---|---|---|---|---|---|
Global COVID-19
Tourism Index |
Se basa en la media | 1,242 | 4 | 95 | 0,299 |
Se basa en la mediana | 1,091 | 4 | 95 | 0,366 | |
Se basa en la mediana y con gl ajustado | 1,091 | 4 | 84,907 | 0,367 | |
Se basa en la media recortada | 1,302 | 4 | 95 | 0,275 |
Fuente: elaboración propia.
En la Tabla 4 se aprecia la prueba de ANOVA (F = 9,818) detallándose la suma de los cuadrados, los grados de libertad y la media cuadrática.
Suma de cuadrados | gl | Media cuadrática | F | Sig. | |
---|---|---|---|---|---|
Entre grupos | 2807,425 | 4 | 701,856 | 9,818 | 0,000 |
Dentro de grupos | 6791,415 | 95 | 71,489 | ||
Total | 9598,840 | 99 |
Fuente: elaboración propia.
La Tabla 5 refleja los resultados de las comparaciones múltiples de la prueba post hoc de Tukey, para poder identificar entre cuáles continentes se presentaron las diferencias estadísticamente significativas.
Variable dependiente: Global COVID-19 Tourism Index | |||||||
Continente | Continente | Diferencia de medias (I-J) | Desv. Error | Sig. | Intervalo de confianza al 95% | ||
Límite inferior | Límite superior | ||||||
África | América | -2,77786 | 2,91728 | 0,876 | -10,8904 | 5,3347 | |
Asia | -1,33667 | 2,73665 | 0,988 | -8,9469 | 6,2736 | ||
Europa | 8,19406* | 2,70931 | 0,026 | 0,6598 | 15,7283 | ||
Oceanía | -14,03833 | 5,37921 | 0,077 | -28,9972 | 0,9205 | ||
América | África | 2,77786 | 2,91728 | 0,876 | -5,3347 | 10,8904 | |
Asia | 1,44119 | 2,40565 | 0,975 | -5,2486 | 8,1310 | ||
Europa | 10,97192* | 2,37450 | 0,000 | 4,3688 | 17,5751 | ||
Oceanía | -11,26048 | 5,21860 | 0,205 | -25,7727 | 3,2517 | ||
Asia | África | 1,33667 | 2,73665 | 0,988 | -6,2736 | 8,9469 | |
América | -1,44119 | 2,40565 | 0,975 | -8,1310 | 5,2486 | ||
Europa | 9,53073* | 2,14871 | 0,000 | 3,5554 | 15,5060 | ||
Oceanía | -12,70167 | 5,11981 | 0,104 | -26,9392 | 1,5358 | ||
Europa | África | -8,19406* | 2,70931 | 0,026 | -15,7283 | -0,6598 | |
América | -10,97192* | 2,37450 | 0,000 | -17,5751 | -4,3688 | ||
Asia | -9,53073* | 2,14871 | 0,000 | -15,5060 | -3,5554 | ||
Oceanía | -22,23240* | 5,10525 | 0,000 | -36,4294 | -8,0354 | ||
Oceanía | África | 14,03833 | 5,37921 | 0,077 | -0,9205 | 28,9972 | |
América | 11,26048 | 5,21860 | 0,205 | -3,2517 | 25,7727 | ||
Asia | 12,70167 | 5,11981 | 0,104 | -1,5358 | 26,9392 | ||
Europa | 22,23240* | 5,10525 | 0,000 | 8,0354 | 36,4294 |
*. La diferencia de medias es significativa en el nivel 0.05.
Fuente: elaboración propia.
La Tabla 6 expone los resultados de las comparaciones múltiples de la prueba post hoc de Scheffé, para poder identificar entre cuáles continentes se presentaron las diferencias estadísticamente significativas.
Variable dependiente: Global COVID19 Tourism Index | ||||||
---|---|---|---|---|---|---|
Scheffé | ||||||
(I) Continente | (J) Continente | Diferencia de medias (I-J) | Desv. Error | Sig. | Intervalo de confianza al 95% | |
Límite inferior | Límite superior | |||||
África | América | -2,77786 | 2,91728 | 0,923 | 11,9429 | 6,3872 |
Asia | -1,33667 | 2,73665 | 0,993 | -9,9343 | 7,2609 | |
Europa | 8,19406 | 2,70931 | 0,066 | -0,3176 | 16,7058 | |
Oceanía | -14,03833 | 5,37921 | 0,156 | 30,9379 | 2,8613 | |
América | África | 2,77786 | 2,91728 | 0,923 | -6,3872 | 11,9429 |
Asia | 1,44119 | 2,40565 | 0,985 | -6,1165 | 8,9989 | |
Europa | 10,97192* | 2,37450 | 0,001 | 3,5121 | 18,4318 | |
Oceanía | -11,26048 | 5,21860 | 0,332 | 27,6555 | 5,1345 | |
Asia | África | 1,33667 | 2,73665 | 0,993 | -7,2609 | 9,9343 |
América | -1,44119 | 2,40565 | 0,985 | -8,9989 | 6,1165 | |
Europa | 9,53073* | 2,14871 | 0,001 | 2,7802 | 16,2812 | |
Oceanía | -12,70167 | 5,11981 | 0,197 | 28,7863 | 3,3830 | |
Europa | África | -8,19406 | 2,70931 | 0,066 | 16,7058 | 0,3176 |
América | 10,97192* | 2,37450 | 0,001 | 18,4318 | -3,5121 | |
Asia | -9,53073* | 2,14871 | 0,001 | 16,2812 | -2,7802 | |
Oceanía | 22,23240* | 5,10525 | 0,002 | 38,2713 | -6,1935 | |
Oceanía | África | 14,03833 | 5,37921 | 0,156 | -2,8613 | 30,9379 |
América | 11,26048 | 5,21860 | 0,332 | -5,1345 | 27,6555 | |
Asia | 12,70167 | 5,11981 | 0,197 | -3,3830 | 28,7863 | |
Europa | 22,23240* | 5,10525 | 0,002 | 6,1935 | 38,2713 |
*. La diferencia de medias es significativa en el nivel 0.05.
Fuente: elaboración propia.
Discusión
En ANOVA de un factor hay una primera condición que tiene que ver con la variable dependiente y es que debe ser cuantitativa y es sobre la cual se hacen los contrastes o las comparaciones, lo cual se cumple en este estudio, al igual que son cumplidas las condiciones de que las muestras sean independientes, que se contrasten más de dos grupos para contrastar las varianzas, y que al tratarse de una prueba paramétrica se requiere el supuesto de normalidad en todos los grupos analizados.
A partir de lo comentado en el apartado de Resultados acerca de la hipótesis de normalidad de los datos, los autores consideran que el Global COVID19 Tourism Index, además de ser una variable numérica, puede asumirse que de forma general está distribuido de manera normal en la mayoría de los continentes y la variabilidad dentro de cada uno de ellos es similar en todos.
En esencia, el ANOVA de un factor es un método estadístico para probar la hipótesis nula (H0) respecto a que tres o más medias poblacionales son iguales en contraste con la hipótesis alternativa (H1) de que al menos una de dichas medias es desigual.
Comúnmente, el ANOVA de un factor se utiliza cuando existe una única variable o factor independiente y el propósito consiste en analizar si las variaciones o diferentes niveles de dicho factor poseen un efecto medible sobre una variable dependiente. Únicamente se utiliza cuando se investiga un solo factor (en el presente estudio los grupos de países agrupados en los cinco continentes) y una sola variable dependiente, que en este caso es el Global COVID19 Tourism Index.
La justificación del uso del ANOVA en el presente estudio, viene dada porque teniendo en cuenta que, si se efectúan varias pruebas estadísticas para probar una sola hipótesis, lo que se estaría haciendo sería sumar errores y ese es un problema bien importante en términos de investigación, pues una de las condiciones de las pruebas estadísticas es que implican un porcentaje de error, por lo que se determina cuál es ese error que se está dispuestos a aceptar en la inferencia y al efectuarse pruebas múltiples aumentan las posibilidades de error, por lo que en esos casos es necesario utilizar un análisis que de forma conjunta permita observar si hay diferencias o no y eso es lo que hace ANOVA.
ANOVA es una prueba paramétrica en la que se comparan varianzas, en el presente estudio, una varianza dentro de los continentes que se estén comparando y otra varianza entre dichos continentes. La varianza dentro de los continentes es toda la variación que tiene el Global COVID19 Tourism Index que se está comparando, qué se produce naturalmente, mientras que la varianza entre los continentes es la variación o las diferencias que se encuentran en los promedios del Global COVID19 Tourism Index de cada uno de los cinco continentes.
De acuerdo con la Tabla 1 el mayor Global COVID19 Tourism Index le corresponde a Islas Maldivas con un grado de recuperación del turismo, en oposición con el "tiempo normal" sin la existencia de la COVID-19, de 54,10% y la menor recuperación es la de Eslovaquia con solo un 8,89%.
En esta misma Tabla 1 es notable que el país europeo mejor ubicado en cuanto a recuperación del turismo aparece en el lugar 13 y además que en el primer cuartil solo hay dos países de Europa. A esto se adiciona que 19 de los 25 países del cuartil 4 son europeos, lo cual evidencia que en dicho continente es donde más dificultades se han tenido para la recuperación turística por la COVID-19. En opinión de los autores, este resultado pudiera estar relacionado con una mayor cultura y mejor percepción del riego por parte de los europeos para enfrentar la COVID-19 y no dar una apertura insensata al turismo, a pesar de que también en Europa hay mucho por seguir mejorando en este sentido.
Igualmente se observa que en África, el valor mínimo del Global COVID19 Tourism Index correspondió a (Mauricio con 11,33%) y el máximo a (Guinea con 40,85%); en América el mínimo fue de (Brasil con 17,77%) y el máximo de (El Salvador con 44,15%); en Asia el mínimo lo tuvo (Myanmar con 17,86%) y el máximo (Islas Maldivas con 54,10%) correspondiendo al mayor de todos los 100 países analizados; en Europa el mínimo lo reflejó (Eslovaquia con 8,89%) siendo el valor mínimo de toda la población de estudio, y el máximo (Bielorrusia con 40,26%); mientras que en Oceanía el mínimo fue de (República de Fiyi con 29,59%) y el máximo de (Australia con 51,07%).
En la Figura 1 reflejan los valores medios del Global COVID19 Tourism Index de cada continente, evidenciando que Oceanía destaca con la mayor recuperación (42,47%) y Europa con la menor (20,24%), lo cual ratifica lo comentado en la Tabla 1 respecto a la baja recuperación europea. El resto de los continentes, en su análisis como grupos, muestran recuperaciones similares: América 31,21%, Asia 29,77% y África 28,44%, estando estos tres valores más cercanos al valor del Global COVID-19 Tourism Index promedio de los 100 países, que es de 27,22%.
Estos resultados también se corresponden con los de la Tabla 2, en la que se exponen estadísticos descriptivos, detallándose los intervalos de confianza para la media (95%), donde se aprecia que la mayor desviación corresponde a Oceanía (11,36350) y la menor a Europa (6,87563). Este resultado se corresponde con que Oceanía presente la mayor brecha entre el límite inferior (14,2448) y el límite superior (70,7018) dentro de los citados intervalos. Estos resultados evidencian una mayor homogeneidad de nivel de recuperación en el continente europeo y una menor en Oceanía, con resultados similares en los otros tres continentes.
Según lo mostrado en la Tabla 3 (Prueba de homogeneidad), se evidencia que las varianzas son iguales, dado que el p-valor es mayor que 0,05, por lo que se cumple el supuesto de que los grupos (continentes) tienen homocedasticidad, o sea, igualdad de varianzas a lo largo de la distribución de los valores.
En la Tabla 4 se aprecia la prueba de ANOVA, cuyo estadístico tiene un valor de F = 9,818, pero lo más importante es el valor o significancia asintótica (0,000), que en este caso es menor a 0,05 que es el nivel de significancia con el que convencionalmente se realizan los estudios.
El p-valor se utiliza para evaluar la validez de la hipótesis nula de que todas las medias son iguales. Considerando que su valor es menor a 0,05 (Tabla 4) se rechaza la hipótesis nula y se acepta la alterna, la cual señala que existen diferencias en el Global COVID-19 Tourism Index entre los continentes.
Ese p-valor puede asumirse como evidencia de que no todas las medias son iguales, por lo tanto, los resultados evidencian que hay una diferencia en el valor medio Global COVID-19 Tourism Index entre uno o más de los cinco continentes.
Una vez llegado a este nivel de resultados, cabe preguntarse acerca de si el citado índice difiere en todos los continentes o si es el mismo, siendo ésta la lógica bajo la cual se planteó la hipótesis general del presente estudio (H1). Se parte del criterio de que cuando se comparan las medias de los cinco continentes, indicándose si al menos un par de medias es significativamente diferente, pero inicialmente no se puede indicar qué par; es decir, luego de conocerse que los grupos de países que conforman los continentes tienen diferencias entre el valor medio de ellos, es necesario responder a la pregunta que surge respecto a si hay diferencias entre las comparaciones por parejas entre ellos y la respuesta lo brindan las pruebas post hoc.
Existen diversas pruebas post hoc, para lo cual se seleccionó la prueba de Tukey, que posibilitó las comparaciones que se muestran en la Tabla 5, en la que de acuerdo con el p-valor (menor a 0,05) se perciben diferencias entre África y Europa; América y Europa; Asia y Europa; así como Oceanía y Europa, por lo que se evidencia, que quien realmente tiene diferencias significativas con el resto de los continentes es específicamente Europa.
Tukey hace uso del estadístico del rango estudentizado para efectuar la totalidad de los cotejos por pares entre los diferentes grupos. Para ello crea tanto la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones pareadas.
De acuerdo a lo mostrado en la Tabla 6, la prueba Scheffé indica que las únicas diferencias existentes son las correspondientes al grupo Europa al compararse con América, Asia y Oceanía, donde hay diferencias estadísticamente significativas; por ello, el resultado de Scheffé es muy similar al de Tukey, dado que la única diferencia es la comparación de Europa con África, donde según Tukey, es estadísticamente significativa (p-valor de 0,026), mientras que Scheffé lo indica como no estadísticamente significativa (p-valor de 0,066), aunque se acerca a la significancia requerida.
Scheffé efectúa comparaciones múltiples conjuntas por pares para todos los dúos de combinaciones de las medias posibles. Para ello utiliza la distribución muestral F y resulta valiosa para examinar todas las combinaciones lineales de grupos de medias posibles, es decir, no únicamente las comparaciones por parejas.
Respecto a las pruebas post hoc, es válido resaltar que en la prueba ANOVA los contrastes de hipótesis siempre son bilaterales o de dos colas, pues se comprueba si las muestras difieren respecto a sus medias y no específicamente si una muestra tiene una media superior o inferior que otra por separado; por ende, si se rechaza la hipótesis nula se desconoce entre qué grupos están las diferencias de las medias, por lo que primeramente se obtiene un contraste de hipótesis global conocido como hipótesis ómnibus, completa o total, pues compara todas las medias de los grupos, por lo que la hipótesis nula total confirma que no existen diferencias entre las medias de los grupos, por lo cual se utilizan las pruebas post hoc para hacer comparaciones por pares y tener entonces un contraste de hipótesis parcial.
Los autores señalan que no conocen estudios similares que apliquen la prueba paramétrica ANOVA de un factor, en la comparación entre los cinco continentes, respecto al Global COVID19 Tourism Index.
Limitaciones del estudio
Aunque en la prueba de ANOVA de un factor no necesariamente los grupos deben tener el mismo tamaño, tampoco se recomienda que tengan diferencias muy significativas, pero en este caso se decidió utilizar también el caso de Oceanía, que solo representó el 3% de la población de estudio, para completar el 100% de la población que cumplió el criterio de inclusión.
Conclusiones
Se demostró que existen diferencias estadísticamente significativas entre las medias de los cinco continentes en el Global COVID19 Tourism Index, evidenciándose que quien se diferencia del resto de los continentes es específicamente Europa.
El estudio revela que la mayor homogeneidad de nivel de recuperación del turismo se aprecia en el continente europeo y la menor en Oceanía, con resultados equivalentes en el resto de los continentes.
El análisis de varianza de un factor justificó ser una herramienta estadística válida para conocer la varianza que existe en un factor con respecto a una variable dependiente cuantitativa, mientras que las pruebas de rango post hoc y las comparaciones múltiples por parejas permiten satisfactoriamente determinar qué medias difieren.
El Global COVID19 Tourism Index es un valioso indicador estadístico para examinar el nivel de depresión del turismo, siendo de interés continuar analizando el mismo, por lo que se sugieren nuevos estudios, que al igual que el presente, determinen posibles diferencias estadísticamente significativas entre las medias de los cinco continentes, pero para cada subíndice.