Saltar al contenido
Portada » Tipos de pruebas estadísticas

Tipos de pruebas estadísticas

El tipo de prueba estadística que utilicemos depende de dos cosas principales. Primero, la naturaleza de la pregunta de investigación que se está intentando responder, y en segundo lugar, los tipos de datos de sus variables dependientes e independientes.

La siguiente tabla ofrece un breve resumen de las pruebas más usuales:

Datos continuos o categóricos

Los datos continuos o cuantitativos y los datos categóricos también denominados discretos o cualitativos son los principales tipos de datos o variables con los que vamos a encontrarnos.

Sólo sobre datos continuos podemos hacer cálculos aritméticos y calcular medias y desviaciones estándar. Por lo tanto, solo cuando estamos analizando datos continuos necesitaremos probar si los datos son paramétricos.

Cómo elegir una prueba

Las pruebas paramétricas más usuales son pruebas de regresión, comparación y de correlación.

Pruebas de regresión

Las pruebas de regresión buscan relaciones de causa y efecto. Se pueden utilizar para estimar el efecto de una o más variables sobre otra variable. Los tipos de regresión más utilizados son la regresión lineal simple, la regresión lineal múltiple y la regresión logística, aunque existen otros tipos (polinomial, Lasso,…).

Regresión lineal múltiple

Casos y ejemplos de aplicación

La regresión lineal múltiple se puede aplicar cuando la variable dependiente es continua así como las variables independientes. En este sentido, es importante añadir que, en ocasiones, aunque la variable dependiente sea categórica ordinal, podremos aplicar la regresión lineal. Por ejemplo, es el caso en el que nuestras variables son respuestas de una encuesta en las que se pide calificar algo determinado en una puntuación que va de 1 a 5 y dichas respuestas son tratadas como variables continuas. Técnicamente no se puede seleccionar ninguna otra opción que no sea 1,2,3,4 o 5. Sin embargo, en muchos análisis estadísticos se utilizan este tipo de datos como si fuesen continuos, calculando medias que te permiten comparar a un item que ha obtenido una media de 3.2 frente a otro de 3.9, por ejemplo.

Ejemplo de aplicación

Con la regresión lineal intentamos predecir y cuantificar la variación en una variable dependiente continua. Por ejemplo, partimos de las cifras de ventas para cada individuo y queremos explorar el grado en que estas variaciones de cifras entre individuos puede ser ‘causada’ por el grado en el que dos o más (posibles) factores causales comparten varianza con esta variable.

¿Podría la variación en u.m de ventas que un empleado logra en una semana estar relacionada con la cantidad de horas trabajadas en una semana y la edad del empleado?

Asimismo, nos podemos encontrar con variables dependientes continuas u ordinales y con variables dependientes tanto categóricas como continuas. La diferencia con el caso anterior es que algunas de las variables independientes incluidas representan una categoría o grupo en particular (por ejemplo, hombres versus mujeres).

Regresión logística

El análisis de regresión logística intenta predecir la probabilidad de que ocurra algo en particular (por ejemplo, si alguien deja la organización o si se queda) sobre la base de posibles características en una variedad de variables independientes (por ejemplo, criterios de desempeño, género, aumentos salariales, promoción, etc. ). Se puede utilizar cuando la variable dependiente es categórica y las independientes tanto continuas como categóricas.

Pruebas de comparación

Las pruebas de comparación buscan diferencias entre las medias de los grupos. Dependiendo del tipo de variables a analizar, se aplicarán unas pruebas u otras. En este caso, podremos elegir entre:

Pruebas denominadas Chi cuadrado en caso de trabajar únicamente con variables categóricas.

Pruebas denominadas T-test cuando se trabajan con variables continuas como variables dependientes y categóricas binarias como independientes.

Por ejemplo, la prueba Chi cuadrado nos permite responder a preguntas del tipo siguiente:

Las frecuencias encontradas entre unas categorías particulares (ejemplo, hombres y mujeres) ¿varían según o están relacionadas a otra categoría (por ejemplo, full-time vs part time)?

La prueba T-test explora si dos grupos de datos difieren en alguna dimensión. Por ejemplo, ¿se estresan más los empleados diferenciando según su género? ¿existen diferencias de nivel de compromiso dependiendo del género?

Asimismo, pruebas como ANOVA de uno o más factores son muy efectivas si queremos responder a preguntas donde intervengan variables categóricas y variables continuas. Por ejemplo, podemos explorar si tres o más grupos de datos difieren en alguna dimensión continua determinada. Un caso de aplicación sería si los empleados del departamento de RRHH están más comprometidos que los de Finanzas o Marketing.

Pruebas de relación entre variables

La correlación de Pearson por un lado y la regresión lineal simple nos sirve si queremos ver el grado en que dos variables continuas están relacionadas de alguna manera.

En el caso de las correlaciones, es posible que sólo le interese la «correlación» entre dos variables; con la regresión simple podrías estar haciendo algunas suposiciones sobre qué variable podría ser ‘causada’ o ‘predicha’ por la otra.