Este tipo de pruebas suele utilizarse para analizar la homogeneidad de
una variable respecto a otra. Consideremos el siguiente caso: en el
centro escolar se han recogido los datos de la Tabla
que representa el número de alumnos/as que supera/repite el primer
curso de bachillerato en relación al número de áreas que suspendió
el curso precedente (0,1,2 o más). Si analizamos la tabla, parece claro que no tienen las
mismas probabilidades de susperar el curso los alumnos que aprobaron
todas las áreas que los que promocionaron con alguna área suspensa,
pero deseamos poner a prueba estadísticamente esta
suposición. Podríamos hacerlo mediante la
de la siguiente
manera
promocionan<
-c(101,14,7)
repiten<
-c(14,25,13)
tabla3<
-data.frame(promocionan,repiten,row.names=c(``0'',''1'',''2+''))
Con las dos primeras instrucciones creamos los vectores que formarán
las columnas con valores de la tabla de contingencia. Con la tercera creamos un
data.frame, llamado tabla3, en el que introducimos como
nombres de filas (row.names) los correspondientes a 0,1,2+
suspensos.
Tabla:
Promoción con suspensos
Suspensos curso anterior |
Promocionan |
Repiten |
0 |
101 |
14 |
1 |
14 |
25 |
2+ |
7 |
13 |
|
|
|
|
Una vez creada la tabla de contingencia, podemos aplicar el test
mediante
chisq.test(tabla3)
cuya salida es
Pearson's Chi-squared test
data: tabla3
X-squared = 50.777, df = 2, p-value = 9.417e-12
el valor de
permite rechazar claramente la hipótesis de
homogeneidad de la variable repetir/no repetir en relación con
la variable número de suspensos en el curso anterior
lo que demuestra claramente que, a la hora de aprobar o repetir el
primer curso de bachillerato, no es lo mismo haber aprobado la ESO con 0, 1 o 2
o más áreas suspensas.
2007-02-12