Sin embargo, el histograma presenta por lo general el problema de la elección del número y amplitud de las clases. Estos
problemas se resuelven si, en lugar de representar el histogrma, representamos la función de densidad de la variable. Para ello, R dispone
de la función density(). Así, tecleando
plot(density(cars$speed))
Otro método gráfico es la observación del gráfico Q-Q (cuantil-cuantil) de la variable. En este gráfico se representan los valores observados
en el eje de ordenadas y los valores teóricos en el de las abcisas. Cuando la variable sigue una ley normal, los puntos deben alinearse
en línea recta.
Para ilustrar el caso, vamos a considerar si determinado índice de resultados académicos (definido como una combinación lineal del número de IN,SF,
B,NT y SB acumulados por el alumnado del data.frame resultados) se ajusta a la distribución normal.
La secuencia de instrucciones a introducir sería la siguiente
resultados$indice<
-(-2*IN)+SF+(2*B)+(3*NT)+(4*SB)
qqnorm(resultados$indice)
Con la primera instrucción creamos el índice y lo añadimos como una variable nueva al data.frame resultados.
Con la segunda pedimos que dibuje el gráfico Q-Q
de la nueva variable. El resultado es el de la Figura .
Para estos casos es conveniente aplicar alguna prueba de inferencia no paramétrica como el test de Shapiro-Wilk que estudiamos a continuación.
2007-02-12