<
-subset(resultados,select=c(8,1,2,4)). Si solicitamos a R la estructura del nuevo data.frame
con str(fracasoescolar) veremos lo
siguiente:
Como se ve, han desaparecido las variables no deseadas y se han seleccionado las que queremos, respetando el orden en el que se han introducido en la función subset().
Vamos a estudiar un poco en detalle cómo se indica qué variables se quieren extraer. Esto de hace con el argumento select. En el ejemplo hemos tecleado select=c(8,1,2,4). Ese c(8,1,2,4) indica a R que concatene las variables que ocupan el octavo, primero, segundo y cuarto lugar. La c que precede al paréntesis es imprescindible y se utiliza en R siempre que se quiere crear lo que se llama un vector.
En lugar de número de orden, podríamos haber utilizado el
nombre de las variables, así
fracasoescolar<
-subset(resultados,select=c(Año,Evaluacion,Curso,IN)
habría producido
el mismo resultado.
En ocasiones son más las variables que quiero extraer que las que deseo descartar. En esos casos es más
conveniente utilizar otra forma de selección. Por ejemplo
fracasoescolar<
-subset(resultados,select=-c(B,NT,SB)
incluiría en el data.frame fracasoescolar todas las notas menos (como le indica el signo - delante del operador de concatenación)
el B, el NT y el SB.
Si, por casualidad, las variables a extraer son consecutivas, podríamos seleccionarlas en bloque. Así,
probatinas<
-subset(resultados,select=(1:5))
crearía un data.frame en el que se incluirían las primeras cinco
variables. Nótese que, en este caso, no se introduce la concatenación; R entiende los dos puntos entre el 1 y el 5 como desde
la uno a la cinco, ambas inclusive.