Bioestadística DCBMM CUCS/UDG
2024-09-09
Esta presentación tiene como objetivo reforzar algunos conceptos básicos de R
Es un archivo de texto que permite la edición y lectura de código
La recomendación es que las tareas, apuntes de clase sean creados aquí
Necesita ser leido de arriba abajo
A veces llamamos objetos que no se encuentra en nuestro script
Es necesario tener ordén
Es un maletin que contiene:
Objetos
Scripts
Carpetas
Gráficas
Bases de datos
Etc
Para la clase deberán crear uno o varios proyectos
En cada proyecto deberán cuando mínimo crear las siguientes carpetas
R
posee el poderoso concepto de directorio de trabajo (working directory en inglés). Aquí es donde R busca los archivos que le pides que lea y donde colocará todos los archivos que le pidas que guarde. RStudio muestra tu directorio de trabajo actual en la parte superior de la consola:
Para conocer en que carpeta están trabajando pueden utilizar el código:
cut
cut
- x: vector numérico
- breaks: puntos de corte, debe ser mayor a 2
- labels: etiquetas de cada categoría
- right: indica hacía donde debe cerrarse el intervalo ]
. El valor predeterminado es el izquierdo ( ]
cut
cut
Utilizando el objeto edad
realice cortes de manera que pueda identificar cuantos pacientes tienen una edad menor o igual a 10, de 11 a 30 años incluyendo el 30 y el resto de los pacientes. No cambie las etiquetas de los niveles. Nombre este nuevo objeto como edad1, pida los conteos de los niveles utilizando la función table
, realice una gráfica de barras con esta nueva variable.
cut
cut
cut
Cree una nuevo objeto llamado edad2
que contenga los mismo cortes del ejercicio anterior pero cambie el argumento right = F
Describa que es lo que pasa
cut
cut
cut
edad1
y edad2
edad1
y edad2
cut
edad1
y edad2
edad1
y edad2
Podemos crear nuevas variables en los data frame utilizando el símbolo $
Pima.tr2
de la librería MASS
corte la variable age
de acuerdo con los siguiente criterios:
Mujeres menores a 24 años
Mujeres de 24 a 33 pero menores de 33
Mujeres de 33 a 49
Mujeres de 50 a 72
Pima.tr2
y nómbrelo como edad_factor
edad_factor
edad_factor
un factoredad_factor
edad_factor
npreg glu bp skin bmi ped age type edad_factor
1 5 86 68 28 30.2 0.364 24 No Edad 2
2 7 195 70 33 25.1 0.163 55 Yes Edad 4
3 5 77 82 41 35.8 0.156 35 No Edad 3
4 0 165 76 43 47.9 0.259 26 No Edad 2
5 0 107 60 25 26.4 0.133 23 No Edad 1
6 5 97 76 27 35.6 0.378 52 Yes Edad 4
'data.frame': 300 obs. of 9 variables:
$ npreg : int 5 7 5 0 0 5 3 1 3 2 ...
$ glu : int 86 195 77 165 107 97 83 193 142 128 ...
$ bp : int 68 70 82 76 60 76 58 50 80 78 ...
$ skin : int 28 33 41 43 25 27 31 16 15 37 ...
$ bmi : num 30.2 25.1 35.8 47.9 26.4 35.6 34.3 25.9 32.4 43.3 ...
$ ped : num 0.364 0.163 0.156 0.259 0.133 ...
$ age : int 24 55 35 26 23 52 25 24 63 31 ...
$ type : Factor w/ 2 levels "No","Yes": 1 2 1 1 1 2 1 1 1 2 ...
$ edad_factor: Factor w/ 4 levels "Edad 1","Edad 2",..: 2 4 3 2 1 4 2 2 4 2 ...