S
sample() {base}
Permite realizar muestreos aleatorios |
x = un vector de uno o más elementos entre los que elegir, o un número entero postivo
size = un n° entero no negativo que indica el número de elementos a elegir
replace = ¿el muestreo debe ser con reemplazo? |
sample(x= letters[1:5],
size = 4,
replace = TRUE)
## [1] "c" "a" "b" "c"
scheffe.test() {agricolae}
¡Atención!
Instalar el paquete agricolae para hacer uso de la función scheffe.test.
Para ello utilizar el siguiente código:
install.packages("agricolae")
Realiza la prueba Scheffe |
y = modelo (aov o lm)
trt = tratamiento del modelo
alpha = nivel de significancia
group = TRUE o FALSE
console = TRUE (sí se quiere ver la salida en la consola) o FALSE
|
#El modelo corresponde al planteado en la función duncan.test()
library(agricolae)
scheffe = scheffe.test(
y = modelo.d,
trt = "Tratamiento",
alpha = 0.05,
group = TRUE,
console = TRUE)
##
## Study: modelo.d ~ "Tratamiento"
##
## Scheffe Test for Duración
##
## Mean Square Error : 0.08227
##
## Tratamiento, means
##
## Duración std r se Min Max Q25 Q50 Q75
## defilippii 0.916 0.2859371 10 0.09070281 0.56 1.45 0.7525 0.825 0.9750
## loyca 1.323 0.3469246 10 0.09070281 0.86 1.86 1.0350 1.370 1.4450
## superciliaris 1.194 0.2114080 10 0.09070281 0.82 1.46 1.0600 1.210 1.3725
##
## Alpha: 0.05 ; DF Error: 27
## Critical Value of F: 3.354131
##
## Minimum Significant Difference: 0.3322315
##
## Means with the same letter are not significantly different.
##
## Duración groups
## loyca 1.323 a
## superciliaris 1.194 ab
## defilippii 0.916 b
sd() {stats}
Calcula el desvío estándar de un conjunto de datos |
## [1] 0.60377
select() {dplyr}
¡Atención!
Instalar el paquete dplyr para hacer uso de la función select.
Para ello utilizar el siguiente código:
install.packages("dplyr")
Selecciona variables en un marco de datos, utilizando un minilenguaje conciso que facilita la referencia a las variables según su clasificación (categóricas o numéricas) |
## [1] "Departamento" "Variedad" "Brix" "pH"
## [5] "AT" "PT" "Caracterización"
# Seleccionar variables por su nombre
library(tidyverse)
library(dplyr)
datos %>%
select(Brix)
## Brix
## 1 10.5
## 2 10.0
## 3 11.0
## 4 8.0
## 5 17.0
## 6 10.0
## 7 12.0
## 8 15.0
## 9 9.0
## 10 16.0
## 11 10.0
## 12 12.0
## 13 9.0
## 14 12.0
## 15 14.5
## 16 12.0
## 17 16.0
Seleccione varias variables separándolas con comas. Observe cómo el orden de las columnas está determinado por el orden de las entradas:
datos %>%
select(pH, Departamento)
## pH Departamento
## 1 2.97 Tumbaya
## 2 3.72 Tumbaya
## 3 3.70 Tumbaya
## 4 3.59 Tumbaya
## 5 3.38 Humahuaca
## 6 3.40 Humahuaca
## 7 4.71 Humahuaca
## 8 4.86 Humahuaca
## 9 3.17 Humahuaca
## 10 4.79 Humahuaca
## 11 3.94 Humahuaca
## 12 3.42 Humahuaca
## 13 3.28 Humahuaca
## 14 3.49 Humahuaca
## 15 3.74 Humahuaca
## 16 4.73 Humahuaca
## 17 3.95 Humahuaca
seq() {base}
Generar secuencias regulares |
from = valor inicial de la secuencia
to = valor final de la secuencia
by = ¿cada cuánto se incrementa la secuencia? |
seq(from = 24, to = 50, by = 6)
## [1] 24 30 36 42 48
set.seed() {base}
Genera números aleatorios |
- seed = un valor único, interpretado como un entero, o NULL
|
#Creación de 10 valores aleatorios con set.seed()
set.seed(seed = 3)
rnorm(n = 10)
## [1] 0.5923025 0.2886310 -0.9557791 0.7484320 -0.4597529 0.0983391
## [7] 0.7095290 -1.1960426 -2.3115612 -0.7886402
#Creación de 10 valores aleatorios sin set.seed()
numeros = rnorm(n = 10)
numeros
## [1] 0.04360146 -0.82151149 -0.10486316 0.22540480 0.12635188 0.27743014
## [7] 0.56331893 -0.26021739 0.31437626 -1.78086737
#Creación de 10 valores aleatorios con set.seed()
set.seed(seed = 3)
numeros = rnorm(n = 10)
numeros
## [1] 0.5923025 0.2886310 -0.9557791 0.7484320 -0.4597529 0.0983391
## [7] 0.7095290 -1.1960426 -2.3115612 -0.7886402
shapiro.test() {stats}
Realiza la prueba de normalidad de Shapiro-Wilk. La hipótesis nula es que los datos se distribuyen normalmente |
x = vector numérico de valores de datos |
modelo = lm (pH ~ Departamento, datos)
shapiro.test(resid(modelo))
##
## Shapiro-Wilk normality test
##
## data: resid(modelo)
## W = 0.89194, p-value = 0.04988
skewness() {moments}
¡Atención!
Instalar el paquete moments para hacer uso de la función skewness.
Para ello utilizar el siguiente código:
install.packages("moments")
Calcula la asimetría de un conjunto de datos |
library(moments) #Primero llamar al paquete
skewness(datos$pH)
## [1] 0.6679828
sort() {base}
Ordena una secuencia de vector tipo numérico |
decreasing = TRUE (Ordena de mayor a menor);
FALSE (Ordena de menor a mayor)
Sí no se especifica este argumento por defecto ordena la serie en forma ascendente (FALSE ) |
a = c(2,6,1,5,4)
sort(a, decreasing = TRUE) #Serie en forma descendente
## [1] 6 5 4 2 1
a = c(2,6,1,5,4)
sort(a, decreasing = FALSE)#Serie en forma ascendente
## [1] 1 2 4 5 6
a = c(2,6,1,5,4)
sort(a) #Serie en forma ascendente por defecto
## [1] 1 2 4 5 6
sqrt() {base}
Calcula la raíz cuadrada de x |
## [1] 5
stat_pvalue_manual() {ggpubr}
¡Atención!
Instalar el paquete ggpubr para hacer uso de la función stat_pvalue_manual.
Para ello utilizar el siguiente código:
install.packages("ggpubr")
Añade manualmente valores p a un ggplot |
data = data.frame que contiene los resultados de pruebas estadísticas
hide.ns = Si es TRUE , oculta el símbolo ns al mostrar los niveles de significación
|
Ejemplo práctico disponible en letra G, función ggboxplot() {ggpubr}
stepfun() {stats}
Permite crear funciones escalonadas. Una función escalonada es una función matemática que toma un valor constante dentro de intervalos específicos y cambia instantáneamente su valor en los límites de estos intervalos |
|
x = c(1,2,3,4)
y = c(7,5,3,4,1)
a = stepfun(x, y)
print(a)
## Step function
## Call: stepfun(x, y)
## x[1:4] = 1, 2, 3, 4
## 5 plateau levels = 7, 5, 3, 4, 1
plot(a,
main = "Gráfico escalonado")
str() {utils}
Muestra la estructura de una base de datos. Indica el número de filas, columnas y el nombre de las variables |
## 'data.frame': 17 obs. of 7 variables:
## $ Departamento : Factor w/ 2 levels "Humahuaca","Tumbaya": 2 2 2 2 1 1 1 1 1 1 ...
## $ Variedad : chr "Granny Smith" "Red Delicius" "Red Delicius" "Red Delicius" ...
## $ Brix : num 10.5 10 11 8 17 10 12 15 9 16 ...
## $ pH : num 2.97 3.72 3.7 3.59 3.38 3.4 4.71 4.86 3.17 4.79 ...
## $ AT : num 6.05 2.32 2.18 3.08 4.83 6.52 1.06 0.96 5.61 2.12 ...
## $ PT : num 1.02 1.03 1.3 0.77 0.9 1.27 0.95 0.33 1.01 1.79 ...
## $ Caracterización: chr "Acidulado" "Dulce" "Dulce" "Dulce" ...
sum() {base}
Realiza la operación suma. Su equivalente es el +. Los dos procedimientos son equivalentes |
## [1] 15
## [1] 15
summarise() {dplyr}
¡Atención!
Instalar el paquete dplyr para hacer uso de la función summarise.
Para ello utilizar el siguiente código:
install.packages("dplyr")
Crea un nuevo marco de datos. Devuelve una fila por cada combinación de variables de agrupación. Si no hay variables de agrupación, la salida tendrá una sola fila que resumirá todas las observaciones en la entrada. Contendrá una columna para cada variable de agrupación y una columna para cada una de las estadísticas de resumen que haya especificado |
library(dplyr)
datos %>%
group_by(Departamento) %>%
summarise(Media.AT = mean(AT),
Media.pH = mean(pH),
Media.PT = mean(PT))
## # A tibble: 2 × 4
## Departamento Media.AT Media.pH Media.PT
## <fct> <dbl> <dbl> <dbl>
## 1 Humahuaca 4.10 3.91 1.09
## 2 Tumbaya 3.41 3.50 1.03
summary() {base}
Permite obtener un agregado de medidas de tendencia central |
## Departamento Variedad Brix pH
## Humahuaca:13 Length:17 Min. : 8.0 Min. :2.970
## Tumbaya : 4 Class :character 1st Qu.:10.0 1st Qu.:3.400
## Mode :character Median :12.0 Median :3.700
## Mean :12.0 Mean :3.814
## 3rd Qu.:14.5 3rd Qu.:3.950
## Max. :17.0 Max. :4.860
## AT PT Caracterización
## Min. :0.870 Min. :0.330 Length:17
## 1st Qu.:2.180 1st Qu.:0.860 Class :character
## Median :3.310 Median :1.010 Mode :character
## Mean :3.938 Mean :1.078
## 3rd Qu.:6.050 3rd Qu.:1.270
## Max. :7.530 Max. :2.050