M
matrix() {base}
Se utiliza para crear matrices, que son arreglos bidimensionales de datos. Tienen un número fijo de filas y columnas |
data = Los datos que se colocarán en la matriz. Si no se proporciona, la matriz se inicializará con NA
nrow = El número de filas en la matriz
ncol = El número de columnas en la matriz
byrow = Un valor lógico que indica si los datos deben llenarse por filas o por columnas (por defecto es FALSE)
|
matrix(c(1,2,3,4,5,6), ncol = 2)
## [,1] [,2]
## [1,] 1 4
## [2,] 2 5
## [3,] 3 6
matrix(c(1,2,3,4,5,6), ncol = 2, byrow=TRUE)
## [,1] [,2]
## [1,] 1 2
## [2,] 3 4
## [3,] 5 6
matrix(c(1,2,3,4,5,6), nrow = 3)
## [,1] [,2]
## [1,] 1 4
## [2,] 2 5
## [3,] 3 6
max() {base}
Devuelve el valor máximo de un conjunto de datos |
## [1] 4.86
mcnemar.test() {stats}
Realiza la prueba de \(\chi^2\) de McNemar para detectar cambios significativos en una tabla de contingencia bidimensional |
|
objeto.matrix = matrix(c(14, 8, 2, 30),
nrow = 2,
dimnames = list("ANTES" = c("1", "0"),
"DESPUES" = c("1", "0")))
mcnemar.test(x = objeto.matrix, correct = TRUE)
##
## McNemar's Chi-squared test with continuity correction
##
## data: objeto.matrix
## McNemar's chi-squared = 2.5, df = 1, p-value = 0.1138
mcnemar.test(x = objeto.matrix, correct = FALSE)
##
## McNemar's Chi-squared test
##
## data: objeto.matrix
## McNemar's chi-squared = 3.6, df = 1, p-value = 0.05778
mean() {base}
Calcula el promedio de un conjunto de datos |
|
## [1] 3.814118
mean(datos$pH, trim = 0.1)
## [1] 3.800667
En este caso, trim = 0.1
significa que se eliminará el 10% de los valores más bajos y el 10% de los valores más altos de la variable pH
antes de calcular la media. Esto puede ser útil para calcular una media robusta que no se vea demasiado afectada por valores extremos o atípicos en los datos.
median() {stats}
Calcula la mediana de un conjunto de datos |
## [1] 3.7
min() {base}
Calcula el valor mínimo de un conjunto de datos |
## [1] 2.97
mutate() {dplyr}
¡Atención!
Instalar el paquete dplyr para hacer uso de la función mutate.
Para ello utilizar el siguiente código:
install.packages("dplyr")
Se utiliza para crear nuevas variables (columnas) en un marco de datos existente, basadas en transformaciones de las variables existentes. |
.data = El marco de datos al que se aplicarán las transformaciones.
… = Pares de nombre-valor que especifican las nuevas variables que se crearán. El nombre es el nombre de la nueva variable y el valor es la expresión que define cómo se calculará el valor de la nueva variable.
|
library(dplyr)
mutate(datos, V3 = datos$AT * 100)
## Departamento Variedad Brix pH AT PT Caracterización V3
## 1 Tumbaya Granny Smith 10.5 2.97 6.05 1.02 Acidulado 605
## 2 Tumbaya Red Delicius 10.0 3.72 2.32 1.03 Dulce 232
## 3 Tumbaya Red Delicius 11.0 3.70 2.18 1.30 Dulce 218
## 4 Tumbaya Red Delicius 8.0 3.59 3.08 0.77 Dulce 308
## 5 Humahuaca O'Henry 17.0 3.38 4.83 0.90 Acidulado 483
## 6 Humahuaca Gran Delicius 10.0 3.40 6.52 1.27 Acido 652
## 7 Humahuaca Red Delicius 12.0 4.71 1.06 0.95 Dulce 106
## 8 Humahuaca Amarilla tempranera 15.0 4.86 0.96 0.33 Amargo 96
## 9 Humahuaca Gran Delicius 9.0 3.17 5.61 1.01 Acidulado 561
## 10 Humahuaca Melona 16.0 4.79 2.12 1.79 Dulce-amargo 212
## 11 Humahuaca Verde deliciosa 10.0 3.94 3.31 0.86 Dulce 331
## 12 Humahuaca Cara sucia 12.0 3.42 7.53 1.41 Acido-amargo 753
## 13 Humahuaca Rojita 9.0 3.28 6.28 0.83 Acido 628
## 14 Humahuaca Amarilla deliciosa 12.0 3.49 6.52 0.98 Acido 652
## 15 Humahuaca Desconocida roja I 14.5 3.74 2.99 0.64 Dulce 299
## 16 Humahuaca Desconocida roja II 12.0 4.73 0.87 1.18 Dulce 87
## 17 Humahuaca Criolla chata 16.0 3.95 4.71 2.05 Amargo-acidulado 471