S

sample() {base}
Descripción Argumentos
Permite realizar muestreos aleatorios

x = un vector de uno o más elementos entre los que elegir, o un número entero postivo

size = un n° entero no negativo que indica el número de elementos a elegir

replace = ¿el muestreo debe ser con reemplazo?

sample(x= letters[1:5],
       size = 4,
       replace = TRUE)
## [1] "c" "a" "b" "c"
scheffe.test() {agricolae}
¡Atención!
Instalar el paquete agricolae para hacer uso de la función scheffe.test. 

Para ello utilizar el siguiente código:

install.packages("agricolae")
Descripción Argumentos
Realiza la prueba Scheffe
  • y = modelo (aov o lm)

  • trt = tratamiento del modelo

  • alpha = nivel de significancia

  • group = TRUE o FALSE

  • console = TRUE (sí se quiere ver la salida en la consola) o FALSE

#El modelo corresponde al planteado en la función duncan.test()
library(agricolae)
scheffe = scheffe.test(
  y = modelo.d,
  trt = "Tratamiento",
  alpha = 0.05,
  group = TRUE,
  console = TRUE)
## 
## Study: modelo.d ~ "Tratamiento"
## 
## Scheffe Test for Duración 
## 
## Mean Square Error  : 0.08227 
## 
## Tratamiento,  means
## 
##               Duración       std  r         se  Min  Max    Q25   Q50    Q75
## defilippii       0.916 0.2859371 10 0.09070281 0.56 1.45 0.7525 0.825 0.9750
## loyca            1.323 0.3469246 10 0.09070281 0.86 1.86 1.0350 1.370 1.4450
## superciliaris    1.194 0.2114080 10 0.09070281 0.82 1.46 1.0600 1.210 1.3725
## 
## Alpha: 0.05 ; DF Error: 27 
## Critical Value of F: 3.354131 
## 
## Minimum Significant Difference: 0.3322315 
## 
## Means with the same letter are not significantly different.
## 
##               Duración groups
## loyca            1.323      a
## superciliaris    1.194     ab
## defilippii       0.916      b
sd() {stats}
Descripción
Calcula el desvío estándar de un conjunto de datos
sd(datos$pH)
## [1] 0.60377
select() {dplyr}
¡Atención!
Instalar el paquete dplyr para hacer uso de la función select. 

Para ello utilizar el siguiente código:

install.packages("dplyr")
Descripción
Selecciona variables en un marco de datos, utilizando un minilenguaje conciso que facilita la referencia a las variables según su clasificación (categóricas o numéricas)
colnames(datos)
## [1] "Departamento"    "Variedad"        "Brix"            "pH"             
## [5] "AT"              "PT"              "Caracterización"
# Seleccionar variables por su nombre
library(tidyverse)
library(dplyr)
datos %>% 
  select(Brix)
##    Brix
## 1  10.5
## 2  10.0
## 3  11.0
## 4   8.0
## 5  17.0
## 6  10.0
## 7  12.0
## 8  15.0
## 9   9.0
## 10 16.0
## 11 10.0
## 12 12.0
## 13  9.0
## 14 12.0
## 15 14.5
## 16 12.0
## 17 16.0

Seleccione varias variables separándolas con comas. Observe cómo el orden de las columnas está determinado por el orden de las entradas:

datos %>% 
  select(pH, Departamento)
##      pH Departamento
## 1  2.97      Tumbaya
## 2  3.72      Tumbaya
## 3  3.70      Tumbaya
## 4  3.59      Tumbaya
## 5  3.38    Humahuaca
## 6  3.40    Humahuaca
## 7  4.71    Humahuaca
## 8  4.86    Humahuaca
## 9  3.17    Humahuaca
## 10 4.79    Humahuaca
## 11 3.94    Humahuaca
## 12 3.42    Humahuaca
## 13 3.28    Humahuaca
## 14 3.49    Humahuaca
## 15 3.74    Humahuaca
## 16 4.73    Humahuaca
## 17 3.95    Humahuaca
seq() {base}
Descripción Argumentos
Generar secuencias regulares

from = valor inicial de la secuencia

to = valor final de la secuencia

by = ¿cada cuánto se incrementa la secuencia?

seq(from = 24, to = 50, by = 6)
## [1] 24 30 36 42 48
set.seed() {base}
Descripción Argumentos
Genera números aleatorios
  • seed = un valor único, interpretado como un entero, o NULL
#Creación de 10 valores aleatorios con set.seed()
set.seed(seed = 3)
rnorm(n = 10)
##  [1]  0.5923025  0.2886310 -0.9557791  0.7484320 -0.4597529  0.0983391
##  [7]  0.7095290 -1.1960426 -2.3115612 -0.7886402
#Creación de 10 valores aleatorios sin set.seed()
numeros = rnorm(n = 10)
numeros
##  [1]  0.04360146 -0.82151149 -0.10486316  0.22540480  0.12635188  0.27743014
##  [7]  0.56331893 -0.26021739  0.31437626 -1.78086737
#Creación de 10 valores aleatorios con set.seed()
set.seed(seed = 3)
numeros = rnorm(n = 10)
numeros
##  [1]  0.5923025  0.2886310 -0.9557791  0.7484320 -0.4597529  0.0983391
##  [7]  0.7095290 -1.1960426 -2.3115612 -0.7886402
shapiro.test() {stats}
Descripción Argumentos
Realiza la prueba de normalidad de Shapiro-Wilk. La hipótesis nula es que los datos se distribuyen normalmente x = vector numérico de valores de datos
modelo = lm (pH ~ Departamento, datos)
shapiro.test(resid(modelo))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.89194, p-value = 0.04988
skewness() {moments}
¡Atención!
Instalar el paquete moments para hacer uso de la función skewness. 

Para ello utilizar el siguiente código:

install.packages("moments")
Descripción
Calcula la asimetría de un conjunto de datos
library(moments) #Primero llamar al paquete
skewness(datos$pH)
## [1] 0.6679828
sort() {base}
Descripción Argumentos
Ordena una secuencia de vector tipo numérico

decreasing = TRUE (Ordena de mayor a menor);

FALSE (Ordena de menor a mayor)

Sí no se especifica este argumento por defecto ordena la serie en forma ascendente (FALSE)

a = c(2,6,1,5,4)
sort(a, decreasing = TRUE) #Serie en forma descendente
## [1] 6 5 4 2 1
a = c(2,6,1,5,4)
sort(a, decreasing = FALSE)#Serie en forma ascendente
## [1] 1 2 4 5 6
a = c(2,6,1,5,4)
sort(a)                    #Serie en forma ascendente por defecto
## [1] 1 2 4 5 6
sqrt() {base}
Descripción
Calcula la raíz cuadrada de x
sqrt(25)
## [1] 5
stat_pvalue_manual() {ggpubr}
¡Atención!
Instalar el paquete ggpubr para hacer uso de la función stat_pvalue_manual. 

Para ello utilizar el siguiente código:

install.packages("ggpubr")
Descripción Argumentos
Añade manualmente valores p a un ggplot
  • data = data.frame que contiene los resultados de pruebas estadísticas

  • hide.ns = Si es TRUE, oculta el símbolo ns al mostrar los niveles de significación

Ejemplo práctico disponible en letra G, función ggboxplot() {ggpubr}
stepfun() {stats}
Descripción Argumentos
Permite crear funciones escalonadas. Una función escalonada es una función matemática que toma un valor constante dentro de intervalos específicos y cambia instantáneamente su valor en los límites de estos intervalos
  • x = es un vector que especifica los puntos de quiebre de la función escalonada

  • y = es un vector que especifica los valores que toma la función dentro de cada intervalo

x = c(1,2,3,4)
y = c(7,5,3,4,1)
a = stepfun(x, y)
print(a)
## Step function
## Call: stepfun(x, y)
##  x[1:4] =      1,      2,      3,      4
## 5 plateau levels =      7,      5,      3,      4,      1
plot(a,
     main = "Gráfico escalonado")

str() {utils}
Descripción
Muestra la estructura de una base de datos. Indica el número de filas, columnas y el nombre de las variables
str(datos)
## 'data.frame':    17 obs. of  7 variables:
##  $ Departamento   : Factor w/ 2 levels "Humahuaca","Tumbaya": 2 2 2 2 1 1 1 1 1 1 ...
##  $ Variedad       : chr  "Granny Smith" "Red Delicius" "Red Delicius" "Red Delicius" ...
##  $ Brix           : num  10.5 10 11 8 17 10 12 15 9 16 ...
##  $ pH             : num  2.97 3.72 3.7 3.59 3.38 3.4 4.71 4.86 3.17 4.79 ...
##  $ AT             : num  6.05 2.32 2.18 3.08 4.83 6.52 1.06 0.96 5.61 2.12 ...
##  $ PT             : num  1.02 1.03 1.3 0.77 0.9 1.27 0.95 0.33 1.01 1.79 ...
##  $ Caracterización: chr  "Acidulado" "Dulce" "Dulce" "Dulce" ...
sum() {base}
Descripción
Realiza la operación suma. Su equivalente es el +. Los dos procedimientos son equivalentes
1+2+3+4+5
## [1] 15
sum(1:5)
## [1] 15
summarise() {dplyr}
¡Atención!
Instalar el paquete dplyr para hacer uso de la función summarise. 

Para ello utilizar el siguiente código:

install.packages("dplyr")
Descripción
Crea un nuevo marco de datos. Devuelve una fila por cada combinación de variables de agrupación. Si no hay variables de agrupación, la salida tendrá una sola fila que resumirá todas las observaciones en la entrada. Contendrá una columna para cada variable de agrupación y una columna para cada una de las estadísticas de resumen que haya especificado
library(dplyr)
datos %>% 
  group_by(Departamento) %>% 
  summarise(Media.AT = mean(AT),
            Media.pH = mean(pH),
            Media.PT = mean(PT))
## # A tibble: 2 × 4
##   Departamento Media.AT Media.pH Media.PT
##   <fct>           <dbl>    <dbl>    <dbl>
## 1 Humahuaca        4.10     3.91     1.09
## 2 Tumbaya          3.41     3.50     1.03
summary() {base}
Descripción
Permite obtener un agregado de medidas de tendencia central
summary(datos)
##     Departamento   Variedad              Brix            pH       
##  Humahuaca:13    Length:17          Min.   : 8.0   Min.   :2.970  
##  Tumbaya  : 4    Class :character   1st Qu.:10.0   1st Qu.:3.400  
##                  Mode  :character   Median :12.0   Median :3.700  
##                                     Mean   :12.0   Mean   :3.814  
##                                     3rd Qu.:14.5   3rd Qu.:3.950  
##                                     Max.   :17.0   Max.   :4.860  
##        AT              PT        Caracterización   
##  Min.   :0.870   Min.   :0.330   Length:17         
##  1st Qu.:2.180   1st Qu.:0.860   Class :character  
##  Median :3.310   Median :1.010   Mode  :character  
##  Mean   :3.938   Mean   :1.078                     
##  3rd Qu.:6.050   3rd Qu.:1.270                     
##  Max.   :7.530   Max.   :2.050