2  Cadenas

En R, las cadenas son secuencias de caracteres, como palabras o frases, que se almacenan como objetos de texto. Las cadenas se utilizan comúnmente para representar datos de texto en análisis de datos y programación.

  1. Creación de cadenas: Puedes crear cadenas en R utilizando comillas simples (') o comillas dobles ("). Por ejemplo:

    x <- "Esto es una cadena con comillas dobles"
    y <- 'Esto es una cadena con comillas simples'
  2. Longitud de una cadena: Puedes obtener la longitud de una cadena utilizando la función nchar. Por ejemplo:

    x <- "Programación"
    y <- nchar(x) # 7
  3. Extracción de subcadenas: Puedes extraer partes de una cadena utilizando la función substr. Por ejemplo:

    x <- "Programación"
    y <- substr(x, start = 2, stop = 4) # "rog"
  4. Búsqueda de texto en cadenas: Puedes buscar texto dentro de una cadena utilizando la función grep o grepl. Por ejemplo:

    x <- "Esto es un ejemplo"
    y <- grepl("ejemplo", x, ignore.case = TRUE) # TRUE
  5. Reemplazo de texto en cadenas: Puedes reemplazar texto en una cadena utilizando la función gsub. Por ejemplo:

    x <- "Esto es programación"
    y <- gsub("programación", "texto", x) # "Esto es texto"
  6. División de cadenas: Puedes dividir una cadena en partes más pequeñas utilizando la función strsplit. Por ejemplo:

    x <- "Hola,Mundo"
    y <- strsplit(x, ",") # Devuelve una lista: [["Hola", "Mundo"]]
  7. Comparación de cadenas: Puedes comparar cadenas utilizando operadores de comparación (==, !=, <, >, <=, >=). Por ejemplo:

    x <- "abc"
    y <- "def"
    resultado <- x == y # FALSE
  8. Formato de cadenas: Puedes formatear cadenas utilizando la función sprintf para crear cadenas con valores variables incrustados. Por ejemplo:

    x <- "Juan"
    y <- 30
    z <- sprintf("Mi nombre es %s y tengo %d años.", x, y) # "Mi nombre es Juan y tengo 30 años."

2.1 Accediendo a componentes de cadena

Para acceder a componentes individuales de una cadena (caracteres) en R, puedes utilizar la notación de corchetes [ ]. Los caracteres en una cadena se indexan desde 1 hasta la longitud de la cadena.

  1. Acceso a un carácter específico:

    Puedes acceder a un carácter específico en una cadena utilizando su índice:

    cadena <- "Ejemplo"
    primer_caracter <- cadena[1]  # Obtiene el primer carácter "E"
    segundo_caracter <- cadena[2] # Obtiene el segundo carácter "j"
  2. Acceso a varios caracteres:

    Puedes acceder a varios caracteres de una cadena especificando un rango de índices:

    cadena <- "Ejemplo"
    subcadena <- cadena[3:6] # Obtiene los caracteres del tercer al sexto: "empl"

2.2 Concatenación de cadenas

En R, puedes concatenar (unir) cadenas utilizando el operador paste() o paste0(). Estas funciones permiten combinar varias cadenas en una sola cadena.

  1. Usando paste():

    La función paste() une las cadenas y puede incluir un separador entre ellas. Aquí hay un ejemplo:

    cadena1 <- "Hola"
    cadena2 <- "Mundo"
    resultado <- paste(cadena1, cadena2)
  2. Usando paste0():

    La función paste0() funciona de manera similar a paste(), pero no incluye ningún separador entre las cadenas:

    cadena1 <- "Hola"
    cadena2 <- "Mundo"
    resultado <- paste0(cadena1, cadena2)

2.3 Operaciones de cadena y métodos integrados

R proporciona una variedad de operaciones y métodos integrados para trabajar con cadenas de texto. Aquí tienes algunos ejemplos de operaciones comunes que puedes realizar con cadenas en R:

nchar() ## Se puede usar para obtener la longitud de una cadena.
paste() ## Para concatenar cadenas con espacio.
paste0() ## Para concatenar cadenas sin espacio.
substr() ## Se puede usar para extraer partes de una cadena.
grepl() ## Se puede usar para verificar si una cadena contiene cierto patrón.
gsub() ## Se puede usar para reemplazar todas las ocurrencias de un patrón en una cadena.
strsplit() ## Se puede usar para dividir una cadena en función de un separador.
toupper() ## Se puede convertir una cadena a mayúsculas.
tolower() ## Se puede convertir una cadena a minúsculas.
sprintf() ## Se puede utilizar para formatear cadenas con valores variables.