15.1 Atalhos e comandos
Operadores
| Operador | Descrição |
|---|---|
| + | Operador de adição |
| - | Operador de subtração |
| * | Operador de multiplicação |
| / | Operador de divisão |
| : | Operador de sequência |
| ^ | Operador exponencial |
| %% | Operador de módulo |
| == | Operador de igualdade |
| > | Operador maior que |
| >= | Operador maior ou igual que |
| < | Operador menor que |
| <= | Operador menor ou igual que |
| ! | Operador "Não" |
| & | Operador "E" |
| | | Operador "Ou" |
Detalhamento de objetos
| Função | Descrição |
|---|---|
| str() | Exibe de forma compacta a estrutura interna de um objeto em R. |
| names() | Nomes dos elementos dentro de um objeto |
| class() | Recupera a classe interna de um objeto |
| mode() | Obtém ou define o tipo ou modo de armazenamento de um objeto |
| length() | Recupera ou define a dimensão de um objeto. |
| dim() | Recupera ou define a dimensão de um objeto. |
| sessionInfo() | Imprime informações sobre a versão do R e pacotes anexados ou carregados |
| options() | Permite ao usuário definir e examinar uma variedade de opções globais |
15.1.1 Pacotes
Pacote Dplyr
| Função | Descrição | Exemplo |
|---|---|---|
| summarize () | Resume dados para criar uma única linha de resumo. | df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE)) |
| select() | Seleciona colunas específicas de um data frame. | df %>% select(col1, col2) |
| filter() | Filtra linhas de um data frame com base em condições. | df %>% filter(col1 == "value", col2 > 10) |
| arrange() | Ordena as linhas de um data frame | df %>% arrange(col1) |
| mutate() | Cria novas colunas ou modifica colunas existentes | df %>% mutate(new_col = col1 * 2) |
| group_by() | Agrupa os dados por uma ou mais colunas antes de aplicar operações de resumo | df %>% group_by(col1) %>% summarise(mean_col2 = mean(col2, na.rm = TRUE)) |
| left_join() | Realiza a junção de dois data frames (semelhante ao SQL left join). | df1 %>% left_join(df2, by = "key") |
| right_join() | Realiza a junção de dois data frames (semelhante ao SQL right join). | df1 %>% right_join(df2, by = "key") |
| inner_join() | Realiza a junção de dois data frames, mantendo apenas as linhas correspondentes. | df1 %>% inner_join(df2, by = "key") |
| full_join() | Realiza a junção de dois data frames, mantendo todas as linhas | df1 %>% full_join(df2, by = "key") |
| distinct() | Retorna linhas únicas de um data frame | df %>% distinct(col1, col2) |
| rename() | Renomeia colunas de um data frame | df %>% rename(new_name = old_name) |
| slice() | Seleciona linhas por número de índice | df %>% slice(1:10) |
| sample_n() | Seleciona linhas aleatórias | NA |
Alguns dos comandos utilizados no dplyr são:
| Comando | Descrição | Exemplo |
|---|---|---|
| sum() | Calcula a soma de uma coluna. | df %>% summarise(total_col1 = sum(col1, na.rm = TRUE)) |
| n() | Conta o número de linhas em cada grupo | df %>% group_by(col1) %>% summarise(count = n()) |
| n_distinct() | Conta o número de valores distintos em uma coluna | df %>% summarise(unique_col1 = n_distinct(col1)) |
| mean() | Calcula a média de uma coluna | df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE)) |
| median() | Calcula a mediana de uma coluna | df %>% summarise(median_col1 = median(col1, na.rm = TRUE)) |
| sd() | Calcula o desvio padrão de uma coluna | df %>% summarise(sd_col1 = sd(col1, na.rm = TRUE)) |
| var() | Calcula a variância de uma coluna | df %>% summarise(var_col1 = var(col1, na.rm = TRUE)) |
| min() | Encontra o valor mínimo de uma coluna | df %>% summarise(min_col1 = min(col1, na.rm = TRUE)) |
| max() | Encontra o valor máximo de uma coluna | df %>% summarise(max_col1 = max(col1, na.rm = TRUE)) |
| first() | Obtém o primeiro valor de uma coluna em cada grupo | df %>% group_by(col1) %>% summarise(first_col2 = first(col2)) |
| last() | Obtém o último valor de uma coluna em cada grupo. | df %>% group_by(col1) %>% summarise(last_col2 = last(col2)) |
| any() | Verificar se qualquer valor em uma coluna satisfaz uma condição | df %>% summarise(any_na = any(is.na(col1))) |
| all() | Verificar se todos os valores em uma coluna satisfazem uma condição | df %>% summarise(all_positive = all(col1 > 0)) |
| row_number() | Gera números de linha sequenciais dentro de cada grupo | df %>% mutate(row_num = row_number()) |
| rank() | Calcula o ranking de valores dentro de cada grupo | df %>% mutate(rank_col1 = rank(col1)) |
| lag() | Desloca os valores de uma coluna para baixo (por padrão, uma linha) | df %>% mutate(lag_col1 = lag(col1, n = 1)) |
| lead() | Desloca os valores de uma coluna para cima (por padrão, uma linha) | NA |
Pacote ggplot2
| Função | Descrição | Exemplo |
|---|---|---|
| ggplot() | Esta função cria um objeto de gráfico ggplot vazio. É o ponto de partida para construir gráficos com ggplot2. | dados%>% ggplot() |
| aes() | Define os mapeamentos estéticos (estética) de variáveis aos aspectos visuais do gráfico, como eixo x, eixo y, cor, forma, etc. | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) |
| geom_point() | Cria um gráfico de pontos | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_point() |
| geom_line() | Cria um gráfico de linhas | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_line() |
| geom_bar() | Cria um gráfico de barras | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_bar() |
| geom_tile() | Cria um gráfico de calor | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_tile() |
| geom_boxplot() | Cria um boxplot | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_boxplot() |
| geom_density() | Cria um gráfico de densidade | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_density() |
| geom_histogram() | Cria um histograma | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_histogram() |
| facet_wrap() | Retorna linhas únicas de um data frame | facet_wrap(~variável, ncol=2) |
| labs() | Adiciona rótulos | labs(title ="Título", x="Título eixo x", y="Título eixo y", fill="Legenda") |
Pacote forcats
Pacote gt
| Função | Descrição | Exemplo |
|---|---|---|
| tab_header() | Adiciona título e subtítulo | gt()%>%tab_header(title ="Título", subtitle="Subtítulo") |
| tab_source_note() | Adiciona fonte | gt()%>%tab_source_note(source_note="Fonte") |
| tab_footnote() | Adiciona nota de rodapé | gt()%>%tab_footnote( footnote = "All values in USD.", locations = cells_body(columns = name, rows = 3:4)) |
| cols_align() | Alinha texto | gt()%>%cols_align(align = c("center")) |
| tab_row_group() | Cria grupo de linhas | tab_row_group(label = "continent",rows = 1:6) |