7.1 Atalhos e comandos

Operadores

Operador Descrição
+ Operador de adição
- Operador de subtração
* Operador de multiplicação
/ Operador de divisão
: Operador de sequência
^ Operador exponencial
%% Operador de módulo
== Operador de igualdade
> Operador maior que
>= Operador maior ou igual que
< Operador menor que
<= Operador menor ou igual que
! Operador "Não"
& Operador "E"
| Operador "Ou"

Detalhamento de objetos

Função Descrição
str() Exibe de forma compacta a estrutura interna de um objeto em R. 
names() Nomes dos elementos dentro de um objeto
class() Recupera a classe interna de um objeto
mode() Obtém ou define o tipo ou modo de armazenamento de um objeto
length() Recupera ou define a dimensão de um objeto.
dim() Recupera ou define a dimensão de um objeto.
sessionInfo() Imprime informações sobre a versão do R e pacotes anexados ou carregados
options() Permite ao usuário definir e examinar uma variedade de opções globais

7.1.1 Pacotes

Pacote Dplyr

Função Descrição Exemplo
summarize () Resume dados para criar uma única linha de resumo. df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE))
select() Seleciona colunas específicas de um data frame. df %>% select(col1, col2)
filter() Filtra linhas de um data frame com base em condições. df %>% filter(col1 == "value", col2 > 10)
arrange() Ordena as linhas de um data frame df %>% arrange(col1)
mutate() Cria novas colunas ou modifica colunas existentes df %>% mutate(new_col = col1 * 2)
group_by() Agrupa os dados por uma ou mais colunas antes de aplicar operações de resumo df %>% group_by(col1) %>%  summarise(mean_col2 = mean(col2, na.rm = TRUE))
left_join() Realiza a junção de dois data frames (semelhante ao SQL left join). df1 %>% left_join(df2, by = "key")
right_join() Realiza a junção de dois data frames (semelhante ao SQL right join). df1 %>% right_join(df2, by = "key")
inner_join() Realiza a junção de dois data frames, mantendo apenas as linhas correspondentes. df1 %>% inner_join(df2, by = "key")
full_join() Realiza a junção de dois data frames, mantendo todas as linhas df1 %>% full_join(df2, by = "key")
distinct() Retorna linhas únicas de um data frame df %>% distinct(col1, col2)
rename() Renomeia colunas de um data frame df %>% rename(new_name = old_name)
slice() Seleciona linhas por número de índice df %>% slice(1:10)
sample_n() Seleciona linhas aleatórias NA

Alguns dos comandos utilizados no dplyr são:

Comando Descrição Exemplo
sum() Calcula a soma de uma coluna. df %>% summarise(total_col1 = sum(col1, na.rm = TRUE))
n() Conta o número de linhas em cada grupo df %>% group_by(col1) %>% summarise(count = n())
n_distinct() Conta o número de valores distintos em uma coluna df %>% summarise(unique_col1 = n_distinct(col1))
mean() Calcula a média de uma coluna df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE))
median() Calcula a mediana de uma coluna df %>% summarise(median_col1 = median(col1, na.rm = TRUE))
sd() Calcula o desvio padrão de uma coluna df %>% summarise(sd_col1 = sd(col1, na.rm = TRUE))
var() Calcula a variância de uma coluna df %>% summarise(var_col1 = var(col1, na.rm = TRUE))
min() Encontra o valor mínimo de uma coluna df %>% summarise(min_col1 = min(col1, na.rm = TRUE))
max() Encontra o valor máximo de uma coluna df %>% summarise(max_col1 = max(col1, na.rm = TRUE))
first() Obtém o primeiro valor de uma coluna em cada grupo df %>% group_by(col1) %>% summarise(first_col2 = first(col2))
last() Obtém o último valor de uma coluna em cada grupo. df %>% group_by(col1) %>% summarise(last_col2 = last(col2))
any() Verificar se qualquer valor em uma coluna satisfaz uma condição df %>% summarise(any_na = any(is.na(col1)))
all() Verificar se todos os valores em uma coluna satisfazem uma condição df %>% summarise(all_positive = all(col1 > 0))
row_number() Gera números de linha sequenciais dentro de cada grupo df %>% mutate(row_num = row_number())
rank() Calcula o ranking de valores dentro de cada grupo df %>% mutate(rank_col1 = rank(col1))
lag() Desloca os valores de uma coluna para baixo (por padrão, uma linha) df %>% mutate(lag_col1 = lag(col1, n = 1))
lead() Desloca os valores de uma coluna para cima (por padrão, uma linha) NA

Pacote ggplot2

Função Descrição Exemplo
ggplot() Esta função cria um objeto de gráfico ggplot vazio. É o ponto de partida para construir gráficos com ggplot2. dados%>% ggplot()
aes() Define os mapeamentos estéticos (estética) de variáveis aos aspectos visuais do gráfico, como eixo x, eixo y, cor, forma, etc. dados%>% ggplot(aes(x = variavel_x, y = variavel_y))
geom_point() Cria um gráfico de pontos dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_point()
geom_line() Cria um gráfico de linhas dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_line()
geom_bar() Cria um gráfico de barras dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_bar()
geom_tile() Cria um gráfico de calor dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_tile()
geom_boxplot() Cria um boxplot dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_boxplot()
geom_density() Cria um gráfico de densidade dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_density()
geom_histogram() Cria um histograma dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_histogram()
facet_wrap() Retorna linhas únicas de um data frame facet_wrap(~variável, ncol=2)
labs() Adiciona rótulos labs(title ="Título", x="Título eixo x", y="Título eixo y", fill="Legenda")

Pacote forcats

Pacote gt

Função Descrição Exemplo
tab_header() Adiciona título e subtítulo gt()%>%tab_header(title ="Título", subtitle="Subtítulo")
tab_source_note() Adiciona fonte gt()%>%tab_source_note(source_note="Fonte")
tab_footnote() Adiciona nota de rodapé gt()%>%tab_footnote( footnote = "All values in USD.", locations = cells_body(columns = name, rows = 3:4))
cols_align() Alinha texto gt()%>%cols_align(align = c("center"))
tab_row_group() Cria grupo de linhas tab_row_group(label = "continent",rows = 1:6)