7.1 Atalhos e comandos
Operadores
Operador | Descrição |
---|---|
+ | Operador de adição |
- | Operador de subtração |
* | Operador de multiplicação |
/ | Operador de divisão |
: | Operador de sequência |
^ | Operador exponencial |
%% | Operador de módulo |
== | Operador de igualdade |
> | Operador maior que |
>= | Operador maior ou igual que |
< | Operador menor que |
<= | Operador menor ou igual que |
! | Operador "Não" |
& | Operador "E" |
| | Operador "Ou" |
Detalhamento de objetos
Função | Descrição |
---|---|
str() | Exibe de forma compacta a estrutura interna de um objeto em R. |
names() | Nomes dos elementos dentro de um objeto |
class() | Recupera a classe interna de um objeto |
mode() | Obtém ou define o tipo ou modo de armazenamento de um objeto |
length() | Recupera ou define a dimensão de um objeto. |
dim() | Recupera ou define a dimensão de um objeto. |
sessionInfo() | Imprime informações sobre a versão do R e pacotes anexados ou carregados |
options() | Permite ao usuário definir e examinar uma variedade de opções globais |
7.1.1 Pacotes
Pacote Dplyr
Função | Descrição | Exemplo |
---|---|---|
summarize () | Resume dados para criar uma única linha de resumo. | df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE)) |
select() | Seleciona colunas específicas de um data frame. | df %>% select(col1, col2) |
filter() | Filtra linhas de um data frame com base em condições. | df %>% filter(col1 == "value", col2 > 10) |
arrange() | Ordena as linhas de um data frame | df %>% arrange(col1) |
mutate() | Cria novas colunas ou modifica colunas existentes | df %>% mutate(new_col = col1 * 2) |
group_by() | Agrupa os dados por uma ou mais colunas antes de aplicar operações de resumo | df %>% group_by(col1) %>% summarise(mean_col2 = mean(col2, na.rm = TRUE)) |
left_join() | Realiza a junção de dois data frames (semelhante ao SQL left join). | df1 %>% left_join(df2, by = "key") |
right_join() | Realiza a junção de dois data frames (semelhante ao SQL right join). | df1 %>% right_join(df2, by = "key") |
inner_join() | Realiza a junção de dois data frames, mantendo apenas as linhas correspondentes. | df1 %>% inner_join(df2, by = "key") |
full_join() | Realiza a junção de dois data frames, mantendo todas as linhas | df1 %>% full_join(df2, by = "key") |
distinct() | Retorna linhas únicas de um data frame | df %>% distinct(col1, col2) |
rename() | Renomeia colunas de um data frame | df %>% rename(new_name = old_name) |
slice() | Seleciona linhas por número de índice | df %>% slice(1:10) |
sample_n() | Seleciona linhas aleatórias | NA |
Alguns dos comandos utilizados no dplyr são:
Comando | Descrição | Exemplo |
---|---|---|
sum() | Calcula a soma de uma coluna. | df %>% summarise(total_col1 = sum(col1, na.rm = TRUE)) |
n() | Conta o número de linhas em cada grupo | df %>% group_by(col1) %>% summarise(count = n()) |
n_distinct() | Conta o número de valores distintos em uma coluna | df %>% summarise(unique_col1 = n_distinct(col1)) |
mean() | Calcula a média de uma coluna | df %>% summarise(mean_col1 = mean(col1, na.rm = TRUE)) |
median() | Calcula a mediana de uma coluna | df %>% summarise(median_col1 = median(col1, na.rm = TRUE)) |
sd() | Calcula o desvio padrão de uma coluna | df %>% summarise(sd_col1 = sd(col1, na.rm = TRUE)) |
var() | Calcula a variância de uma coluna | df %>% summarise(var_col1 = var(col1, na.rm = TRUE)) |
min() | Encontra o valor mínimo de uma coluna | df %>% summarise(min_col1 = min(col1, na.rm = TRUE)) |
max() | Encontra o valor máximo de uma coluna | df %>% summarise(max_col1 = max(col1, na.rm = TRUE)) |
first() | Obtém o primeiro valor de uma coluna em cada grupo | df %>% group_by(col1) %>% summarise(first_col2 = first(col2)) |
last() | Obtém o último valor de uma coluna em cada grupo. | df %>% group_by(col1) %>% summarise(last_col2 = last(col2)) |
any() | Verificar se qualquer valor em uma coluna satisfaz uma condição | df %>% summarise(any_na = any(is.na(col1))) |
all() | Verificar se todos os valores em uma coluna satisfazem uma condição | df %>% summarise(all_positive = all(col1 > 0)) |
row_number() | Gera números de linha sequenciais dentro de cada grupo | df %>% mutate(row_num = row_number()) |
rank() | Calcula o ranking de valores dentro de cada grupo | df %>% mutate(rank_col1 = rank(col1)) |
lag() | Desloca os valores de uma coluna para baixo (por padrão, uma linha) | df %>% mutate(lag_col1 = lag(col1, n = 1)) |
lead() | Desloca os valores de uma coluna para cima (por padrão, uma linha) | NA |
Pacote ggplot2
Função | Descrição | Exemplo |
---|---|---|
ggplot() | Esta função cria um objeto de gráfico ggplot vazio. É o ponto de partida para construir gráficos com ggplot2. | dados%>% ggplot() |
aes() | Define os mapeamentos estéticos (estética) de variáveis aos aspectos visuais do gráfico, como eixo x, eixo y, cor, forma, etc. | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) |
geom_point() | Cria um gráfico de pontos | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_point() |
geom_line() | Cria um gráfico de linhas | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_line() |
geom_bar() | Cria um gráfico de barras | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_bar() |
geom_tile() | Cria um gráfico de calor | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_tile() |
geom_boxplot() | Cria um boxplot | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_boxplot() |
geom_density() | Cria um gráfico de densidade | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_density() |
geom_histogram() | Cria um histograma | dados%>% ggplot(aes(x = variavel_x, y = variavel_y)) %>% geom_histogram() |
facet_wrap() | Retorna linhas únicas de um data frame | facet_wrap(~variável, ncol=2) |
labs() | Adiciona rótulos | labs(title ="Título", x="Título eixo x", y="Título eixo y", fill="Legenda") |
Pacote forcats
Pacote gt
Função | Descrição | Exemplo |
---|---|---|
tab_header() | Adiciona título e subtítulo | gt()%>%tab_header(title ="Título", subtitle="Subtítulo") |
tab_source_note() | Adiciona fonte | gt()%>%tab_source_note(source_note="Fonte") |
tab_footnote() | Adiciona nota de rodapé | gt()%>%tab_footnote( footnote = "All values in USD.", locations = cells_body(columns = name, rows = 3:4)) |
cols_align() | Alinha texto | gt()%>%cols_align(align = c("center")) |
tab_row_group() | Cria grupo de linhas | tab_row_group(label = "continent",rows = 1:6) |