Урок 5 Пакет dplyr: Добавление новых вычисляемых столбцов, mutate, mutate_if, mutate_at, mutate_all
5.1 Описание
В этом видео мы продолжаем знакомство с библиотекой tidyverse
и пакетом dplyr
.
Мы разберём семейство функций mutate()
, и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.
5.3 Материалы
Все материалы к данному уроку можно найти по ссылке.
5.4 Код
# подключение пакетов
library(vroom)
library(dplyr)
# загрузка данных
<- vroom("https://raw.githubusercontent.com/selesnow/publications/master/code_example/from_excel_to_r/lesson_3/ga_nowember.csv")
ga_data
# mutate
# добавл¤ем новый столбец
<- mutate(ga_data,
ga_data bounce_rate = bounces / sessions)
<- mutate(ga_data,
ga_data bounce_rate = bounces / sessions,
br_group = if_else(bounce_rate > 0.6, "high_br", "normal_br"))
# примен¤ем преобразование к уже существующим столбцам
%>% mutate_if(is.character, toupper)
ga_data
# преобразуем значени¤ существующих столбцов примен¤¤ регул¤рные выражени¤
%>% mutate_at(vars(matches("s$")), sqrt )
ga_data
# transemute
# убираем все столбцы кроме преобразованных
transmute(ga_data,
bounce_rate = bounces / sessions,
date = format(date, "%d %B %Y"),
source)
# преобразовываем столбцы по их признаку и удал¤ем все остальные
transmute_if(ga_data,
is.character, toupper)