Язык R для пользователей Excel
2022-09-15
Введение
Предисловие
В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.
В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс “Язык R для пользователей Excel”. Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.
О курсе
Курс построен вокруг архитектуры tidyverse
, и входящих в неё пакетов: readr
, vroom
, dplyr
, tidyr
, ggplot2
.
Конечно в R есть и другие хорошие пакеты выполняющие подобные операции, например data.table
, но синтаксис tidyverse
интуитивно понятен, его легко читать даже неподготовленному пользователю, поэтому я думаю, что начинать обучение языку R лучше именно с tidyverse
.
Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.
Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.
К каждому из уроков предусмотрен тест. Тест состоит как из теоритических вопросов так и из задач на программирование. Решать тесты или нет лично ваш выбор, но они однозначно помогут вам закрепить полученный в видео лекциях материал. Если вы застряли на какой-то из практических задач можно подсмотреть её решение в разделе с решениями.
Для кого этот курс
Думаю это понятно из названия, тем не менее опишу более подробно.
Курс ориентирован на тех, кто в работе активно использует Microsoft Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.
Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.
Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr
и tidyr
будет рассмотрен достаточно подробно.
Материалы к курсу
В каждом уроке есть ссылка на папку с материалами, и на каждый отдельный файл, так же в каждом из уроков вы найдёте пример рассмотренного в лекции кода.
Но, при желании вы можете скачать все материалы курса одним архивом.
Об авторе
Меня зовут Алексей Селезнёв, с 2008 года я являюсь практикующим аналитиком. На данный момент основной моей деятельностью является развитие отдела аналитики в агентстве интернет-маркетинга Netpeak.
Мною были разработаны такие R пакеты как: ryandexdirect
, rfacebookstat
, timeperiodsR
, rvkstat
и некоторые другие.
Также я являюсь автором курса “Язык R для интернет-маркетинга”.
Веду свой авторский Telegram и YouTube канал R4marketing. Буду рад видеть вас в рядах подписчиков.
Периодически публикую статью на различных интернет медиа, зачастую это Хабр и Netpeak Journal.
Неоднократно выступал на профильных конференциях по аналитике и интернет маркетингу, среди которых Матемаркетинг, GoAnalytics, Analyze, eCommerce, 8P и прочие.
Начиная с 2016 года всячески стараюсь популяризировать язык R среди русскоязычных аналитиков и маркетологов. Этот курс также был создан с этой целью.
Программа курса
- Устновка R и RStudio
- Основные структуры данных в R и установка и подключение пакетов
- Чтение данных из TSV, CSV, Excel файлов и Google Таблиц
- Фильтрация по строкам, продвинутый выбор столбцов, переименование столбцов, пайплайны
- Добавление новых вычисляемых столбцов
- Группировка и агрегация данных
- Вертикальное и горизонтальное объединение таблиц
- Оконные функции в R
- Вращение таблиц или аналог сводных таблиц R
- Загрузка данных из JSON файлов в R и преобразование списков в таблицы
- Простейшая визуализация данных, пакет ggplot2 и функция qplot()
- Построение графиков в R слой за слоем с помощью ggplot2
- Изменение элементов графиков и применение готовых тем в ggplot2
Благодарности
Курс, и все сопутствующие материалы предоставляются бесплатно, но если у вас есть желание отблагодарить автора за этот видео курс вы можете перечислить любую произвольную сумму на этой странице.
Либо с помощью кнопки: