LASI 2019 - Visualization meets Learning Analytics
1 researcher
Базовая картинка - показывает как связаны количество кликов в вле на форуме и средний балл за assignments
dfp = df %>%
  filter(vle_click_forumng > 0)
p_old = ggplot(data = dfp, aes(x = vle_click_forumng, y = mean_assign_score)) +
  geom_point()
p_old
гештальт принципы - близость - группируем мы можем помочь зрителю увидеть связь - провести линию
ggplot(data = dfp, aes(x = vle_click_forumng, y = mean_assign_score)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)
точки группируются по тому как они выглдят similarity простой способ визуальной группировки - цвет, с помощью него можно показать дополнительную информацию
ggplot(data = dfp, aes(x = vle_click_forumng, y = mean_assign_score, color = gender)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)
любая информация не доносящая никакой полезной информации - лишьняя - удаляем! потому что зритель тратит ресурсы на восприятие
ggplot(data = dfp, aes(x = vle_click_forumng, y = mean_assign_score, color = gender)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  theme_bw() 
логарифмируем шкалу - в ней много “выбросов” (?)
p_new = ggplot(data = dfp, aes(x = vle_click_forumng, y = mean_assign_score, color = gender)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  theme_bw() +
  scale_x_log10()
p_new
попробуйте проинтерпретировать картинку №1 и №последняя есть разница
показываем 2 картинки рядом 1 и последняя может тут вводочка про patchwork мб и комбинирование график

## 
## Call:
## lm(formula = mean_assign_score ~ vle_click_forumng, data = dfp)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -41.830  -6.904   2.143   7.879  22.956 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       6.681e+01  6.461e-01 103.405  < 2e-16 ***
## vle_click_forumng 4.128e-03  6.747e-04   6.119 2.47e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.61 on 359 degrees of freedom
##   (13 observations deleted due to missingness)
## Multiple R-squared:  0.09444,    Adjusted R-squared:  0.09192 
## F-statistic: 37.44 on 1 and 359 DF,  p-value: 2.466e-09
df_assignments = df_assignments %>% 
  mutate(diff_submit = date_submitted - date)
# в зависимости от того что из чего вычитаем (какой знак остается)
# меняется восприятие
# дни после сдачи - интуитивно (справа то что позднее)
ggplot(data = df_assignments, aes(x = diff_submit, y = score)) +
  geom_point() +
  geom_smooth(method = "lm") +
  theme_bw()
## 
##  Pearson's product-moment correlation
## 
## data:  df_assignments$score and df_assignments$diff_submit
## t = -5.3492, df = 1629, p-value = 1.009e-07
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.17878294 -0.08337932
## sample estimates:
##        cor 
## -0.1313853
1.1 положение курсов по количеству студентов и pass rate
ggplot() +
  geom_point(data = df_courses, aes(x = count_students, y = share_passed)) +
  ggrepel::geom_text_repel(data = df_courses, aes(x = count_students, y = share_passed, label = str_c(code_module, "_", code_presentation))) +
  geom_smooth(data = df_courses, aes(x = count_students, y = share_passed), method = "lm", se = FALSE) +
  theme_bw()