16 Exerciții

Cu tabelul diamonds:

head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48
  1. Reprezentati histograma variabilelor price si table, colorate la alegere.
ggplot(data=diamonds, aes(x=price))+
  geom_histogram(color='white', fill='darkblue')
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
  1. Adaugati curba de densitate a distributiilor respective.
  2. Adaugati curba normala corespunzatoare distributiilor respective.
  3. Colorati graficul de sub curba de densitate cu o culoare la alegere.
  4. Separati fiecare grafic in functie de culoare (de la punctul 4).
  5. Separati fiecare grafic in functie de claritate.
  6. Separati fiecare grafic in functie de cut si culoare.
  7. Cate diamante de fiecare cut sunt in tabel (folositi functia table).
 table(diamonds$cut)
## 
##      Fair      Good Very Good   Premium     Ideal 
##      1610      4906     12082     13791     21551
  1. Reprezentati un boxplot pentru variabila price pentru fiecare culoare.

  2. Grupati box-urile in functie de cut.

  3. Colorati graficele de mai sus la alegere.

  4. Reprezentati un violin plot pentru price pentru fiecare culaore.

  5. Colorati viorile in functie de culoare.

  6. Separati graficul in functie de valorile cut.

  7. Repezentati cate un barplot pentru variabilele calitative din tabel.

  8. Colorati barele la alegere.

  9. Colorati barele fiecarui grafic in functie de clarity.

  10. Calculati intr-un tabel nou media, mediana si abaterea medie patratica a pretului pentru fiecare culoare in parte.

tabel_nou <- diamonds %>%
  group_by(color) %>%
  summarise(
    mediaPrice = mean(price),
    medianaPrice = median(price),
    sigmaPrice = sd(price)
  )
tabel_nou
## # A tibble: 7 × 4
##   color mediaPrice medianaPrice sigmaPrice
##   <ord>      <dbl>        <dbl>      <dbl>
## 1 D          3170.        1838       3357.
## 2 E          3077.        1739       3344.
## 3 F          3725.        2344.      3785.
## 4 G          3999.        2242       4051.
## 5 H          4487.        3460       4216.
## 6 I          5092.        3730       4722.
## 7 J          5324.        4234       4438.