Chapter 7 排序觀察值arrange()

cheatsheet截圖對照

第一部分

遞增排序,以及遞減排序

1.預設是由低到高

flights %>% arrange(dep_delay)
## # A tibble: 336,776 x 19
##     year month   day dep_time sched_dep_time dep_delay
##    <int> <int> <int>    <int>          <int>     <dbl>
##  1  2013    12     7     2040           2123       -43
##  2  2013     2     3     2022           2055       -33
##  3  2013    11    10     1408           1440       -32
##  4  2013     1    11     1900           1930       -30
##  5  2013     1    29     1703           1730       -27
##  6  2013     8     9      729            755       -26
##  7  2013    10    23     1907           1932       -25
##  8  2013     3    30     2030           2055       -25
##  9  2013     3     2     1431           1455       -24
## 10  2013     5     5      934            958       -24
## # ... with 336,766 more rows, and 13 more variables:
## #   arr_time <int>, sched_arr_time <int>,
## #   arr_delay <dbl>, carrier <chr>, flight <int>,
## #   tailnum <chr>, origin <chr>, dest <chr>,
## #   air_time <dbl>, distance <dbl>, hour <dbl>,
## #   minute <dbl>, time_hour <dttm>
  1. 加入desc(), descending order是遞減,由高到低
flights %>% arrange(desc(dep_delay))
## # A tibble: 336,776 x 19
##     year month   day dep_time sched_dep_time dep_delay
##    <int> <int> <int>    <int>          <int>     <dbl>
##  1  2013     1     9      641            900      1301
##  2  2013     6    15     1432           1935      1137
##  3  2013     1    10     1121           1635      1126
##  4  2013     9    20     1139           1845      1014
##  5  2013     7    22      845           1600      1005
##  6  2013     4    10     1100           1900       960
##  7  2013     3    17     2321            810       911
##  8  2013     6    27      959           1900       899
##  9  2013     7    22     2257            759       898
## 10  2013    12     5      756           1700       896
## # ... with 336,766 more rows, and 13 more variables:
## #   arr_time <int>, sched_arr_time <int>,
## #   arr_delay <dbl>, carrier <chr>, flight <int>,
## #   tailnum <chr>, origin <chr>, dest <chr>,
## #   air_time <dbl>, distance <dbl>, hour <dbl>,
## #   minute <dbl>, time_hour <dttm>

範例

若完成,請直接貼到open chat

  1. 若有一位買家對於這32台車子很有興趣,特別是在省油表現(Miles/(US) gallon, mpg),以及馬力表現(hp, Gross horsepower)有很大的興趣,你要整理哪些資料?

  2. 後來他希望能夠買到馬力性能比較強的車,他要求你將馬力表現高於平均的車款額外整理給他,應該怎麼做呢?

  3. 假設這位買家最近試駕了很多台車款,閒聊時候偶然跟你分享他獨家的選車know-how,標準是省油表現(Miles/(US) gallon,mpg)數字的十倍,再加上馬力表現的總和,越高越好,請問哪一台車應該是他的心頭好?

  4. 要成交前,該位買家因為莫名原因心情好,決定要買他挑選標準該數據的前三名,請問你應該給他哪三台車的最終報價?

mtcars
mtcars %>% select(car_name, mpg, hp) %>%
filter(hp > mean(hp, na.rm = T)) %>%
mutate(good_cars = mpg*10 + hp) %>%
arrange(desc(good_cars))

自主練習

  1. 休士頓火箭隊,隊伍中前三大得分點是誰?