Chapter 7 排序觀察值arrange()
第一部分
遞增排序,以及遞減排序
1.預設是由低到高
flights %>% arrange(dep_delay)
## # A tibble: 336,776 x 19
## year month day dep_time sched_dep_time dep_delay
## <int> <int> <int> <int> <int> <dbl>
## 1 2013 12 7 2040 2123 -43
## 2 2013 2 3 2022 2055 -33
## 3 2013 11 10 1408 1440 -32
## 4 2013 1 11 1900 1930 -30
## 5 2013 1 29 1703 1730 -27
## 6 2013 8 9 729 755 -26
## 7 2013 10 23 1907 1932 -25
## 8 2013 3 30 2030 2055 -25
## 9 2013 3 2 1431 1455 -24
## 10 2013 5 5 934 958 -24
## # ... with 336,766 more rows, and 13 more variables:
## # arr_time <int>, sched_arr_time <int>,
## # arr_delay <dbl>, carrier <chr>, flight <int>,
## # tailnum <chr>, origin <chr>, dest <chr>,
## # air_time <dbl>, distance <dbl>, hour <dbl>,
## # minute <dbl>, time_hour <dttm>
- 加入
desc()
, descending order是遞減,由高到低
flights %>% arrange(desc(dep_delay))
## # A tibble: 336,776 x 19
## year month day dep_time sched_dep_time dep_delay
## <int> <int> <int> <int> <int> <dbl>
## 1 2013 1 9 641 900 1301
## 2 2013 6 15 1432 1935 1137
## 3 2013 1 10 1121 1635 1126
## 4 2013 9 20 1139 1845 1014
## 5 2013 7 22 845 1600 1005
## 6 2013 4 10 1100 1900 960
## 7 2013 3 17 2321 810 911
## 8 2013 6 27 959 1900 899
## 9 2013 7 22 2257 759 898
## 10 2013 12 5 756 1700 896
## # ... with 336,766 more rows, and 13 more variables:
## # arr_time <int>, sched_arr_time <int>,
## # arr_delay <dbl>, carrier <chr>, flight <int>,
## # tailnum <chr>, origin <chr>, dest <chr>,
## # air_time <dbl>, distance <dbl>, hour <dbl>,
## # minute <dbl>, time_hour <dttm>
範例
若完成,請直接貼到open chat
若有一位買家對於這32台車子很有興趣,特別是在省油表現(Miles/(US) gallon, mpg),以及馬力表現(hp, Gross horsepower)有很大的興趣,你要整理哪些資料?
後來他希望能夠買到馬力性能比較強的車,他要求你將馬力表現高於平均的車款額外整理給他,應該怎麼做呢?
假設這位買家最近試駕了很多台車款,閒聊時候偶然跟你分享他獨家的選車know-how,標準是省油表現(Miles/(US) gallon,mpg)數字的十倍,再加上馬力表現的總和,越高越好,請問哪一台車應該是他的心頭好?
要成交前,該位買家因為莫名原因心情好,決定要買他挑選標準該數據的前三名,請問你應該給他哪三台車的最終報價?
mtcars
mtcars %>% select(car_name, mpg, hp) %>%
filter(hp > mean(hp, na.rm = T)) %>%
mutate(good_cars = mpg*10 + hp) %>%
arrange(desc(good_cars))
自主練習
- 休士頓火箭隊,隊伍中前三大得分點是誰?