4.16 分位点(quantile)

分位点(Quantile)とは,データを昇順(小さい順)に並べ,全体を100とした時に,小さい方から何%の位置のデータかを示す統計量である. 分位点における0%点は最小値,100%点は最大値と一致する.

特に,分位点の中でも四分位点がよく用いられる.四分位点とは4当分にした際の場所である\(0, 25, 50, 75, 100\)%点のことである.

4.16.1 Rでの計算

quantileという関数を利用することで,分位点を計算することができる. 具体的にはquantile(データベクトル, 0~1の値)と指定する. パーセントを指定しない場合は四分位が出力される.

quantile(iris$Sepal.Length)
##   0%  25%  50%  75% 100% 
##  4.3  5.1  5.8  6.4  7.9
quantile(iris$Sepal.Length, c(0.1, 0.99))
## 10% 99% 
## 4.8 7.7

4.16.2 中央値

中央値とは,50%点のことである.全体を並べた時に丁度真ん中に位置するデータ点である. 中央値は平均とセットで確認することが多い.平均と中央値が近しい値の時は,平均への外れ値の影響が少ないと考えられる. 一方,中央値と平均の乖離が大きい場合は,外れ値が多かったり,外れ値の値そのものが異常である可能性が考えられる.