4.1 可視化
ここでは,データを性質上量的変数(quantitative)と質的変数(qualitative)の2つに分けて考える. 量的変数とはいわゆる連続的な値を取る数値や,大小関係のある整数などと考えてよい.例えば身長や年齢,何かの重さ,面積などが考えられる.
質的変数とは,数値以外のデータや,数値ではあるけれども数値としての意味を持たないものと言える. 例えば性別は質的データである.また,1が男性,2が女性といった対応となっている場合,データとしては1,0の数値となっているので量的変数と捉えがちだが,\(1 < 2\)という関係はそのまま男性が女性より不等号の意味で大きいとは言えないので数値としての意味を持っていない.すなわちこれは質的変数として扱うべきである.
また本章では可視化の手法と合わせて,Rによる実装例も紹介する.グラフの作成についてはRのデフォルトの関数で実現するケースと,
ggplot
というより高度な作図ができるライブラリを使った実装例も紹介する.
そのほかにもplotly
といった有名な可視化ライブラリがあるので興味のある人は調べて欲しい.