4.12 要約

次に,データの要約について紹介をしていく.データの要約とはあるデータに対して何らかの統計量を計算することで, そのデータの特徴を抽出する行為を指す.例えば平均などがよく知られている.

平均について少しよく考えてみよう.平均とは観測されたデータ\(\boldsymbol x = x_{1},\ldots,x_{n}\)が与えられた時,\(\bar x = \sum_{i=1}^{n} x_i/n\)と計算して求められる量である. 本来データは\(n\)個存在するのに,これらをたった一つの\(\bar x\)という値に集約した値になっている. つまり,文章の要約のように,データを平均という値を用いて要約して表現しているのである.

そういう意味では,最大値や最小値を算出することも,統計量であり要約に値する操作になっている. また,このような統計量は観測データを実数空間\(\mathbb R\)に写す関数\(f:\mathbb R^{n} \rightarrow \mathbb R\)と見なすこともできる.