4.12 要約

次に,データの要約について紹介をしていく.データの要約とはあるデータに対して何らかの統計量を計算することで, そのデータの特徴を抽出する行為を指す.例えば平均などがよく知られている.

平均について少しよく考えてみよう.平均とは観測されたデータ\boldsymbol x = x_{1},\ldots,x_{n}が与えられた時,\bar x = \sum_{i=1}^{n} x_i/nと計算して求められる量である. 本来データはn個存在するのに,これらをたった一つの\bar xという値に集約した値になっている. つまり,文章の要約のように,データを平均という値を用いて要約して表現しているのである.

そういう意味では,最大値や最小値を算出することも,統計量であり要約に値する操作になっている. また,このような統計量は観測データを実数空間\mathbb Rに写す関数f:\mathbb R^{n} \rightarrow \mathbb Rと見なすこともできる.