我先談談為什麼書名取為「站穩小數據邁向大數據」。

不瞞各位讀者看官,第一次聽聞大數據,真的不懂。買了幾本書,跟其他師長來來回回多次口語激辯,稍微懂一些。但還是矇懞懂懂。最後,歸咎起來其實是「沒感覺」。

有人用「大、快、雜、疑」四個字描述什麼是「『大』數據」。正當全世界如火如荼、大啖大數據的各種傳聞之際,這世界出現了幾本名為「『小』數據」的著作。

聽過、聞過「大」,以為「小」是「大」的反義、以為「小數據」談的是放得進統計學課本的數據。如果是這樣的體悟,面對「大、快、雜、疑」的「大數據」,那「小數據」豈不就是「小、慢、純、信」嗎?

但是,讀過那幾本「小數據」大作後,發現「小數據」講的是「濃縮大數據」的「統計量」。唸過一兩本統計學教科書的讀者看官,一定對「平均數」非常有印象。

平均數就是一種「小數據」。

所以,這裡的「小數據」不是「不是大數據」;這裡的「大數據」也不是「不是小數據」。

曾經有過這麼一句話「小時胖不是胖」;如果取個諧音,也有這麼一句話「小時棒不是棒」。對作者而言,「小時胖不是胖」說的是「『會算、會用平均數』卻不懂『大數據』的我」!為此,本書作者誓言寫一本「為了邁向『大數據』,重鋪『小數據』之路」的小書。希望拋磚引玉激盪出更多小數據、大數據的知識火花。

「站穩小數據」主張「先懂小數據」、「先用小數據」再「邁向大數據」,意味著,「大數據」的基礎是「小數據」;不懂「小數據」何來「大數據」。

這是一種「scaleUping」的生活哲學。

但,作者必須強調一個觀點:「術業有專攻、不要一窩蜂」。