序文

第0.65版日本語訳に寄せて

本書はDavid Foxcroft氏が作成した『Learning statistics with jamovi(jamoviで学ぶ統計法)』の日本語訳です。なお,この下にあるように,原著はDanielle Navarro氏による『Learning statistics with R(Rで学ぶ統計法)』をもとに作成されたもので,使用するソフトウェアが異なる以外は基本的に『Learning statistics with R(Rで学ぶ統計法)』の内容と同じものです。この本を翻訳しようと考えたのは,自分自身の授業でjamoviを使用する際の資料が欲しかったからです。私自身は普段の統計処理はほぼすべてRを使っており,今のところそれで不便は感じていないのですが,授業でRを使うとなると話は別で,限られた授業回数の中でソフトウェアの使い方に時間をとられすぎずに統計の内容を扱うにはRよりjamoviの方が適しているように思います。ただ,jamoviはかなり新しいソフトウェアなので,参考になる資料(とくに日本語のもの)がまだほとんどありません。そこで自分の授業用に自分で一から作成しようとしていたところ(これはこれで別に作成するつもりですが),偶然本書にたどり着いたのです。内容的には私が授業の中で扱うよりもずっと詳しく分量も多いので,これをこのまま教科書として使うことはできませんが,不釣り合い型分散分析のタイプ1〜タイプ3の2乗和の話など,よりしっかり学びたい人向けの参考書としてはいいものだと思います(次の版ではぜひ因子分析を内容に追加して欲しいところです)。

なお,本書の元となった『Learning statistics with jamovi(jamoviで学ぶ統計法)』や『Learning statistics with R(Rで学ぶ統計法)』のオンライン版はPDF形式で提供されていますが,本書を参照しながらjamoviを使用するには,スマートフォンやタブレットで閲覧できる方が便利なのではないかと考えました。その場合,とくにスマートフォンではPDFは見づらくなりますので,本書はRの拡張パッケージであるBookdownを使用し,HTML版として作成しています。

翻訳にあたっては,できるだけ原文から離れないよう心がけましたが,同時に日本語として読みにくいものにならないようにも努めました。そのため,原文より説明が簡素になっている部分もあれば,逆に原文にはない説明が補足的に加えられている部分もあります。また,jamoviの更新によってあてはまらなくなった部分については,現在のバージョンにできるだけ合わせる形に内容を修正しています。さらに,原文は皮肉も多く,詩や文学作品からの引用もあって,ただしく,あるいはうまく翻訳できていないところもあるだろうと思います。それらを発見された場合はご指摘いただけると助かります。

芝田 征司

第0.65版へに寄せて

本書はDanielle Navarro氏による素晴らしい教科書『Learning statistics with R(Rで学ぶ統計法)』の分岐版で,分析に使用する統計ソフトウェアや例をjamovi用に置き換えたものです。Rは強力な統計プログラミング言語ですが,統計法入門クラスの教師や学生たちが簡単に使えるようなものではありません。マウスをクリックして使えるソフトウェアを好む教師や学生たちにとっては,jamoviはまさにうってつけでしょう。jamoviは2つの側面からRの使用を簡素化するものです。その1つは,マウスクリックによるグラフィカル・ユーザーインターフェース(GUI)を提供していること,そしてもう1つはさまざまな機能を組み合わせてSPSSやSASを使用するときのような感覚でRを使用できるようにしてくれていることです。ここで重要なのは,jamoviが無料かつオープンなソフトウェアであるということです。これはjamoviのもつ非常に重要な部分です。jamoviは,科学者のコミュニティが科学者のコミュニティのために作成したものなのです。

本版の執筆にあたり,原稿を読んで有益なコメントや修正をくれた方々,中でもDavid Emery博士とKirsty Walter氏には心から感謝を示したいと思います。

David Foxcroft

2018年7月1日

第0.6版に寄せて

2015年に第0.5版を出して以降,本書の内容はそれほど変わっていません。ただ,私の方はいろいろと変化がありました。2016年にはアデレードからシドニーに引っ越し,アデレードの時とは違う内容をニューサウスウェールズ大学(UNSW)で教えることになりました。こちらに越してきてから,本書にかける時間がほとんどなかったのです。今こうして読み返してみると,ちょっと複雑な気分です。それはなぜかと言うと……

  • うまく表現できませんが,本書は全体を通して私の性別を正しく表現していません。ただし,これは私自身の問題です(笑)。第1章の脚注で説明していますが,私は2年間にわたるジェンダー受容過程を経て,実生活では自分のことを主として「女性」と認識するようになりました。ただ,私は今も昔もめんどくさがり屋なので,それらは本書ではそのままになっています。

  • 第0.6版は,主に指摘のあった誤字やその他の誤りの修正が中心です。その中では,セクション14.4で取りあげたlsrパッケージ(現在ではもう更新されていません)のetaSquared関数に関する問題は大きな修正点です。この関数は本書にある単純な例ではうまく動くのですが,チェックする時間がなくて気づけなかったバグがあるのです。ですので,これを使うときは注意してください。

  • 最大の変化はライセンス形態です。本版からクリエイティブコモンズ・ライセンス(表示 - 継承 4.0 国際)の下で公開し,すべてのソースファイルを関連するGitHubのレポジトリに置くことにしました。これで誰もが自由に使えます。

だから,誰かtidyverseの活用方法を書き加えた版を作ってくれるといいなと思ったりします。どうやらRの世界では,最近これがとても重要になっているようですので。

Danielle Navarro

第0.5版に寄せて

1年ぶりの更新です。今回は本書のセクション構造を中心に改訂を行いました。第9章から第11章までは完全に書き直しました。これでだいぶ改善されたのではないかと思います。同じく,第17章は完全に新しい内容で,ここではベイズ統計を中心に扱っています。この変更で本書はずっといいものになった感じがします。本書で扱う推測統計が従来的な視点から書かれているという点に,私はつねに違和感を持っていました。自分の研究ではほぼすべての場面でベイズ統計を使っているからです。今回,なんとかベイズ流の考え方を本書に取り込むことができましたので,本書全体に対する私の印象もだいぶ良くなりました。今回の更新では他の部分も修正したかったのですが,授業に終われていることもあって,ひとまずはここまでとなりました。

Dan Navarro

2015年2月16日

第0.4版に寄せて

前回の序文から1年が経ちました。本書は大きな部分でいくつか変更がありました。第3章と第4章にはRstudioの便利な機能に関する説明を追加しました。第12章と第13章は,lsrパッケージの新しい関数を使って\(\chi^2\)検定や\(t\)検定を行っており,相関係数の議論もlsrの新関数にあわせて修正しました。第0.3版からリンク機能を採り入れましたが,第0.4版では内部参照が改善されています(セクションをまたぐリンクが機能するようになりました)。その他いろいろな微調整があり,誤字脱字もたくさん修正しました(指摘してくれた人ありがとう)。ただ,全体としてみれば,第0.4版は第0.3版からそれほど大きくは変わっていません。

もっと追加したい内容があったのですが,残念ながらその時間的余裕がありませんでした。反復測定ANOVAや混合モデルに関する説明がないという部分はなんとも頭の痛いところです。この点について言い訳をさせてもらうと,2013年の初めに2人目の子供が生まれたため,この1年間はとにかくそれだけで手一杯だったのです。その結果,本書のような無償プロジェクトは,給料のもらえる仕事の後回しになってしまいました。今では少し落ち着きましたので,第0.5版は改訂作業もだいぶ進むのではないかと思います。

それにしても驚かされたのは本書のダウンロード数です。数ヶ月前にウェブサイトの基本的な利用統計を見ましたが,本書は(明らかにロボットによるものを除いて)1日あたり平均90回もダウンロードされているのです。これは励みになります。少なくとも,本書が役立つと思ってくれている人がいるということですから。

Dan Navarro

2014年2月4日

第0.3版に寄せて

じつをいうと,私には本書を出版したくないと思っている部分があります。まだ中途半端だからです。

嘘ではありません。参照は不十分ですし,章の要約もセクション見出しの単なる羅列ですし,索引もなければ練習問題もありません。構成もいまいちですし,カバーされているトピックも私が望んでいるほど包括的なものではありません。内容に満足のいかないセクションもあります。図は書き直す必要がありますし,食い違いのある部分や誤植もたくさんあります。つまり,本書は未完成品なのです。授業に追われておらず,数週間後に子供が生まれるといったことがなければ,本書は公開していなかったことでしょう。

ですから,もしあなたが授業用の素材を探している教員であったり,Rを学びたいと考えている博士コースの学生であったり,あるいは単に統計に興味のある一般の人であったなら,本書の利用では十分注意してください。あなたが目にしているのは初稿であり,あなたが求めている目的とは合わない可能性があります。出版費用が高価でインターネットも普及していない時代なら,このような形で本を公開しようとは思わなかったでしょう。本書に80ドル(商業出版社によるとこれが相場だそうです)も支払う人のことを考えると,じつに申し訳なく感じてしまうからです。ですが,今は21世紀です。PDFファイルを自分のウェブサイトに無料で掲載できますし,必要に応じてオンデマンド印刷するという形であれば,購入費用は出版社を介する場合の半額以下で済みます。これで私の罪悪感は薄まりました。だから本書を公開することにしたのです。このことを念頭に置いていただければ,本書の電子版は無料で,冊子版のものはオンラインで安価に手に入れることができます。それぞれの入手先アドレスは次の通りです。

電子版 http://www.compcogscisydney.com/learning-statistics-with-r.html
冊子版 http://www.lulu.com/content/13570633

とはいえ,注意が必要なのは変わりません。この第0.3版はまだ作成途中の版だからです。本書が第1版を迎えたら,人々に教科書としての使用を勧められるようなものになるでしょう。そうなれば,おそらく私は恥知らずにインターネット上でバカみたいに宣伝して廻ると思います。しかしその日が来るまでは,私は現段階の本書について両面的な感情を持っているということをはっきりさせておきたいと思います。こうした部分はあるものの,とくに本書を薦めたい人たちというのもあります。それは,2013年に本学の研究法の授業(DRIPとDRIP:A)を履修する心理学科の学生です。その人たちにとっては本書は理想的です。本書は授業に沿う形で書かれているからです。記述内容に何か問題があったとしてもその場で内容を訂正できますし,問題部分を修正できます。つまり,自分がとっている授業に特化した教科書を,無料(電子版)または安価(冊子版)で手に入れられるのです。さらに,本書の内容は一通りチェックもされています。第0.1版は2011年の授業で,第0.2版は2012年の授業で使用されました。そして今年はそれらを改訂した第0.3版なのです。本書が飛び抜けて素晴らしものだといっているわけではありません。実際そうではありませんし。もちろん,授業評価に「素晴らしい本だ!」と書きたい分には大歓迎ですが。ただ,これまで数年間使ってきた内容ですので,それなりのものにはなっています。それに,何か問題が発生した場合にはそれに対処するチームがいますし,少なくとも講師の1人は本書を隅から隅まで読んでいることが保証されています。

それはさておき,本書の目的について少し説明しておきたいと思います。まず核となる部分として,本書は心理学専攻の学生向けの統計入門用に書かれた教科書だということがありまです。ですから,その手の教科書に一般的な内容を取り扱っています。たとえば,研究デザイン,記述統計,仮説検定の考え方,\(t\)検定,\(\chi^2\)検定,分散分析(ANOVA),回帰などです。ただし,本書ではR統計パッケージ向けの章もあり,そこではデータの取り扱いやプログラミングに関する内容が扱われています。さらに,本書には心理学の学生向を対象とする統計の授業では素通りされてしまうことの多い内容もたくさん含まれていることに気づくでしょう。確率の章では,ベイズ主義と頻度主義の見解の相違について多くのページを割いています。また,仮説検定におけるネイマンとフィッシャーの意見対立についても取りあげています。確率と確率密度の違いについても論じました。データ数が異なる場合の分散分析におけるタイプI,II,III平方和の問題についても詳細に扱っています。エピローグを見ていただければ,実際には進んだ内容をもっとたくさん追加したかったのだということがわかると思います。

なぜ私はこんなことをしているのでしょうか。その理由は単純です。学生たちは,こうした内容をきちんと扱うことができますし,楽しんでいるようにすら見えるからです。過去数年間,心理学専攻の学部生たちにRを教えることがぜんぜん難しいことではないということに,私はいい意味で驚かされてきました。学生にとって簡単でないことは確かですし,採点基準は少しばかり寛大にする必要があるということはわかりましたが,学生たちは最終的に目標に到達することができます。同様に,自分たちにとって適切な形で評価基準が設けられているということが保証されていれば,学生たちは統計的な考え方におけるあいまいさや複雑さにもさほど大きな問題なく対応できるようです。学生たちがなんとか扱えるのなら,これを教えない理由はありませんよね。そこから得られる潜在的な利益はかなり魅力的です。Rを学べば,学生たちはCRANにアクセスするようになります。これは,現存する中でおそらく最大かつもっとも包括的な統計ツールのライブラリです。確率理論を詳しく学べば,必要に応じて従来型の仮説検定からベイズ流のやり方に切り替えることも容易です。何といっても素晴らしいのは,就職に有利なデータ分析のスキルを高価な商用ソフトウェアを使わなくても身につけることができるということです。

ただし,残念ながら本書はすべての問題を解決できる特効薬ではありません。まだまだ進行中のプロジェクトです。でも,完成したあかつきには有用なツールになることでしょう。少なくともたくさんある中の1つにはなるはずです。Rを使った統計基礎の入門書というのはたくさんありますし,私の本がそれらより優れているというほど私は傲慢ではありません。ですが私は本書の方が好きですし,まだまだ不完全ながら,本書が役立つと思ってくれる人もいるのではと思います。

Dan Navarro

2013年1月13日

Creative Commons License
本書はクリエイティブ・コモンズ 表示 - 継承 4.0 国際ライセンスの下に提供されています。