t検定をやろうとしたら、
「まず正規性を確認してください」と言われた。
でも、EZRのどこを押せばいいのか分からない。
シャピローウィルク検定って、どこにあるの?
この記事では、EZRで正規性の検定(Shapiro-Wilk検定)を行う具体的な手順を、画面の流れに沿ってわかりやすく解説します。
さらに、出力されたp値の見方や、正規分布と判断する基準、正規性がなかった場合の対処法までまとめました。
正規性の確認は、難しそうに見えて、実はクリック数回で終わります。
私の職場では、学会発表のたびに「統計処理どうしたらいい?」「EZRの操作が分からない」という相談をよく受けます。
そのため、初心者でも迷わないように自分用の操作マニュアルを作りました。
この記事では、その内容をもとにEZRで正規性の検定を行う手順をまとめています。
正規性の検定とは?なぜ必要?
正規性の検定は、データが正規分布しているかどうかを確認するために行います。
データが正規分布していると、t検定などの「パラメトリック検定」を使うことができます。
難しい理論は必要ありません。
クリック数回で確認できますので、一緒にやってみましょう。
EZRで正規性の検定を行う手順
クリック手順
統計解析→連続変数の解析→正規性の検定(Kolmogorov-sminov検定)の順にクリックします。
EZRで正規性の検定を行う手順は、たったのこれだけです。
ただし、「男性だけ」「特定の病気を持つ人だけ」など、群ごとに正規性を確認したいケースもよくあります。
EZRでは、群別に正規性の検定を行うにはひと手間が必要です。
次にその方法を解説します。
群別の正規性の検定を行う手順
クリック手順
統計解析→連続変数の解析→正規性の検定(Kolmogorov-sminov検定)の順にクリックします。(ここは先ほどと同じです)
男性だけの正規性の検定を行う手順
今回のデータでは、男性は「0」と入力されています。
画面下部の入力欄に、次のように入力します。
性別==0
「性別」+「半角のイコールを2つ(==)」+「半角数字の0」です。
この設定を行うと、男性(性別=0)のデータだけを使って正規性の検定が実行されます。
女性だけの正規性の検定を行う手順
今回のデータでは、女性は「1」と入力されています。
画面下部の入力欄に、次のように入力します。
性別==1
「性別」+「半角のイコールを2つ(==)」+「半角数字の1」です。
病気の有り無しで群別の正規性の検定を行う手順
今回のデータでは、糖尿病を持っていない人は「0」と入力されています。
画面下部の入力欄に、次のように入力します。
糖尿病の有無==0
「糖尿病の有無」+「半角のイコールを2つ(==)」+「半角数字の0」です。
この設定を行うと、糖尿病がない人(糖尿病の有無=0)のデータだけを使って正規性の検定が実行されます。
病気の有り無しで群別の正規性の検定を行う手順
今回のデータでは、糖尿病を持っている人は「1」と入力されています。
画面下部の入力欄に、次のように入力します。
糖尿病の有無==1
「糖尿病の有無」+「半角のイコールを2つ(==)」+「半角数字の1」です。
この設定を行うと、糖尿病がある人(糖尿病の有無=1)のデータだけを使って正規性の検定が実行されます。
今回紹介した「性別」や「糖尿病の有無」はあくまで一例です。
データが群分けされていれば、同じ方法で正規性の検定を行うことができます。
結果の見方|p値はどう判断する?
データが5,000以下の場合は、Shapiro-Wilk(シャピローウィルク)検定の結果を見ます。
結果は画面の下部に出力されます。
p値は一番最後に出力されます。
グラフも同時に出力されます。
グラフはパワーポイント等に貼り付けて、そのままスライドに使うことができます。
正規性の検定でp値の解釈
Shapiro-Wilk(シャピローウィルク)検定では
- 0.05以上 → 正規分布しているとみなせる
- 0.05未満 → 正規分布しているとは言えない
と解釈します。
画像の例では、p=0.9916ですので、正規分布しているとみなすことができます。
では次に、正規性の有無が検定の選択にどう影響するのかを解説します。
正規性がなかったらどうする?
ここからは、正規性の検定の結果をもとにどの検定を選べばよいのかを解説します。
まずは、検定の選び方をまとめた👇のフローチャートをご覧ください。
対応のある標本の差の検定の選択
対応のある標本が2つとも正規分布とみなすことができる場合、対応のあるt検定を選択します。
反対に、標本のうち少なくとも1つが正規分布ではなかった場合は、ノンパラメトリック検定であるウィルコクソン符号付順位和検定を選択します
「対応のある」の意味がよくわからないといった方には👇の記事も参考になります。
対応のない標本の差の検定の選択
対応のない標本が2つとも正規分布とみなすことができる場合、t検定を選択します。
反対に、標本のうち1つでも正規分布ではなかった場合は、ノンパラメトリック検定であるマンホイットニーU検定を選択します。
相関関係を見たい2つの変数がどちらも正規分布とみなすことができる場合、ピアソンの積率相関係数を選択します。
反対に、少なくとも1つが正規分布ではなかった場合は、ノンパラメトリック検定であるスピアマンの順位相関係数を選択します。
このように、正規分布しているかどうかを確認することで、必要な検定を選択することができます。
ただし、注意点もあります。
⚠️注意点
このように「正規性の検定を先に行ってから他の検定を行う」といった手順は、統計学的には多重検定の問題が指摘されることがあります。
近年はこの「多重検定」を避ける傾向にあります。
ですが、以前はこの記事で説明したような手順で検定を行っておりました。
よって、指導教官や学会発表によっては
- 正規分布は確認した?
- 等分散性は見たの?
と質問されることもあります。
本記事ではそのような背景を踏まえて、「正規分布の検定を先に行う」といった手順をご説明いたしました。
正規性の検定が確認できたら、次は実際の検定(t検定やノンパラメトリック検定)に進みます。
EZRを使った検定方法についても、別の記事で解説しています。
🔗 関連記事
✅ EZRの導入がまだの方へ
はじめて使う方でも進められるよう、ダウンロードから起動までを丁寧にまとめています。
✅ データ準備で迷っている方へ
列の作り方や保存形式など、つまずきやすいポイントを具体例で整理しています。
✅ SPPBを扱う予定の方へ
評価後の集計を効率化したい方向けの実践ツールです。
評価から統計へ|EZRは臨床の延長線上にある
統計解析は、突然どこかから始まるものではありません。
すべては、日々の臨床で行っている「評価」から始まります。
私自身、SPPBのような評価を丁寧に続けてきたことが、 統計解析(EZR)へとつながりました。
評価から統計へつながる入り口としてのSPPBについては、 👇の記事でやさしく解説しています。
運営者プロフィール
本サイト「理学療法士かずの評価と統計のやさしい処方箋」は、理学療法士かずが運営しています。
臨床の現場で感じてきた「ここが分からなくて止まる」を大切にしながら、学会発表や統計の学びに役立つ記事を書いています。
「難しそう…」と手が止まったときに、「まずはここだけやってみよう」と思える。
そんなきっかけをお届けできたらうれしいです。
※当サイトで紹介している手順・構成・テンプレートは、筆者のこれまでの経験に基づいた一例です。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
.png)










.png)

