EZRでt検定を行う前に知っておくべき2つの前提|対応の有無と平均値の意味を理学療法士がやさしく解説

2026/01/27

EZR コメディカル向け統計 初心者向け 統計の基本 統計初心者


はじめに

「統計のことはよくわからないけど、t検定だけは聞いたことある」
「EZRを入れたけど、どこを押せばいいのかわからない…」
そんなふうに感じたことはありませんか?

EZRは、クリック操作だけで簡単にt検定ができます。
難しい数式を覚える必要もなく、結果も自動で表示してくれるんです。

ですがt検定を行う前に知っておくべき大前提があります。
ここを間違うと結果も間違ってしまいます。

この記事では、EZRを使ってt検定を行う前に知っておくべき大前提を、統計が苦手な方でも安心して実践できるように、やさしく丁寧に解説します。

最後までお読みいただければ、次の画像の意味が分かるようになります。




一緒に、統計の「最初の壁」を越えていきましょう。

EZRでt検定を行う前に知っておくべき2つの大前提

  • 対応の「ある」 vs 対応の「ない」
  • 平均値に意味がある数値

この2点を解説します。

まずは、対応の「ある・なし」について解説します。

t検定における対応の「ある・なし」とは?

t検定には「対応のある」「対応のない」の2種類があります。
どちらを使うかは、“同じ人を比べているのか、違う人を比べているのか”で決まります。

  • 同じ人の「前後」を比べるなら『対応あり』
  • 「別々」のグループを比べるなら『対応なし』


この区別を正しく行うことで、検定結果の信頼性が大きく変わります。
つまり、「対応のある・なし」を選ぶことは、単なる操作手順ではなく、研究デザインそのものを正しく理解する行為なのです。

🧩 1. 定義の整理

👥 2. どちらを選ぶかの判断基準

対応のあるt検定を使うのは…

「同じ人」を2回測定したデータの場合。
例:

  • 介入前 vs 介入後の歩行速度
  • 利き手 vs 非利き手の筋力
  • 同じ患者の現在 vs 1年後

対応のないt検定を使うのは…

比較する2つの群が「別の人たち」で構成されている場合。
例:

  • 男性群 vs 女性群
  • リハビリ介入あり群 vs なし群
  • 右麻痺群 vs 左麻痺群

💡 3. 実務での判断フロー


📘 4. まとめ



もう少し深堀りしたい方は、👇の記事もどうぞ。



次は「平均値に意味があるかどうか」です。

平均値に意味があるとは

t検定では「平均値の差」を比べますが、そもそもその平均値に“意味”があるかどうかを考えたことはありますか?

平均値が意味を持つのは、データが「連続的」で「偏りが少ない」ときだけです。

逆に、外れ値が多かったり、アンケート結果の番号などを平均してしまうと、検定結果が現実を正しく反映しなくなることもあります。

この記事では、「平均値に意味があるとはどういうことか」を例を交えながらわかりやすく整理します。

🧠 1. 平均値は「代表値」のひとつにすぎない

まず前提として、平均値(mean)は「データの中心的な傾向(代表)」を表す代表値(measure of central tendency)の一種です。

代表値には他にも以下のようなものがあります。


つまり、「平均値」は“中心”を示す1つの方法にすぎません。
そして、その平均値に意味があるかどうかは、データの性質によって決まります。

📊 2. 平均値に「意味がある」のはどんなとき?

平均値が「意味を持つ」=平均でデータを代表しても良い状態とは、主に次の2つです。

✅ ① データが「連続量」であること

例:身長、体重、血圧、歩行速度、筋力

→ これらは数値の差に“意味”があるため、平均を取ることが正当化されます。

💡 例:「身長170cmと180cmの人の平均=175cm」は、実際に存在し得る値であり、意味を持ちます。

✅ ② 分布が「おおむね対称(正規分布と言います)」であること

データが大きく偏っていない場合、平均値は「典型的な値」をよく表します。


逆に、右に長い分布(右裾の長い分布:例→入院日数、年収など)では、平均値は典型的な値からズレてしまいます。

💡 例:5人の年収が「300万・320万・330万・340万・2000万」だった場合、平均は858万円ですが、ほとんどの人はその金額を得ていません。
→ この場合、中央値(330万円)の方が現実をよく表します。

⚠️ 3. 平均値が「意味を持たない」ケース

平均値を使うと誤解を生む代表例もあります。


➡ これらの場合は、中央値や最頻値を使う方が妥当です。

統計的検定も、t検定ではなくノンパラメトリック検定(例:Mann-Whitney U検定)を使います。

🩺 4. t検定と平均値の関係

t検定が比較しているのは「2群の平均値の差」です。
したがって、平均値に意味があるデータでなければt検定は適用できません。

つまり:
t検定を使うということは、「平均値がその集団を代表している」ということです。

この前提を無視して「とりあえずt検定」で比較してしまうと、検定結果の「意味」が失われるというリスクがあります。

💡 5. まとめ:「平均値に意味がある」とは?


正規分布に従うか?

次は正規分布に従うかどうかです。
これには『Shapilo-Wilk(シャピローウィルク)検定』を行うことで判断できます。

EZRでShapilo-Wilk(シャピローウィルク)検定を行う実際の手順




① 統計解析→連続変数の解析→正規性の検定の順にクリック


⚠️ EZRではKolmogorov~と書かれていますが、Shapilo-Wilk(シャピローウィルク)検定も同時にできるのでご安心ください。



② クリックすると以下の画面が新たに開きます。




③ 変数(1つ選択)の欄では、検定したいデータを1つ選んでください。


対応のない検定をするときは群分けしてください。
例えば、「性別==0」や「糖尿病の有無==1」のように、イコールを2つ並べます。



④ 結果は下記のように表示されます。


Shapilo-Wilk(シャピローウィルク)検定の結果は下の方にあります。
見るのは2つだけです。

  • p≧0.05:正規分布に従うと判断
  • p<0.05:正規分布しているとはいえない




⑤ 結果のグラフも同時に表示されます。


これをコピペすれば、そのままスライドに使うこともできます。



グラフが一見正規分布しているように見えるときもありますが、必ずShapilo-Wilk(シャピローウィルク)検定のp値を確認してくださいね。

⑥ 正規分布を確認した後は…


先ほどの例では、シャピローウィルク検定で「p>0.05」であることが確認できたため、t検定を行います。

まとめ

とりあえずt検定を使っておけばいいか…。
そんな現状から卒業し、適切にt検定が使えるようになることを目標に構成してまいりましたが、いかがでしたでしょうか?

ご質問等ありましたら、お問い合わせよりお願いいたします。

⚠️注意点

ここまでご説明してきた「正規分布の検定→等分散性の検定→t検定」といった順番で検定を行うことを「多重検定」といいます。
近年はこの「多重検定」を避ける傾向にあります。

ですが、以前はこの記事で説明したような手順で検定を行っておりました。
よって、指導教官や学会発表によっては
  • 正規分布は確認した?
  • 等分散性は見たの?
と質問されることもあります。

本記事ではそのような背景を踏まえて、「正規分布の検定→等分散性の検定→t検定」といった手順をご説明いたしました。


評価から統計へ|EZRは臨床の延長線上にある

統計解析は、突然どこかから始まるものではありません。
すべては、日々の臨床で行っている「評価」から始まります。 

私自身、SPPBのような評価を丁寧に続けてきたことが、 統計解析(EZR)へとつながりました。 

評価から統計へつながる入り口としてのSPPBについては、 👇の記事でやさしく解説しています。


運営者プロフィール

本サイト「理学療法士かずの評価と統計のやさしい処方箋」は、理学療法士かずが運営しています。

臨床経験を生かしつつ、学会発表や統計の学びに役立つ記事を執筆しています。
「難しそう…」を「やってみよう!」に変えるきっかけをお届けします。



※当サイトで紹介している手順・構成・テンプレートは、筆者のこれまでの経験に基づいた一例です。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。

QooQ