EZRでt検定を行う前に知っておくべき2つの前提｜対応の有無と平均値の意味を理学療法士がやさしく解説

はじめに

「統計のことはよくわからないけど、t検定だけは聞いたことある」
「EZRを入れたけど、どこを押せばいいのかわからない…」
そんなふうに感じたことはありませんか？

EZRは、クリック操作だけで簡単にt検定ができます。

難しい数式を覚える必要もなく、結果も自動で表示してくれるんです。

ですがt検定を行う前に知っておくべき大前提があります。

ここを間違うと結果も間違ってしまいます。

この記事では、EZRを使ってt検定を行う前に知っておくべき大前提を、統計が苦手な方でも安心して実践できるように、やさしく丁寧に解説します。

最後までお読みいただければ、次の画像の意味が分かるようになります。

一緒に、統計の「最初の壁」を越えていきましょう。

EZRでt検定を行う前に知っておくべき2つの大前提

対応の「ある」 vs 対応の「ない」

平均値に意味がある数値

この2点を解説します。

まずは、対応の「ある・なし」について解説します。

t検定における対応の「ある・なし」とは？

t検定には「対応のある」「対応のない」の2種類があります。

どちらを使うかは、“同じ人を比べているのか、違う人を比べているのか”で決まります。

同じ人の「前後」を比べるなら『対応あり』

「別々」のグループを比べるなら『対応なし』

この区別を正しく行うことで、検定結果の信頼性が大きく変わります。

つまり、「対応のある・なし」を選ぶことは、単なる操作手順ではなく、研究デザインそのものを正しく理解する行為なのです。

🧩 1. 定義の整理

👥 2. どちらを選ぶかの判断基準

対応のあるt検定を使うのは…

「同じ人」を2回測定したデータの場合。

例：

介入前 vs 介入後の歩行速度

利き手 vs 非利き手の筋力

同じ患者の現在 vs 1年後

対応のないt検定を使うのは…

比較する2つの群が「別の人たち」で構成されている場合。

例：

男性群 vs 女性群

リハビリ介入あり群 vs なし群

右麻痺群 vs 左麻痺群

💡 3. 実務での判断フロー

📘 4. まとめ

もう少し深堀りしたい方は、👇の記事もどうぞ。

🔗 対応のあるとは？

🔗 対応のないとは？

次は「平均値に意味があるかどうか」です。

平均値に意味があるとは

t検定では「平均値の差」を比べますが、そもそもその平均値に“意味”があるかどうかを考えたことはありますか？

平均値が意味を持つのは、データが「連続的」で「偏りが少ない」ときだけです。

逆に、外れ値が多かったり、アンケート結果の番号などを平均してしまうと、検定結果が現実を正しく反映しなくなることもあります。

この記事では、「平均値に意味があるとはどういうことか」を例を交えながらわかりやすく整理します。

🧠 1. 平均値は「代表値」のひとつにすぎない

まず前提として、平均値（mean）は「データの中心的な傾向（代表）」を表す代表値（measure of central tendency）の一種です。

代表値には他にも以下のようなものがあります。

つまり、「平均値」は“中心”を示す1つの方法にすぎません。

そして、その平均値に意味があるかどうかは、データの性質によって決まります。

📊 2. 平均値に「意味がある」のはどんなとき？

平均値が「意味を持つ」＝平均でデータを代表しても良い状態とは、主に次の2つです。

✅ ① データが「連続量」であること

例：身長、体重、血圧、歩行速度、筋力

→ これらは数値の差に“意味”があるため、平均を取ることが正当化されます。

💡 例：「身長170cmと180cmの人の平均＝175cm」は、実際に存在し得る値であり、意味を持ちます。

✅ ② 分布が「おおむね対称（正規分布と言います）」であること

データが大きく偏っていない場合、平均値は「典型的な値」をよく表します。

逆に、右に長い分布（右裾の長い分布：例→入院日数、年収など）では、平均値は典型的な値からズレてしまいます。

💡 例：5人の年収が「300万・320万・330万・340万・2000万」だった場合、平均は858万円ですが、ほとんどの人はその金額を得ていません。

→ この場合、中央値（330万円）の方が現実をよく表します。

⚠️ 3. 平均値が「意味を持たない」ケース

平均値を使うと誤解を生む代表例もあります。

➡ これらの場合は、中央値や最頻値を使う方が妥当です。

統計的検定も、t検定ではなくノンパラメトリック検定（例：Mann-Whitney U検定）を使います。

👉 ノンパラメトリック検定についてはこちらの記事で解説しています。

🩺 4. t検定と平均値の関係

t検定が比較しているのは「2群の平均値の差」です。

したがって、平均値に意味があるデータでなければt検定は適用できません。

つまり：

t検定を使うということは、「平均値がその集団を代表している」ということです。

この前提を無視して「とりあえずt検定」で比較してしまうと、検定結果の「意味」が失われるというリスクがあります。

💡 5. まとめ：「平均値に意味がある」とは？

正規分布に従うか？

次は正規分布に従うかどうかです。

これには『Shapilo-Wilk（シャピローウィルク）検定』を行うことで判断できます。

EZRでShapilo-Wilk（シャピローウィルク）検定を行う実際の手順

① 統計解析→連続変数の解析→正規性の検定の順にクリック

⚠️ EZRではKolmogorov～と書かれていますが、Shapilo-Wilk（シャピローウィルク）検定も同時にできるのでご安心ください。

② クリックすると以下の画面が新たに開きます。

③ 変数（1つ選択）の欄では、検定したいデータを1つ選んでください。

対応のない検定をするときは群分けしてください。

例えば、「性別==0」や「糖尿病の有無==1」のように、イコールを2つ並べます。

④ 結果は下記のように表示されます。

Shapilo-Wilk（シャピローウィルク）検定の結果は下の方にあります。

見るのは2つだけです。

p≧0.05：正規分布に従うと判断

p＜0.05：正規分布しているとはいえない

⑤ 結果のグラフも同時に表示されます。

これをコピペすれば、そのままスライドに使うこともできます。

グラフが一見正規分布しているように見えるときもありますが、必ずShapilo-Wilk（シャピローウィルク）検定のp値を確認してくださいね。

⑥ 正規分布を確認した後は…

先ほどの例では、シャピローウィルク検定で「p＞0.05」であることが確認できたため、t検定を行います。

まとめ

とりあえずt検定を使っておけばいいか…。

そんな現状から卒業し、適切にt検定が使えるようになることを目標に構成してまいりましたが、いかがでしたでしょうか？

ご質問等ありましたら、お問い合わせよりお願いいたします。

⚠️注意点

ここまでご説明してきた「正規分布の検定→等分散性の検定→t検定」といった順番で検定を行うことを「多重検定」といいます。

近年はこの「多重検定」を避ける傾向にあります。

ですが、以前はこの記事で説明したような手順で検定を行っておりました。

よって、指導教官や学会発表によっては

正規分布は確認した？
等分散性は見たの？

と質問されることもあります。

本記事ではそのような背景を踏まえて、「正規分布の検定→等分散性の検定→t検定」といった手順をご説明いたしました。

🔗 関連記事

👉「EZRのインストールが不安な方はこちら」

👉「EZRにExcelを読み込ませる方法はこちら」

👉「SPPB＋フレイル＋サルコペニア自動集計ツールはこちら」

評価から統計へ｜EZRは臨床の延長線上にある

統計解析は、突然どこかから始まるものではありません。

すべては、日々の臨床で行っている「評価」から始まります。

私自身、SPPBのような評価を丁寧に続けてきたことが、統計解析（EZR）へとつながりました。

評価から統計へつながる入り口としてのSPPBについては、 👇の記事でやさしく解説しています。

🔗 【無料配布】SPPBの評価用紙と自動集計シートを無料で公開中｜理学療法士作成の評価表

運営者プロフィール

本サイト「理学療法士かずの評価と統計のやさしい処方箋」は、理学療法士かずが運営しています。

臨床経験を生かしつつ、学会発表や統計の学びに役立つ記事を執筆しています。

「難しそう…」を「やってみよう！」に変えるきっかけをお届けします。

👉 詳しいプロフィールはこちら

※当サイトで紹介している手順・構成・テンプレートは、筆者のこれまでの経験に基づいた一例です。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。