はじめに
「統計のことはよくわからないけど、t検定だけは聞いたことある」「EZRを入れたけど、どこを押せばいいのかわからない…」
そんなふうに感じたことはありませんか?
EZRは、クリック操作だけで簡単にt検定ができます。
難しい数式を覚える必要もなく、結果も自動で表示してくれるんです。
ですがt検定を行う前に知っておくべき大前提があります。
ここを間違うと結果も間違ってしまいます。
この記事では、EZRを使ってt検定を行う前に知っておくべき大前提を、統計が苦手な方でも安心して実践できるように、やさしく丁寧に解説します。
最後までお読みいただければ、次の画像の意味が分かるようになります。
一緒に、統計の「最初の壁」を越えていきましょう。
EZRでt検定を行う前に知っておくべき2つの大前提
- 対応の「ある」 vs 対応の「ない」
- 平均値に意味がある数値
この2点を解説します。
まずは、対応の「ある・なし」について解説します。
t検定における対応の「ある・なし」とは?
t検定には「対応のある」「対応のない」の2種類があります。
どちらを使うかは、“同じ人を比べているのか、違う人を比べているのか”で決まります。
- 同じ人の「前後」を比べるなら『対応あり』
- 「別々」のグループを比べるなら『対応なし』
この区別を正しく行うことで、検定結果の信頼性が大きく変わります。
つまり、「対応のある・なし」を選ぶことは、単なる操作手順ではなく、研究デザインそのものを正しく理解する行為なのです。
もう少し深堀りしたい方は、👇の記事もどうぞ。
🔗 対応のあるとは?
🔗 対応のないとは?
次は「平均値に意味があるかどうか」です。
平均値に意味があるとは
t検定では「平均値の差」を比べますが、そもそもその平均値に“意味”があるかどうかを考えたことはありますか?
平均値が意味を持つのは、データが「連続的」で「偏りが少ない」ときだけです。
逆に、外れ値が多かったり、アンケート結果の番号などを平均してしまうと、検定結果が現実を正しく反映しなくなることもあります。
この記事では、「平均値に意味があるとはどういうことか」を例を交えながらわかりやすく整理します。
🧠 1. 平均値は「代表値」のひとつにすぎない
まず前提として、平均値(mean)は「データの中心的な傾向(代表)」を表す代表値(measure of central tendency)の一種です。
代表値には他にも以下のようなものがあります。
つまり、「平均値」は“中心”を示す1つの方法にすぎません。
そして、その平均値に意味があるかどうかは、データの性質によって決まります。
📊 2. 平均値に「意味がある」のはどんなとき?
平均値が「意味を持つ」=平均でデータを代表しても良い状態とは、主に次の2つです。
✅ ① データが「連続量」であること
例:身長、体重、血圧、歩行速度、筋力
→ これらは数値の差に“意味”があるため、平均を取ることが正当化されます。
💡 例:「身長170cmと180cmの人の平均=175cm」は、実際に存在し得る値であり、意味を持ちます。
✅ ② 分布が「おおむね対称(正規分布と言います)」であること
データが大きく偏っていない場合、平均値は「典型的な値」をよく表します。
逆に、右に長い分布(右裾の長い分布:例→入院日数、年収など)では、平均値は典型的な値からズレてしまいます。
💡 例:5人の年収が「300万・320万・330万・340万・2000万」だった場合、平均は858万円ですが、ほとんどの人はその金額を得ていません。
→ この場合、中央値(330万円)の方が現実をよく表します。
⚠️ 3. 平均値が「意味を持たない」ケース
平均値を使うと誤解を生む代表例もあります。
➡ これらの場合は、中央値や最頻値を使う方が妥当です。
統計的検定も、t検定ではなくノンパラメトリック検定(例:Mann-Whitney U検定)を使います。
🩺 4. t検定と平均値の関係
t検定が比較しているのは「2群の平均値の差」です。
したがって、平均値に意味があるデータでなければt検定は適用できません。
つまり:
t検定を使うということは、「平均値がその集団を代表している」ということです。
この前提を無視して「とりあえずt検定」で比較してしまうと、検定結果の「意味」が失われるというリスクがあります。
💡 5. まとめ:「平均値に意味がある」とは?
正規分布に従うか?
次は正規分布に従うかどうかです。
これには『Shapilo-Wilk(シャピローウィルク)検定』を行うことで判断できます。
EZRでShapilo-Wilk(シャピローウィルク)検定を行う実際の手順
② クリックすると以下の画面が新たに開きます。
③ 変数(1つ選択)の欄では、検定したいデータを1つ選んでください。
対応のない検定をするときは群分けしてください。
例えば、「性別==0」や「糖尿病の有無==1」のように、イコールを2つ並べます。
④ 結果は下記のように表示されます。
Shapilo-Wilk(シャピローウィルク)検定の結果は下の方にあります。
見るのは2つだけです。
- p≧0.05:正規分布に従うと判断
- p<0.05:正規分布しているとはいえない
⑤ 結果のグラフも同時に表示されます。
これをコピペすれば、そのままスライドに使うこともできます。
グラフが一見正規分布しているように見えるときもありますが、必ずShapilo-Wilk(シャピローウィルク)検定のp値を確認してくださいね。
⑥ 正規分布を確認した後は…
先ほどの例では、シャピローウィルク検定で「p>0.05」であることが確認できたため、t検定を行います。
まとめ
とりあえずt検定を使っておけばいいか…。
そんな現状から卒業し、適切にt検定が使えるようになることを目標に構成してまいりましたが、いかがでしたでしょうか?
ご質問等ありましたら、お問い合わせよりお願いいたします。
⚠️注意点
ここまでご説明してきた「正規分布の検定→等分散性の検定→t検定」といった順番で検定を行うことを「多重検定」といいます。
近年はこの「多重検定」を避ける傾向にあります。
ですが、以前はこの記事で説明したような手順で検定を行っておりました。
よって、指導教官や学会発表によっては
- 正規分布は確認した?
- 等分散性は見たの?
と質問されることもあります。
本記事ではそのような背景を踏まえて、「正規分布の検定→等分散性の検定→t検定」といった手順をご説明いたしました。
評価から統計へ|EZRは臨床の延長線上にある
統計解析は、突然どこかから始まるものではありません。
すべては、日々の臨床で行っている「評価」から始まります。
私自身、SPPBのような評価を丁寧に続けてきたことが、 統計解析(EZR)へとつながりました。
評価から統計へつながる入り口としてのSPPBについては、 👇の記事でやさしく解説しています。
運営者プロフィール
本サイト「理学療法士かずの評価と統計のやさしい処方箋」は、理学療法士かずが運営しています。
臨床経験を生かしつつ、学会発表や統計の学びに役立つ記事を執筆しています。
「難しそう…」を「やってみよう!」に変えるきっかけをお届けします。
※当サイトで紹介している手順・構成・テンプレートは、筆者のこれまでの経験に基づいた一例です。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
.png)
.png)


.png)
.png)
.png)

.png)
.png)





