はじめに(相関係数の検定編)
「相関って、何をしている分析なんだろう?」
「ピアソンとスピアマン、名前は聞くけど違いが分からない」
統計を勉強し始めた方から、とてもよく聞く声です。
相関分析は
- 2つのデータの関係を確認する分析
と聞くと、簡単そうに感じるかもしれません。
ですが実際には、
- 正規分布って言われて、よく分からなくなった
- EZRを開いたら、ピアソンとスピアマンがあって止まってしまった
- どちらを選べばいいのか、自信が持てない
そんな経験をする方が少なくありません。
でも、安心してください。
相関分析が難しく感じるのは、あなたのセンスや理解力の問題ではありません。
多くの場合、「なぜこの相関係数を選ぶのか」という説明が、途中で省略されてしまうからです。
ピアソンの積率相関係数とスピアマンの順位相関係数は、
どちらが正解・不正解という関係ではありません。
それぞれ、向いているデータの条件が違う。
ただそれだけです。
EZRでは、相関分析もフローチャートに沿って進めるだけで、
ピアソン・スピアマンのどちらも簡単に計算できるようになっています。
この記事では、
- 相関係数とは、何を表している数字なのか
- ピアソン相関とスピアマン相関は、どう使い分けるのか
- EZRのフローチャートで、どこを見て判断すればいいのか
を、専門用語をできるだけ使わずに、一つずつ確認していきます。
まずは、「フローチャートに従えば大丈夫」
そう思って読み進めてください。
読み終わるころには、EZRで相関分析を行うときに、
「なんとなく」ではなく、理由をもって相関係数を選べるようになっているはずです。
相関分析の選択
ピアソン vs スピアマンどっちを選ぶの?
上記のフローチャートを見てください。
2変数とも、正規分布に従うか?
- 「Yes」の場合
=「ピアソンの積率相関係数」を選択します。 - 「No」の場合
=ノンパラメトリック検定である「スピアマンの順位相関係数」を選択します。
正規分布に従うかどうかの検定方法については👇の記事で説明していますので、ご確認をお願いします。
EZRでピアソンの積率相関係数の検定を行う実際の手順
- 統計解析
- 連続変数の解析
- 相関係数の検定(Pearsonの積率相関係数)
の順に選びます。
キーボードの「ctrlキー」を押しながら、相関を見たいデータを2つ選び、OKをクリックします。
検定結果は一番下に出力されます。
グラフも一緒に出力されます。
このグラフはパワーポイントにそのまま貼り付けて使うことができます。
EZRでスピアマンの順位相関係数の検定を行う実際の手順
- 統計解析
- ノンパラメトリック検定
- 相関係数の検定(Spearmanの順位相関係数)
の順に選びます。
キーボードの「ctrlキー」を押しながら相関を見たいデータを2つ選び、OKをクリックします。
検定結果は一番下に出力されます。
グラフも一緒に出力されます。
このグラフはパワーポイントにそのまま貼り付けて使うことができます。
相関係数とは
相関係数とは「2種類のデータ間の直線的な関連の強さを表す指標」です。
どれだけ直線関係に近いかがわかります。
通常は記号「r」(小文字のアール)で表し、-1 〜 +1 の範囲の値をとります。
・相関係数が1に近い=正の相関
「片方の値が増加すると、もう一方も増加する傾向がある」ことを意味します。
・相関係数が-1に近い=負の相関
「片方の値が増加すると、もう一方が減少する傾向がある」ことを意味します。
・相関係数が0に近い=相関がない
「2種のデータ間に直線的な関連性がない」ことを意味します。
相関係数と相関の強さの目安
ピアソン相関・スピアマン相関のどちらでも、検定結果には「相関係数」が出力されます。
相関係数の値から、2つのデータの関係がどれくらい強いのかを判断する目安が、👇の一覧表です。
相関は因果ではない
相関が強いからといって、一方が原因で、もう一方が結果とは限りません。
相関分析では、2つのデータが同じような動きをしているかを見ているだけです。
たまたま別の要因が影響して、同時に変化している場合もあります。
そのため
相関がある=因果関係があるとは言えない点に注意しましょう。
⚠️注意点
ここまでご説明してきた「正規分布の検定→相関の検定」といった順番で検定を行うことを「多重検定」といいます。
近年はこの「多重検定」を避ける傾向にあります。
ですが、以前はこの記事で説明したような手順で検定を行っておりました。
よって、指導教官や学会発表によっては
- 正規分布は確認した?
- 等分散性は見たの?
と質問されることもあります。
本記事ではそのような背景を踏まえて、「正規分布の検定→相関の検定」といった手順をご説明いたしました。
評価から統計へ|EZRは臨床の延長線上にある
統計解析は、突然どこかから始まるものではありません。
すべては、日々の臨床で行っている「評価」から始まります。
私自身、SPPBのような評価を丁寧に続けてきたことが、 統計解析(EZR)へとつながりました。
評価から統計へつながる入り口としてのSPPBについては、 👇の記事でやさしく解説しています。
運営者プロフィール
本サイト「理学療法士かずの評価と統計のやさしい処方箋」は、理学療法士かずが運営しています。
臨床の現場で感じてきた「ここが分からなくて止まる」を大切にしながら、学会発表や統計の学びに役立つ記事を書いています。
「難しそう…」と手が止まったときに、「まずはここだけやってみよう」と思える。
そんなきっかけをお届けできたらうれしいです。
🔗 関連記事
※当サイトで紹介している手順・構成・テンプレートは、筆者のこれまでの経験に基づいた一例です。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
※本サイトの情報を利用したことによる不利益・損失については、一切の責任を負いかねます。予めご了承ください。
※なお、掲載内容はなるべく最新の情報に基づいて更新しておりますが、正確性・完全性を保証するものではありません。
.png)











.png)