(Gスプレッドシート)相関係数を求める関数(CORREL関数)

 Googleスプレッドシートで、相関係数(2種類の変数の線形関係の強弱を表す指標)を計算する方法についてです。そのものズバリの関数が用意されています。

  • CORREL関数により相関係数を求めることができます。

手順

f:id:accs2014:20200616232058p:plain:right:w600

 画像のB列とC列には「学習時間」と「点数」という2種類の値からなる10組のデータが記録されています。
 散布図はこの10組のデータをグラフ化したものです。

f:id:accs2014:20200616232102p:plain:right:w600

 ここで「学習時間」と「点数」の間の相関係数を求めてみます。
 E3セルに次のように入力します。

=CORREL(B3:B12,C3:C12)

 CORREL関数を使い、第1引数に一方の配列(学習時間)を、第2引数にもう一方の配列(点数)を指定することで相関係数が求められます。
 

f:id:accs2014:20200616232105p:plain:right:w600

 値は約0.93となりました。
 簡単に言って散布図が右上がりの直線に近ければ1に近い値が得られ(完全な右上がりの直線なら1)、右下がりの直線に近ければ-1に近い値が得られます(完全な右下がりの直線なら-1)。
 ただし傾き具合が急だからといって値が大きく(小さく)なるわけではありません。相関係数はあくまで線形関係の強弱、つまり直線状に近いかどうかを示す指標であり、回帰直線の傾き(SLOPE関数)とは意味合いが異なります。

f:id:accs2014:20200616232109p:plain:right:w600

 こちらは別の例です。
 画像のXとYは「Y=2(X-5.5)^2+30」という式に完全に従っていますが、相関係数を計算すると0になります。
 このように相関係数は「線形関係ではない関係」を評価するには適当ではありませんので、相関係数が0に近いからと言って「無関係」と判断せず、まずはデータをプロットしてみることが重要です。