ホーム > 分析手法 > R言語による推測統計

R言語による推測統計

3.R言語による推測統計 〜検定〜

 

推測統計とは、
全体から一部を抜き取って、その一部の特徴から全体の特徴を推測し、
そこで得られた結果が正しいかどうかを確認する統計のことをいう。
※統計学では、全体のことを母集団、その一部を標本という。

また、その時に得られた特徴が正しいかを確認することを検定という。
推測統計の手法は推定と検定の2つに分類される。
今回はRを使用して一つの検定を行う。

 

■無相関検定

 

Rではcor()関数を使用することで相関係数を出力することできる。

相関係数とは、
2つのデータにどれだけ関連性があるかを表す数値になる。

相関係数は-1から+1の間の数値をとり,-1,+1の時は完全相関(順に逆相関,正相関)といい,2つのデータ群に強い関連性が存在することと示し,一方,0 の時は無相関といい,2つのデータ群に関連性がないと判断される実際にRのデータセットを使用して、相関係数を出力する。

今回、使用するデータは”cars”(スピードと車の停止距離)。
データは、1920年代の自動車の速度と停止するように取ら距離を与える。
まずは実際にRでデータを確認して見る。

carsと入力する。

01

車のスピード(speed)の列と停止距離(dist)の列があることが確認できる。
このspeedとdistに相関関係があるのか調べる。
まずは散布図を描いてみる。

plot(cars)

02
すると別ウィンドウで散布図が表示される。
03

散布図を確認すると、speedが上る(右へいく)とdistも上がっているように見えるので、相関がありそうである。
実際に相関係数を出力する。

cor(cars$speed,cars$dist)

※データ$列名でデータの中の列を指定できる。

04

相関係数を出力したところ、0.806と強い相関があると確認できる。

ただし、
ここで出力された相関係数に意味があるのかどうかを検定する必要があります。
それが「無相関検定」となる。
Rではcor.test()関数を使用する。

cor.test(cars$speed,cars$dist)

05

出力結果から、

t値:9.464 自由度:48 p値:1.49のマイナス12乗(極めて小さい数値)

とわかり、相関係数が有意であることがわかった。

電話番号
0466-90-3288
E-MAIL
info@analytics-jp.com
© BUNSEKIYA All Rights Reserved.