徒然なるぼやき。

徒然なるぼやき。

思いついた事や記録として更新していこうかと。

統計メモ

自分用に残す統計学的メモです。

主に用語の捉え方とExcel使用時の注意事項。

参考にする方はしてくださいませ(まぁ、基礎中の基礎しか載せませんが)。

あくまで調べものなので、参考にする方は確認を忘れずに。

 

【相関関係と因果関係】

相関関係とはAとBの間で⇔の関係が成り立つ。

因果関係は原因Aによる結果Bなので⇒しか成り立たない。

※相関関係を見つけた後に因果関係を見つけ出すのが正しい分析の仕方。

 

平方根を求める際の=(x)^0.5】

関数だと=SQRT(x)で求められる。

同様に=(x)^0.5でも求まる。数値に0.5を乗じる理由については以下の通り。

y=√xとして、

y^2=y*y=x

y^8=y*y*y*y*y*y*y*y=x^4

y^4=y*y*y*y=x^2

なのでy^1=x^1/2になり、√x=x^1/2とも表せる。

また、1/2=0.5であるため√x=x^0.5となり、y=x^0.5

よって、平方根を求める際に0.5を乗ずると値が求まる。

 

【代表値:データの中心を表す指標】

平均値:分布の重心を表す。データに極端な値があると大きく影響を受ける。

中央値:測定値を昇順(or降順)で並べた際にちょうど真ん中にくる値。分布の両端に大きな値や小さな値があっても影響されにくい。

最頻値:ある一定の範囲でデータを区切り、その範囲内に最も度数の高い値

 

【標本分散、不偏分散】

母分散を推定するには、不偏分散を用いる。

◎標本分散はあくまで標本中のデータのバラつきを表す(関数はVARP)。

式中の分母は(データ数)。

はじめから母集団のデータを扱う際にはこれを用いたほうが良い。

◎不偏分散は標本中から母分散を推定する際に用いる(関数はVAR)

式中の分母は(データ数-1)

これはデータ数が小さいほど変動のバラつきをうけるため、少し幅を持たせて大きめに分散を取った方がより安全になるから。

 

標準偏差と標準誤差】

標準偏差は平均からのバラつきを表す。

標準誤差とは標本平均が母平均に対しどの程度ばらついているかを表す。

(いわゆる、「平均値の標準偏差」)

無作為に選びだされた標本によってその標本平均は異なる。そうしたバラつきを表してるのが標準誤差。

※実際の母平均は不明なことが多いためこの標本平均から推定する。

※基本統計量では標本サンプルを想定しVAR関数、STDEV関数を用いているため、母集団そのものと仮定できる場合は、直接VARP関数やSTDEVP関数を用いたほうが良い。