わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

p値知っとけ

統計学的仮説検定は,

  1. ほんとに示したいこととは反対のことを帰無仮説として考える.
  2. データを集める.
  3. データと帰無仮説からp値を計算する.
  4. p値にもとづいて帰無仮説を評価する

というふうに進める.
※で,pの値がじゅうぶん小さかったら,帰無仮説が棄却された → ほんとに示したいことが示された,と論を進めるわけですね.
ここに登場するp値は,

  • 得られたデータが偶然の結果である可能性を示す.
  • 1 - p が,得られたデータの確かさ(同じ実験や調査をしたときに同様の結果が得られるか)を示す.
  • 帰無仮説が正しい可能性を示す.

などと解釈されるが,これはどれも間違い.正しくは,「帰無仮説が正しく,かつ想定する統計モデルが正しく,データがランダムにとられている場合に,観測データ+'もっと極端な'データが得られる確率」を示す.

http://takenaka-akio.cool.ne.jp/etc/stat_test/

研究グループでp値を扱う研究をする学生さんへ:尋ねられたら,「正しくは」のところを,相手の理解度に応じて適切に説明できるようにしておいてください.
付け加えるなら,t検定でもχ2乗検定でも何検定でも,各検定手法に応じた「統計量」を求めて,棄却域に入るかどうかで有意性判定をする,というのが伝統的な統計の学び方なのですが,統計量ってそれぞれ違うし,同じ関数でも自由度によってちゃうわけだやし,そんなんめんど*1有意水準と比較する数値を出すしかええやん,t検定でもχ2乗検定でも何検定でもやで,ということで,p値が広まったように感じます.
個人的には,p値をほげほげふがふがするのは,どうも好きになれないのですけどね….

*1:面倒臭い→めんどい→めんど