わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

プレゼン コメント 2009-12

F値は再現率と適合率の間

えっとですね,配布資料の表に,おかしな値があります.
評価実験で,再現率と適合率,それとF値を求めていて,それぞれの計算式も添えられていますが…
おかしな値というのは,再現率が0.2,適合率が0.29で,F値が0.4になっているところです.
F値ってのは,再現率Rと適合率Pの,要は調和平均ですから,0.2と0.29の間に来ないとおかしいのです.0.4と,飛び出しているのは,計算ミス,記載ミスのいずれかです.
調和平均を知らなくても,F値を求める式から,確認できます.こう定義していますね:
F=\frac{2}{\frac{1}{R}+\frac{1}{P}}
両辺を2で割ってから,逆数にすると,こうですね:
\frac{2}{F}=\frac{1}{R}+\frac{1}{P}
ここでFの半分の値を,Gと置きます.\frac{F}{2}=Gの逆数をとると\frac{2}{F}=\frac{1}{G}となりまして,これを代入すると,先ほどの式はこうなります:
\frac{1}{G}=\frac{1}{R}+\frac{1}{P}
PとRは正の数です.ここから,GはRよりも小さく,かつPよりも小さいであると言えます.
証明方法はいくらでもありますが,ここでは式の計算をせず,「電気抵抗」をイメージして,理由をみていきましょう.
このG分の1の式はですね,抵抗の並列回路の,合成抵抗の式です.RとPが並列つなぎの抵抗で,Gが合成した抵抗の値となります.
抵抗ってのは,高いと電流が流れにくく,低いと流れやすい,ですね? さて,もともとRの抵抗だけだった回路に,Pの抵抗を並列に増設して,起電力といわれる,いわゆる電源の電圧が変わっていなければ,Rの抵抗にもPの抵抗にも別々に電流が流れて,全体としてみれば,流れやすくなります.これが,合成抵抗Gの抵抗値がRのそれよりも低くなる理由です.GとPの関係も同じです.
ちなみに,RとPのいずれかが無限大になれば,それは絶縁体ということで電流が流れず,無限大分の1は0とみなすことで,Gの抵抗値は無限大じゃないほうの抵抗値と同じになります.また,RとPが同じ値なら,定義式から計算すると分かるように,GはRの,まあPでもいいのですが,半分になります.FはGの2倍ですから,そのFの値はRそしてPと同じになります.これは等号条件ですね.
G,R,Pの関係式と,繰り返しますがRもPも正であることから,Gは,「RとPの小さい方の値の半分」以上で,「RとPの大きいの値の半分」以下であることが示せます.大きいというほうから小さいというほうを引き算しても証明できますし,抵抗の並列回路を使って確認することもできます*1
そして,FはGの2倍なので,F値は,「RとPの小さい方の値」以上,「RとPの大きいの値」以下,ということで,R(再現率)とP(適合率)の間に来ないとおかしいのです.

*1:一般性を失うことなくR\leq Pとすると,\frac{1}{P}+\frac{1}{P}\leq\frac{1}{R}+\frac{1}{P}\leq\frac{1}{R}+\frac{1}{R}.逆数をとるときには,不等号の向きが逆になることに注意.