わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

統計を見て,教育が変わるか

記事中の図1を見ると,日本・韓国・台北・香港が左上にあり,これらが「平均点は高く得意率は低い」というグループをなしていることに気づきます.はてブのコメントのうち「東アジア勢は全部左上に入っているというあたり、この調査は教育システムではなく文化的なものを表しているだけと思う」に納得です.
なのですが著者は国際比較から(いったん)離れて,以下のとおり,日本の状況を並べています.

日本の生徒は、平均点は高いのに得意率は最下位だ。学校や塾で、グループ内での順位に基づく相対評価に繰り返し晒されているためだろう。「皆が100点では困る、順位をつけないといけない」。生徒をより分ける資料を得るため、教科書のレベルを超えた奇問難問が試験で出されることもしばしばあり、「できない子」が強制的に生み出されている。

数学の「できない子」を強制的に生み出す日本の教育 | ワールド | 最新記事 | ニューズウィーク日本版 オフィシャルサイト

ぱっと見て,この中の「学校」は,著者・舞田敏彦氏の経験なのかなと感じました.というのも,学校と「順位」「相対評価」を結び付けようとするのが,不可解に思えたのです.
ここ10〜20年くらいの,学校教育のキーワードに「目標に準拠した評価」を挙げることができます.これは絶対評価と言い換えられます.文科省の「〜評価」に対する考え方は,http://www.mext.go.jp/a_menu/shotou/gakuryoku/faq/001.htmで読むことができますし,教育評価について平易に書かれた本には,『教育評価 (岩波テキストブックス)』があります.余談ですがTIMMSで連想する本は"The Teaching Gap: Best Ideas from the World's Teachers for Improving Education in the Classroom"です.
著者ではなく私の中学のころの経験(1980年代半ば)を書くと,学校では「順位」を出しておらず*1,かわりに,業者テストで出る「偏差値」が,学力指標となっていました.数学の点数だけが高い,あるいは理科の点数だけが高いというクラスメートが,1人ずついました.数学のテスト(中間・期末テストも,業者テストも)は,答えのみを書かせる問題が33問あって,配点は1問3点,全問正解に限り1点を加えて100点としていたものです.
通っていた塾*2は,教室2つだけと小規模で,同じ学年の生徒は1つのクラスで構成され,予習もテスト対策もしていました.数学を専門とする塾長先生が出す,教科書にない問題には,これまでに学んだことを組み合わせて解いていました.
難問をはじめて意識したのは,大阪府の公立高校入試問題(正確にはその対策)でした.数学のいくつかの大問のうち,受験勉強をしたときも,実際の入試でも,最後の大問以外は,基本を問うていました.最後の大問は,空間図形をもとにした内容で,入試問題はどこの公立高校を受けるにも共通だったこともあり,「できる子」の差をそこでつけようとする意図なのを,感じ取りました.


さて,「33問」という自分の経験が,現在でも同じなのか,気になってきました.あいにく,学校などに積極的に出向いて,現場に立脚したアクション・リサーチをやる*3わけにもいかず,少し検索をしても,テスト問題というのはなかなか出てきません.
かわりに読み直したのは「全国学力テスト」(全国学力・学習状況調査http://www.nier.go.jp/kaihatsu/zenkokugakuryoku.html)です.都道府県,市町村,学校,そして学級内で順位付けの状況やその是非は,本記事の対象ではありません.過去問から,状況を探ってみます.
それで,問題数ですが,自分が受けたのと形式が近い,「数学A」について,正答数の分析まで公表されている平成27年度については,36問でした.平成28年度は,正答例の解答用紙をもとに勘定すると,37問あることが分かります.1つ前の年度も見ましたが,解答数は30台後半です.ということで,33問ルールは,全国学力テストでは成立しないと言って良さそうです.
そもそも,全国学力テストは,100点満点ではなく,問題用紙を見ても,各問題に配点が書かれていません.ただし,数学A・数学Bで「平均正答率」が算出されています.これが100点満点の点数と同等のものとして,基本的な統計量の一つとして表に掲載されたり,学校間比較などに用いられたりしています.
なお,出題内容に関しては,多肢選択式が目につきます.証明の意味について問う出題(平成27年度数学A大問8(5択で正答率26.4%),平成27年度数学A大問8)も,自分のころにはなかった話です.
平成27年度の数学Bに,統計(資料の活用)に関して興味深い出題があったので,取り上げます.大問5です.落とし物調査を対象とし,2回の調査の結果(表とグラフ)が提示されたのち,表をもとに割合を求める式を書く問題,グラフをもとに説明をする問題,そして,落とし物を減らすためのスコアリングに関する4択問題という3つの小問で構成されています.このうち2番目の説明問題は,以下のとおりです.

グラフを見ると,優香さんのように「1回目より2回目の方が落とし物の状況がよくなったとは言い切れない」と主張することもできます。そのように主張することができる理由を,優香さんが作ったグラフの1回目と2回目の調査結果を比較して説明しなさい。

グラフですが,2回目には落とし物の個数で「0〜3」の階級に入っている,外れ値のようなのが1学級あります.右に目を向けると,1学級以上がある階級の中で最も大きいのは,1回目も2回目も「24〜27」ですが,その学級数は,2回目のほうが多くなっています.
それらを考慮して,答案を書けばよいのかなと思いながら,解答類型を見ていくと*4,根拠として以下のいずれかを書くことが,正答の条件となっています.
(a) 2回目の調査結果では,落とし物が極端に少ない学級があるから,平均値が下がっていること。*5
(b) 1学級を除くとグラフの形がほとんど変わっていないこと,最頻値が変わらないこと,中央値が含まれる階級が変わらないことのいずれか。
(c) 落とし物の個数が24個以上27個以下の学級が増えていること.
このうち(b)は,まったく想定していませんでした.問題文を読むと,「1回目より2回目の方が落とし物の状況がよくなったとは言い切れない」であり,「1回目より2回目の方が落とし物の状況がわるくなった」ではないので,2回の調査で,変化がほとんどないという説明の仕方もあり*6なのに気づきました.
フィクションである全国学力テストの統計問題と,TIMSSの公表結果に基づいて作成された散布図とを,同列に扱ってよいかは,いちおう気にしつつも,1つのグラフからさまざまな読み取りができる点は,今後,ブログ記事や学術論文を取りまとめる際に,忘れないようにしていきたいものです.算数・数学教育の変化を探るのに,毎年の全国学力テストを読み通し,必要に応じて過去の(全国学力テスト以外も含めた)出題や反応率などと比較するのは,これからも行っていきます.

*1:高校では,「席次」という言葉を使って,クラスにおける順位を数字で見ることができました.

*2:http://d.hatena.ne.jp/takehikom/20160113/1452632182

*3:ここはhttp://tmaita77.blogspot.jp/p/blog-page_22.htmlの記述を借用しました.

*4:http://www.nier.go.jp/15chousakekkahoukoku/report/data/mmath_05.pdf#page=30.ただし13MBあります.

*5:外れ値学級の落とし物の数を,階級の最大値の3個と仮定した上で,平均の算出から除外すると,平均値は287÷14=20.5となり,1回目の平均値を上回ります.

*6:しかし反応(解答)率は,◎と○を合わせて0.5%に届かない状況でして,問題作成ごくろうさまです.