わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

全国学力テストを理解するための3つのおすすめPDF

これまで何度か,当雑記で全国学力テストを取り上げています.私のスタンスを表明しておきますと,全国学力テストの企画や実施などに一切関わることのない,情報通信分野の大学教員です.「何を問うことで,答える側が何を考え,答え(正答・誤答)として表出するか.それは個人から国民というスケールでどのように変わるのか」に関心があります.研究室(1人〜数人)や講義・プログラミング演習(数十人)の中で,専門の内容に限定されますが,学生に問うてその反応を受け取り,分析する*1ことを,日々行っています.
国学力テストの理想的形態として「抽出調査」「複数の問題の利用」「国語・算数(数学)以外の科目の実施」「序列化(ランキング)の排除」を考えています.また,「なぜテストを受けるのか」「なぜ全国学力テストを受けるのか」を,受ける小中学生が考えたり情報収集したり,学校現場で議論(例えばディベート)したりするのを,学校や社会が認める状態になることを,望んでいます.
さて,今年の結果が公表されたので最近ちょっと賑やかになった「全国学力・学習状況調査(全国学力テスト)」の件,Googleで調べてみると,PDF化された論文・報告が見つかりました.
[1] 戸澤幾子: 「全国学力調査」をめぐる議論, レファレンス, No.59, Vol.5, pp.33-58 (200), http://www.ndl.go.jp/jp/data/publication/refer/200905_700/070004.pdf (参照 2009年9月5日).
[2] 山崎雄介: 学力向上策としての悉皆学力テストの批判的検討―「成績公表」進行の妥当性を問う―, 群馬大学教育実践研究, No.26, pp.163-168 (2009), https://gair.media.gunma-u.ac.jp/dspace/bitstream/10087/4738/1/NO26_2009_19.pdf (参照 2009年9月5日).
[3] 村木英治: 全米学力調査(NAEP)概説〜テストデザインと統計手法について〜, 教育測定・カリキュラム開発(ベネッセコーポレーション)講座 2005年度 研究活動報告書(2), pp.51-66, http://www.p.u-tokyo.ac.jp/sokutei/pdf/12muraki.pdf (参照 2009年9月5日).
素人なりに,それぞれに説明をしてみます.[1]は,全国学力テスト実施の概説といっていいでしょう.具体的な設問や正答率ではなく,「なぜ実施するのか」「過去にどんな方式で実施されてきたか」「実施方法にどのような論点と意見があるか」を重視して,肯定・否定に偏ることなく多数の引用をもとに,解説しています.全国学力テストのあり方に疑問を持った人にお勧めする書籍が『全国学力テスト―その功罪を問う (岩波ブックレット)』なのは変わりませんが,本ではなくWebでかつ無料で入手できるものとなれば,[1]が現段階ではベストではないかと思います.
[2]は,著者は成績公表に否定的*2ですが,ともあれ「土俵に乗ってみようやないか」という立場での調査・検討です.私学がすべて参加していたら,都道府県順位がどうなるか推計しています.個人的に,現在の形態で毎年実施していたら,来年が第4回で,第1回で受けた小学校6年生がちょうど中学3年生になるから,その間の自治体や学校の努力があるとはいえ,私学不参加の影響がそこで測れるのかなという思いがあります.しかしこの論文のように,現状でも出せるわけですね.
[3]では,アメリカの全国学力テストはどのような設計思想と実施形態で行われているかがまとめられています.「です体」であることと,質疑応答が書かれていることから,予稿ではなく,実施(2005年11月24日)のあとに文書化されたものと思われます.統計手法の数式や図(グラフ)の意味は,この文書を読んだだけですっと頭に入ってくるわけではありませんが,本気で理解しようと思えば,そのモデルや手法手法の名称でさらに検索して,読み進めばいいのですね.日本でここまでの深いデザインとアナリシスを行い,それを国民に(もちろん国民の理解できる形で)公表しようという流れは,政権交代して,起こるのでしょうか….
以下は,上記3つの文献の中で,最も感銘を受けた記述です.全国学力テストを離れ,学生や自分が研究を実施し取りまとめる際にも,気を配りたいものです.

市川伸一東京大学大学院教授は、悉皆調査にはメリット、デメリットがあるが、メリットが大きくなるよう改善を重ねるべき、としつつ、一方で、今回の調査が行政調査としての目的が主であったところに、悉皆調査のための第二の目的(フィードバック、授業改善、学習改善)を持たせ、目的を二つにしたことで調査のあり方が中途半端になっている(82)、と述べている。([1], p.50)

村木:思考方法が逆だと思います。アメリカでは,まず先に「このような能力を測る」というフレームワークを現場のコンセンサスも得ながらきちっと描くのです。測りたいもののコンセンサスが先にあり,その後,ではそれを計るためのテスト項目は誰が作るのかというと別の専門家です。ですから,「議論しているうちに大事なテスト項目が出来ました。やってみました」のような形で,唐突に提示されるわけではないのです。ですから,現場を突然に驚かすような項目は少ないと思いますよ。([3], p.16)

(同日夜にあちこち細部を修正しました.)

*1:必ずしも書面ではありません.ゼミの応答はたいていが口頭です.

*2:題目に見られる「批判的」「信仰」という表現のほか,「おわりに」(p.167)の最初の段落からもそのことが読み取れます.