わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

KanjiSorter更新

 引数の文字列に対して,または引数で指定されたファイルを読み出して,その入力に含まれている漢字を,小学校で学習する学年(および配当外)に振り分け,出現回数を出力するRubyスクリプト,kanji-sorter.rbを更新しました.7年半ぶりのコミットになります.
 大きく変更したのは,学年別漢字配当表(小学校の各学年で学習する漢字)です.前のバージョンは,この3月までの学習指導要領に基づくものでした.2017年(平成29年)に,新しい学習指導要領と合わせて,学年別漢字配当表も更新されていましたので,今回,対応しました.
 コマンドラインオプションを指定することで,以前の学年別漢字配当表に基づいて振り分けることもできるようにしました.最新の学年別漢字配当表では,すべての都道府県に出現する漢字を小学4年までに学習しますので,入力を「大阪府兵庫県京都府滋賀県奈良県和歌山県三重県香川県徳島県*1とし,比較してみます.
 学年別漢字配当表の指定をしなかった場合は,最新(2017年公表)のものを使用します.実行コマンドと出力は次のとおりです.

$ ruby kanji-sorter.rb 大阪府兵庫県京都府滋賀県奈良県和歌山県三重県香川県徳島県
1年(4種4字): 三山川大
2年(2種2字): 歌京
3年(6種12字): 県県県県県県県庫重都島和
4年(9種10字): 賀香滋徳奈阪府府兵良
5年(0種0字):
6年(0種0字):
配当外(0種0字):

 現行(今月まで)の学習指導要領に基づく学年別漢字配当表は,1989年(平成元年)に公表されたものと同一です.そこで「-p 1989」というオプションを指定します.配当外の(小学校で書けなくてもいい)漢字が4つあります.

$ ruby kanji-sorter.rb -p 1989 大阪府兵庫県京都府滋賀県奈良県和歌山県三重県香川県徳島県
1年(4種4字): 三山川大
2年(2種2字): 歌京
3年(6種12字): 県県県県県県県庫重都島和
4年(3種4字): 府府兵良
5年(2種2字): 賀徳
6年(0種0字):
配当外(4種4字): 奈滋阪香

 1977年(昭和52年)公表の学年別漢字配当表を用いると,今回の入力に関しては,1989年のものと同じ出力になりました.

$ ruby kanji-sorter.rb -p 1977 大阪府兵庫県京都府滋賀県奈良県和歌山県三重県香川県徳島県
1年(4種4字): 三山川大
2年(2種2字): 歌京
3年(6種12字): 県県県県県県県庫重都島和
4年(3種4字): 府府兵良
5年(2種2字): 賀徳
6年(0種0字):
配当外(4種4字): 奈滋阪香

 1958年(昭和33年)公表の分だと,「歌」「兵」「徳」を学習する学年が異なっています.

$ ruby kanji-sorter.rb -p 1958 大阪府兵庫県京都府滋賀県奈良県和歌山県三重県香川県徳島県
1年(4種4字): 三山川大
2年(1種1字): 京
3年(7種13字): 歌県県県県県県県庫重都島和
4年(2種3字): 府府良
5年(2種2字): 賀兵
6年(1種1字): 徳
配当外(4種4字): 奈滋阪香

 学年別漢字配当表は,文科省サイトにも目を通した上で,分かりやすさからWikipediaのページを使用し,kanji-sorter.rbにもURLを記載しました.

 当ブログでこれまでに書いてきた記事です.

 「-p 公表年」以外のオプションでも,学年別漢字配当表を指定できます.kanji-sorter.rbではKanjiYearモジュールというのを新たに作って処理させています.この県は,もといこの件は,別の記事で取り上げることにします.

*1:自分が子どものころよく耳にした,NHKの天気予報の府県の紹介順です.

*2:kanji-sorter.rbにはhttps://ja.wikipedia.org/w/index.php?title=%E5%AD%A6%E5%B9%B4%E5%88%A5%E6%BC%A2%E5%AD%97%E9%85%8D%E5%BD%93%E8%A1%A8&oldid=58166139を記載しています.そのうち更新します.