わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

CKY法だ!

 機械学習や深層学習についてきちんと解説された本というのをツイッターで知り,Amazonで見ると即配送ではなかったので,書店で購入しました.
 先頭から読み進めていくと,ふだん使わない概念や数式が多く,疲労がたまりました.いったん本を閉じて,開いて,機械学習の知識をあまり前提としない,第9章(構文解析)を読んでいきました.
 「2. 確率文脈自由文法とCKY法」がp.217の先頭で,同じページには「ここでは,動的計画法を用いて効率的に(略)計算するアルゴリズムとしてCKY法(CKY parsing)を紹介する18),112),126).」と書かれています.
 CKYというと,(「確率」のつかない)文脈自由文法の構文解析アルゴリズムであり,クック・カサミ・ヤンガーの3名の頭文字にちなむものです.このうち「カサミ」は日本人(嵩忠雄先生)です.WikipediaではCYK(wikipedia:CYK法, wikipedia:en:CYK_algorithm)だけれど,学生時代に教わったのは,CKYの順です.
 上記のうち「18),112),126)」は実際には上付き文字で,3つの文献の引用を表しています.それぞれCocke, Kasami, Youngerだよなと思いながら巻末を確認すると,112)の著者名が,「K. Tadao」(p.295)になっていました!
 該当文献(An efficient recognition and syntax-analysis algorithm for context-free languages)を探してみました.1965年のものは抄録のみです(例えばhttps://api.semanticscholar.org/CorpusID:61491815).1966年にイリノイ大学から出版された同名の文献は,http://hdl.handle.net/2142/74304にて本文PDFも取得できました.著者表記は「T. Kasami」でした.なお,Abstractのページに"This paper is based on the author's previous report (13)."とあり,この(13)は1965年のものです.1965年と1966年の2件で,Abstractの記載は大きく異なりますが,基本的にはnの3乗で認識可能,single-head single-tape Turing machineを使用した場合にはnの4乗になるなど,内容は共通しています.


 同時に購入したもう1冊の書籍にも,びっくりする誤記がありました.

 「違いをつかみ,同じを見つける」(p.31)と題した1ページの授業報告です.「1つの班に18枚ずつ折り紙を配ります。7班に配ると,全部で何枚配りましたか。」という文章題に対し,式は18×7=126となるべきところ,「18×7=128」と表記しています.このページ全体で4箇所,128を126に読み替える必要があります.128=2^7が7で割り切れるはずがないのですが.