わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

学会発表3件

火曜日から金曜日まで,立命館大学びわこ・くさつキャンパスで開催の「2015年電子情報通信学会 総合大会」に出席しました.私は木曜日の午後に発表し,指導学生(自分は共著者)も金曜の午前と午後に1人ずつ,登壇しました.
発表内容はというと,検索エンジンの性能比較は,同じソフトウェアの異なるバージョン間でも行うべきという問題意識のもと,Apache Solrのバージョン1.4.1,3.1.0,3.6.2,4.6.0,4.9.0について,1台の計算機上で文書登録・検索が可能な環境を構築しました.そして共通の文書群を登録し,検索語をいろいろ与えてみると,ずいぶんと差が見られたことを報告しました.第2著者の卒業研究と大きく重なるのですが,発案と原稿執筆のほか,一括検索するためのRubyスクリプトの開発は,こちらが手がけました.
バージョン3.6.2以降で,検索語を「室町」から「室町時代」に伸ばすと,ヒット数が数倍になっていました.しかし,素朴な考えでは,「『室町時代』が出現する文書の集合」は「『室町』が出現する文書の集合」に含まれるはずで,だとすると「室町時代」のヒット数は,「室町」のそれ以下となるべきです(実際,バージョン1.4.1およびgrepではそうなっていました).
この件は,発表前にホテルで準備している中で,原因が見つかりました.「室町」と「町時」と「時代」のOR検索をしている可能性が高いです.
時系列は次のとおりです.まず,年明けに提出した予稿では,検索語は単語のみでした.卒業研究を進めている学生に,AND検索・OR検索も行って比較するよう指示し,差の出る結果となったあと,発表の前に,Rubyスクリプトも対応させておこうと修正を行い,いろいろ試して,「室町」と「時代」のOR検索だと,バージョン1.4.1やgrepでのヒット数と同じとなったのに,気づいたのでした.
発表と関係のない話を2つ:

  • 水曜日は,3.11でした.午後のセッションでは,座長の呼びかけで,皆で黙祷しました.
  • 大学内の生協食堂で,びっくりしたことがありました.レジで学会の名札の提示を求められ,見せたけれど割引はありません.支払いを済ませ,トレイを手に持って,貼り紙に気づきました…「持っていなければ5%増」*1なのでした.

(最終更新:2015-03-17 朝)

*1:細かい文言は忘れましたが,「生協の組合員証を,持っていなければ5%増」です.もちろん,学会の名札が組合員証に代用できることは,事前に取り計らいがなされていたはずです.