本日,A会場の最初のセッションの3番目に,「系図処理プログラムの改良―さらなる自動化を目指して」というタイトルで口頭発表しました.
予稿はhttp://id.nii.ac.jp/1001/00200973/よりダウンロード可能です.ただし情報処理学会非会員や,学会員でもCHまたはDLIBの研究会登録をしていない人は有料です.
人物名が縦や横の線で結ばれた系図の画像があるとき,これをプログラムに通すことで,文字認識・線分認識を行い,人物間の関係などを自動で獲得…できるといいのですが,あいにく全自動とはいきません.
系図画像内の文字認識は,凸版印刷株式会社のOCRソフトウェアを使用し,その出力(位置情報付きテキスト)と系図画像を使用して,縦横の線分の認識を行い,人間関係を取得する基本的なプログラムは,昨年5月の研究会で発表していました.
このプログラムに,手を加えて,新たな系図画像に適用した,というのが,今回の成果の中心となります.
発表用スライドは2日前までに作っておき,前日にゼミ室で「一人発表練習」して微調整,といきたかったのですがいろいろあって,スライドの一応の完成は,ゼミ室の使用予約をしていた開始時刻の20分前でした.予稿から文章や画像をコピーして貼り付け,読みやすく見てもらいやすく調整をしてから,人物名をはじめ,言うことになる固有名詞の読みをチェックしました.
一回で覚えられないものは,PowerPointのノートに書きつけました.具体的には:
- 聖寶(しょうぼう)
- 益信(やくしん)
- 寛信(かんしん/かんじん)
- 観修寺(かじゅうじ/かんしゅうじ)
- 龍智(りゅうち)
- 成賢(じょうけん/せいけん/せいげん)
- 宗源(そうげん)
- 範俊(はんじゅん)
- 嚴覺(ごんかく)
事前に連絡のあった,発表と質疑の時間配分は,発表25分,質疑5分です.前日の練習では2回とも,25分を下回っていました.本番では,開始して20分くらいかなと思ったところで,タイムキーパーの方がベルを鳴らし,無言で「残り5分」と書かれた紙をこちらに見せてきました.発表時間が残り5分なのか,質疑込みで残り5分なのか(発表終了の時間を意味するのか)が不明でしたが,少し端折りながら話して発表を終え,質問に対応しました.
オープニングのとき,研究会主査の方が,注意事項として「この部屋は飲食禁止です」とおっしゃっいました.そこで茨木駅から会場までの途中の自販機で購入し,机の上に置いていたペットボトルを手に取り,リュックサックに入れようとしました.その後「ペットボトルのみ,かまいません」のアナウンスを聞き,机の上に戻しました.