わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

改善を試みたシステムの検索時間について

 じんもんこん2023にて,『花押を対象とした画像検索システムの改善の試み』と題して学生に成果発表を行ってもらいました.
 今回もインタラクティブセッションでの発表となりました*1.土曜日の午後,まずはZoomで1人1分のライトニングトークを聴き,そのあと,oViceのブースに移動しました.会話が聞ける位置に立って,PCで作業をしながら聞き流し,終盤に1回だけ口出しをしました.
 画像検索システムを実演していて,その内容に基づく質疑応答のほうが多かったのですが,予稿の内容に関する質問もありました.
 「検索の速さ」に関する質問です.以下は,5節(評価実験)の最後の段落で,次は6節(おわりに)です.

 最後に,検索時間について述べる.1節で述べた通り[4]のシステムでは1回の検索に約9秒を要した.本論文の評価環境では,「AKAZE・新」もしくは「AKAZE・旧」を選択した場合には4.5秒から5.5秒の範囲となり,「CNN+近似最近傍探索」を選択した場合には0.5秒以下となった.AKAZEに基づく手法の時間短縮は,Linuxサーバ(CPU:インテル® Xeon® W-2125 プロセッサーLinuxディストリビューションUbuntu)で動作させたこと,PythonのProcessPoolExecutorによる並列タスク実行を採り入れたことが要因と考えられる.「CNN+近似最近傍探索」を用いた場合の時間は十分に実用的であり,検索精度を向上できれば,将来的にはこの手法を基本として検索に提供することが望まれる.

 「[4]のシステム」は,1年前の発表です.「AKAZE・旧」が,それと同一だったら,精度も時間も比較ができたのですが,1つのWebアプリケーションで,3つの検索手法から1つを選ぶという構成にしたので,「AKAZE・旧」は,1年前のシステムとは異なっています.「AKAZE・新」と「AKAZE・旧」の間では,特徴量抽出までの処理が異なっています.またそれぞれで,特徴量を格納したファイルは異なっています.計算して類似度を求める処理は,共通です.
 上記に対し,「十分に実用的」の時間的基準があるのかという質問が出ました.これは検索システムというより,Webアプリケーションとして考えることになります.学生が言ってくれたように「1秒以内」なら,ユーザがストレスを感じることは少ないのですが,修士論文に取りまとめる際は,出典を挙げておくのがよいようにも思いました.