わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

黙って座れば,ピタリと当たる!〜情報検索の研究が目指すもの

1. 究極の目標は?

「学生時代はセキュリティのある意味で理論的,ある意味で応用的なところを携わっていました.和歌山大学に着任し,研究テーマをデータベースに切り替えました.そしてここ数年では,情報検索,より具体的には,全文検索に力を入れています.
 そんな中,情報検索の目指すところ,言ってみれば『究極の目標』は何になるかというと…

 『黙って座れば ピタリと当たる!』になると思います.悩む人に,適切なアドバイスをすることです.

2. 昔だったら…

「さてこの『黙って座れば ピタリと当たる!』ですが,もともとこれは占いの宣伝文句なんですね.


手相占い / typester

 手相だとか,水晶玉だとか,カードだとか,…
 いえいえ,我々は,占い師になることを目指しているわけではありません.

3. 我々は…

「我々は…やはり,これまで学んできた,研究室の内外で培ってきた,情報通信の技術を活用して,『黙って座れば ピタリと当たる!』を実現したいのです.
 具体的には,どんな技術でしょうか? 当研究室のこれまでの経験をもとに,次の4点を挙げたいと思います.

 全文検索・データベース設計構築・マルチデバイス対応・開発者支援です.
 この中でも全文検索が,基盤となります.ここには,全文検索のソフトウェアを導入してシステムを作ることも,Googleなど既存のサーチエンジンに外から機能を付加しようという試みも,含まれます.
 とはいうものの,そういった全文検索,テキスト検索だけで,欲しい情報を提供しようというのには,限りがあります.内部スコアといった数値情報を保持し活用していくには,既存のデータベース管理システムを併用すること,そしてその設計・構築に関する技術が,不可欠になってきます.
 3番目,『マルチデバイス対応』って,聞いたことがありますか? パソコンからでも,iOS端末からでもAndroid端末からでも,テキストベースの携帯端末からでも,アクセスOKですよ,ということです.マルチな端末(=デバイス)に対応するというわけです.機器に応じて,最適な情報を返すことも,重要なところです.主にHTTPと,HTMLそれとJavaScriptを使って解決を試みます.
 最後の『開発者支援』ですが,個別にシステムを作ることだけにとどまらず,いろいろな検索サービスの開発で共通する,省力化すべきところをツールにして,提案・提供していこうというものです.

4. 座るの? 当たるの?

「ここで,『黙って座れば ピタリと当たる!』というフレーズに立ち返ってみたいと思います.
 情報通信の技術を活用するとして,実際に『座る』のですか? 『当たる』のですか? なのですが…
 4月のはじめ,情報セキュリティの初回授業を,ちょっと思い出してみてください.そこで私は,セキュリティというのは安全かそうでないか,破れるか破れないかの二分法ではない,とお話ししました.セキュリティというのは,どれだけコストをかければ,どのような攻撃に対処できる,といった形で,その安全性を定量的に扱うことができる,とお伝えしたのでした.
 『黙って座れば ピタリと当たる!』も,座るか座らないか,当たるか当たらないか,ではないのです…工学の課題として考えるのならば.

 『黙って座れば』は,利用者にはどれだけ少ない作業で*1,適切な情報検索の機能が提供できるかということに,対応づけられます.
 そして『ピタリと当たる!』のほうはというと,どれだけの検索性能を提供できるかです.こう考えることによって,当たり外れを定量化できるというわけです.

情報検索の目指すところ:全体像

なにこれ

3年配属のための研究室紹介で話した内容を,文字にしました.
研究室あたり10分の時間がありまして,ブラウザの検索窓をとっかかりに,検索は日常当たり前のように使っているけれど,より快適にするための研究に取り組んでいるんですよと説明したあと,上の話をしました.
某日追記:当研究室の定員は4名のところ,第1希望でちょうど4名の学生から登録がありました.面談を行い,全員を受け入れることにしました.

ONE MORE

「企業・団体・個人が保有する文書を対象として,その中身や用途に配慮し,独自の検索サービスを構築することを,行ってきました.
 しかし今後も,ここにそういった開発をしていればいいのかというと,そうは思っていません.そこに立ちはだかる,2つの主要な新技術があります.
 一つは,『クラウドサービス』です.EvernoteDropboxなんかが該当します.それらが提供する情報管理や検索の機能によって,我々の研究内容がカバーされてしまうと,研究室の存在意義がなくなりますので,いやそういうわけにはいかない,自分たちの研究はこんなふうに独自性・有用性があるのだと,実例を示していく必要があることを認識しています.
 もう一つの流れに,『オープンデータ』というものがあります.データをオープンにしてインターネット上に公開しましょう,それをどう使うか,他のデータと組み合わせたりもしながら,というのは使う人に任せましょう,というアプローチです.リンクトオープンデータ(Linked Open Data, LOD)とも呼ばれます.
 我々は,オープンデータを積極的に使うためのアクセス技法を提案していくとともに,著作権やライセンス,プライバシーには十分配慮しながら,持っている情報をオープンデータで,作ってきたソフトウェアをオープンソースで,適切なライセンスのもと公開していくべきとも考えています.

(最終更新:2013-09-30 晩)

*1:その分,システム側で手間を要します.開発だけでなく,インデックス(索引)化を行い,問い合わせに対して瞬時に結果を返せるようにするための準備の時間も,ここに含まれます.