昨日は第116回情報基礎とアクセス技術研究発表会の発表・講演を聴いてきました.
茗荷谷駅の直前で,今回の各予稿を事前にダウンロードしておけばよかったと後悔しました.なのですが,筑波大学(東京キャンパス文京校舎)に入り,会場入口で受付をすると,ダウンロード方法が書かれた1枚の紙のほか,「ディジタル図書館 No.46」と題する紙の予稿集を受け取りました.この冊子にすべての予稿が入っており*1,大いに役立ちました.
3番目の方の発表には,質疑で手を挙げ,システムやコンテンツをどのくらいの人数規模で開発しているかを尋ねました.セッション後の休憩時間に,発表された方が来てくださり,新しい名刺で初めての交換をしました.
一番聴きたかったのは,最後の1時間ほど,永崎研宣先生による招待講演です.予稿集では「人文学におけるオープンデータの活用」というタイトルになっています.概要は,http://ipsj-ifat.org/index.php?id=101に書かれているのでご覧ください.
発表の後半で紹介された「大蔵経テキストデータベース」について,以前に見たのとずいぶん違うなあという印象を持ちました.帰宅してhttp://21dzk.l.u-tokyo.ac.jp/SAT/にアクセスしたところ,以前のは2007版,そして昨日のご講演は2012版と思えばよさそうです.
講演時のスクリーンショットでは,各語句の意味や,対訳コーパスの検索結果,文字のUnicodeコードポイント,論文・一次資料・チベット大蔵経へのリンクなどが表示されるようになっており,そこで「大蔵経テキストデータベース」の外にあるデータと連携を図っているわけです.
ただし,それらをオープンデータと呼ぶのはまずそうです.まず,「大蔵経テキストデータベース」のコンテンツは,利用条件とwikipedia:オープンデータとを照合する限り,オープンデータに該当するというのは困難です.そして,システムと連携している各(外部の)データについても,予稿集の中で「「オープンデータ」と呼べそうなものは…?」と書かれており,オープンデータだから活用している,というわけではなさそうです.
オープンデータとする・しないに関わらず,データを公表(リリース)することの意義なりメリットなりについて,講演を聞きながら,また帰りの電車の中でも,一人で考えました.
思索の結果,たどり着いたのは…データのリリースは,ときにはそれをデータ収集活動などのゴールとして,行うことになるかもしれません.それと別に,使ってもらって批評を受けながら,修正したり拡張したりすることを目指し,そのスタートとしてリリースするというケースもあるかもしれません.
「ゴール」と「スタート」の意図は,決して水と油の関係ではなく,両方それなりの割合*2を持って,リリースされているというのも,容易に想像できます.
ところでこの着想は,査読付き論文を含む学会発表を踏まえてのものです.研究成果を査読付きの学術論文に載せることは,一連の研究活動のゴールを意味するとともに,刊行されてから著者・編集者・査読者よりももっと多くの人々に読まれ,批評され,引用されて形に残る可能性もあり,その意味で掲載はスタートとみなせます.閲読・引用・批判は,査読の有無を問いません.査読のないいわゆる口頭発表でも,一応の成果が出て,さらなる発展は難しそうだけど,外に出さないのはもったいないと思い,ゴールの意味合いで発表したこともあります.
実は,データのリリースと論文発表とを,同列に扱うというのは,自分の思いつきではありません.招待講演の一つ前,特別講演の中で,論文だけでなくデータの公開も,研究者の業績とするという,海外の動きを取り上げられていたのでした.論文業績だったら「Publications」いう小見出しにするところ,データも対象にするので「Products」に変わる,というのは,予稿集に載っていませんが,強く記憶に残っています.
永崎先生には,これまで,学生の学会発表に対してアドバイスをしてくださるほか,大きめの学会や懇親会などでも気さくに声をかけていただいています.お礼をしながら名刺を渡し*3,会場をあとにしました.