すでに,インターネット上には多数のWWW (World-Wide Web) 情報蓄積 サーバが構築されており,そのためのクライアントソフトウェアを用いれ ば,それら世界中のサーバにアクセスして諸々の情報を居ながらにして入 手することができつつある.しかしながら,誰もが容易に検索してそれら 情報を自分のものとしたり,再利用しながら知識の再生産をするためには まだまだ解くべき課題も多い.
ここでは,「マルチメディア電子図書館」のシステム概念と課題につい て概説するとともに,著者らが試作中の電子図書館プロトタイプシステム "Cornucopia" (コーヌコピア)と関連する技術について紹介する.
マルチメディア電子図書館システムは,多少単純化すると,情報の入 力,蓄積,検索,配送,課金などの機能を備える,以下の4つのサブシス テムで構成される(図1).
検索を可能にするためには,それぞれの情報に対して,タイトル,主 題,作成者,出典などの書誌情報(属性情報)を入力する必要があり, データベース構築上の大きなコストを占めている.従来,人手によって行 われるこのインデキシング作業は,パターン認識などの情報処理技術に よって自動化することが考えられている.文書情報に対する文書認識の応 用[9]のほか,将来は,写真や図形の内容検索[10],あるいは動画や音声 の内容検索[11]のための特徴抽出もこの部位で行われるようになろう.
情報の自動分類や,情報相互間の関連性(ハイパーテキストリンク)の 自動抽出は蓄積情報の付加価値を高める.ユーザ自らが分類したサンプル 文書(教師付きサンプル)からルールを学習して,テキスト文書を自動分 類する方法が研究されている[12].これらの技術により,個人の関心事 (興味)に関するプロファイル (interest profile) をシステムに登録し ておき,そのプロファイルに合致する情報やそれに関連する情報を利用者 に自動的に配信する情報フィルタリングサービスを実現することができ る.
検索サーバには,分類型の検索や,自由な単語からの高速な全文検索が 必要である.筆者らの開発した統合文書情報システム"Bibliotheca"(ビ ブリオテカ)は特に日本語情報の高速な全文検索を可能にした[13].あい まいな情報からの意味的な知的検索[14]や,静止画や映像,または音声な どのマルチメディア情報の内容からの「マルチメディア内容検索」は現在 盛んに研究されている[1].カーネギーメロン大学ではInforMediaプロ ジェクトの一環で音声認識や画像処理技術を応用したビデオ情報の自動イ ンデキシングや自動抄録の研究を進めている.カリフォルニア大学バーク レイ校では,概念からの写真の内容検索を実現するための画像処理技術を 研究している.
このようにポインタだけを持った所在サービスシステムは「仮想電子図 書館」と見ることもできる.このようなシステムは専門分野ごとに多数登 場し,競い合って「権威」ある書誌情報をサービスしていくようになるで あろう.あるいは,世界中に散逸してる(分散管理されている)古美術品 を仮想電子図書館があたかもすべてを管理しているがごとく,利用者に提 供することもできよう.
このようなシステムは図1のように,必ずしも「電子図書館」の中にあ る必要はなく,独立した機関として存在するようになろう.あるいは,逆 に,大きな企業などの組織ではその組織内にこのような所在サービスシス テムを独自に持つようになると考えられる.最新の情報のポインタを常に 世界中から集めることは「情報組織化」の一つである.
このような機能を最終的に利用者に提供するのはクライアントソフトの 役割である.世界中の情報があたかも自分の手元にあるような感覚を与え るようなインターフェース,あるいはその機能を与えるソフトウェアが理 想であろう.筆者らはこれを「仮想個人図書館」と捉えている.この場 合,「個人」とは全く一人の個人ではなく,グループの一人として捉える ことが重要であり,このようなソフトウェアは情報共有を実現するグルー プウェアとしての機能も持つ必要がある.
メディア変換サブシステムとしては,印刷文書の目次認識を行い,その 認識結果のデータから検索を行う機能を試作した.蓄積・検索サブシステ ムには,マルチメディア文書管理サーバBibliotheca/InfoShareと全文検 索サーバBibliotheca/TextSearchを用いて,ビデオや音声情報を含むマル チメディア文書(HTML文書)を蓄積管理する.これらのサーバは,WWW (World-Wide Web) のクライアントからHTTPプロトコルでアクセスできる ように,ゲートウェイソフトBibliotheca/Gatewayを介してインターネッ トに接続している.利用者は,MosaicまたはNetscapeナビゲータから,上 記のBibliothecaで管理するHTML文書を全文検索機能で検索し,閲覧する ことができる.図3はNetscapeからアクセスしたときの Bibliotheca/InfoShareの分類型検索の画面例である.
このシステムの特長は,クライアントソフトウェアにおける利用者の知 的情報活動の支援する「仮想個人図書館」機能にある.前節で述べたよう に,単に情報を検索して見るだけではなく,情報の収集,分類整理,蓄 積,再編集,発信という情報活動全体を支援することを狙っている.
ここではとくに,仮想的な情報の個人的所有と再編集を可能とする方式 とソフトウェアを試作した.著作権を尊重した上で,得られた情報を「自 分のもの」と感じられるようにする方法として,Ted Nelsonによって提案 されている「トランスクルージョン (Transclusion)」[15]という考え方 を採用した.すなわち,情報の仮想的な「個人化」の方法として,情報の コンテンツを持たずに,そのポインタ情報(アドレス情報)のみを保存し て,必要なときには再びアクセスする方法である.したがって,将来は見 る度にその量に応じた情報課金を行うことが可能である.
本システムでは,この考え方を基本に,独自のブラウザソフトウェア Knowledge Bookを開発した.利用者は,WWWから検索で得られた情報をこ のKnowledge BookによってHTML文書を閲覧したり,その一部に付箋を張っ てアノテーションを付けることができる.アノテーションは「個人化」の 第一の具体機能である.図4およびに図5に画面例を示す.写真やビデオ 映像はマウスでクリックすることによって別ウインドウに大きく表示させ ることができる(図5).
第二の「個人化」の具体化機能は入手した情報の編集機能である.ソフ トウェアKnowledge Scrapbookを開発して,入手した情報の一部を切り 取って自分のスクラップブックに仮想的に切り張りすることを可能とした (図6).切り張りした情報は先述したように情報の所在を示すポインタ によって記録し,コンテンツは取り込まない.このスクラップブックはテ キストを挿入して自由に編集することができる.スクラップブックを開く と,システムはポインタから自動的に原情報にアクセスして該当部分を抽 出して,あたかもそこに情報があるかのように表示する.また,スクラッ プブックの出典情報を示す部分をクリックすると,元の全文情報を表示さ せることができる.
第三の「個人化」の具体化機能は入手した情報を格納する個人書架機能 である(図7).同図に示すように任意の個数の本箱を作り,任意の分類 名称を付けて,ドラッグアンドドロップ操作によって,本の形式で表示さ れる情報を自由に格納することができる.分類の変更も自由に行える.こ れらの本箱は内部的にはHTML文書形式で表現されている.
これらの機能を持つCornucopiaクライアントは,利用者の「仮想個人図 書館」であると言うことができる.グループウェアとしての重要な機能は ネットワークを介して別の人にこれらの本箱や編集後のスクラップブック を送付して,情報の共有を促進することであるが,これらの機能は現在開 発中である.
技術には,内容からのマルチメディア検索,機械翻訳による多言語検 索,エージェントを用いた広域分散情報検索などの検索高度化技術,著作 権クリアランス方式や課金方式,およびプライバシー保護などのシステム 的な技術課題をさらに解決していくことが求められる.インターネット上 にはすでに膨大な情報が乗っているが,現在は玉石混淆であり,分野毎に 信頼できる情報や評価の高い情報といったものが利用者に分かりやすく提 示できるような手段も重要である.
インターネットでの先進的な利用は始まりつつあるものの,本格的な普 及はこれからである.社会的には,有用かつ価値の高い電子化情報を,あ る規模以上に蓄積しながらシステムを構築することにより,このようなシ ステムの有効性を社会に示していくことが重要である.
[2] Special Issue on "Digital Libraries", Communications of ACM, Vol. 38, No. 4, April 1995.
[3] 田中功:「マルチメディアと図書館」,情報管理,Vol. 38, No. 5, pp. 472-478 (1995-8)
[4] 安達淳,外:「学術文献を対象とした電子図書館システムの構成 法」,情報処理学会情報学基礎研資,29-7 (1993-5)
[5] 柿本俊博,吉田哲三:「電子図書館実験システムの開発」, FUJITSU, Vol. 46, No. 3, pp. 276-284 (1995-5)
[6] 堤泰治郎,諸橋正幸,外:「電子図書館 I −将来像−」,情報処理 学会第49回全国大会,4-209 (1994-9)
[7] H. Fujisawa, Y. Mishina, et al., "Multimedia Digital Library Systems for the Global Information Network," Hitachi Review, Vol. 44, No. 5, pp. 273-280, Oct. 1995.
[8] N. Hamada, T. Kamiuchi, et al., "Digital Image System," Hitachi Review, Vol. 44, No. 4, pp. 227-232,1995
[9] 藤澤浩道,嶋好博,外:「マルチメディア内容検索のための文書画 像属性の自動登録」,電子計算機相互運用データベースシステム・講演予 稿集,159-168 (1991-11)
[10] 加藤俊一,下垣弘行:「マルチメディア商標・意匠データベース TRADEMARK」,電子情報通信学会パターン認識・理解研究会,PRU88-9, pp.31-38 (1988-5)
[11] 長坂晃朗,田中譲:「カラービデオ映像における自動索引付け法と 物体探索法」,情報処理学会論文誌,Vol. 33, No. 4, pp.543-550 (1992-4)
[12] 辻洋,間瀬久雄,外:「テキスト自動分類エキスパートシステムの 一構成法」,情報処理学会第49回全国大会,3J-8 (1994-9)
[13] 和歌山哲,外:「クライアントサーバで実現する統合文書情報シス テム−Bibliotheca」,日立評論,Vol. 77,No. 5,pp. 367-370 (1995-5)
[14] 野村浩郷,伊佐原均,外:「情報ハイウェイ時代のテキスト情報へ の知的アクセス」,情報処理,Vol. 37, No. 1, pp. 1-9 (1996-1)
[15] T. ネルソン:「リテラリーマシン − ハイパーテキスト原論 」,竹内・斉藤監訳,アスキー出版 (1994-10)
[16] H. Fujisawa, K. Marukawa: "Full-Text Search and Document Recognition of Japanese Text," Proc. Symp. Document Analysis and Information Retrieval, pp. 55-80, Las Vegas, April 1995.