以下、2章では、電子図書館におけるコンテンツ流通について検討し、3章では、電子図書館を拡張したコンテンツ流通システムNet-Xの実装について述べる。
(1) 自館によるディジタルコレクションの蓄積と提供
(2) 既にディジタル化された資料の提供
(3) サブジェクトゲートウェイ機能の提供
(1)は、歴史的資料や貴重資料を図書館自身が個別にディジタル化し提供するサービスである。(2)は、ディジタル化された資料を利用するための許諾を得て、あるいはライセンスを購入してディジタル資料を提供するサービスである。この2つの方法は、図書館自身が自らコンテンツを提供するサービスである。一方、(3)は、ネットワーク上の他の電子図書館と相互に連携することによってメタデータを作成し、利用者を他の電子図書館の資料にナビゲートするサービスである。
また、NetLibraは、CORBA(Common Object Request Broker Architecture)による分散オブジェクト技術を利用して、ネットワーク上に分散したディジタルコンテンツの所在場所(格納サーバの位置)を意識することなく必要な情報にアクセスする横断検索機能やサーバの自律運用等の特徴を持つ。
NetLibraでは、分散した電子図書館にコンテンツを配置することが可能なため、大量のマルチメディアコンテンツを扱うことが可能である。しかし、インターネットが普及し、Webシステムを使って膨大な量のコンテンツが公開されている現在、NetLibraに閉じたコンテンツの検索だけでは十分とはいえず、2.1節で述べた(3)サブジェクトゲートウェイ機能への対応も必要である。そこで、次節では、この観点から現在のNetLibraに付加すべき機能について述べる。
(1) Webコンテンツへの対応
Webシステムで公開されているコンテンツは、雑多でありかつ膨大な量であるので、有用なコンテンツを取捨選択する仕組みを持つことが必要である。
(2) 検索方法の高度化
NetLibraに閉じたコンテンツの検索の場合は、コンテンツが体系化されており、従来から利用されている書誌情報による検索(図1)でも問題は少ない。しかし、Webコンテンツへ対応した場合、体系化されていない情報が大量に含まれることとなり、検索結果が不要なもので埋め尽くされる、検索結果が膨大な量になるなどの問題が生じる。そこで、書誌情報による検索だけでなく、関連のあるコンテンツへナビゲートする機能を持つことが必要である。
図1 NetLibra の検索条件入力画面
(3) 有料コンテンツへの対応
インターネット上では、有料コンテンツを利用者に提供するシステムも増加している。そのため、コンテンツの種別としても、無料コンテンツだけでなく、印刷用画像やソフトウェアなどの有料コンテンツも扱える仕組みを持つ必要がある。
(1) Webコンテンツへの対応
WebコンテンツとNetLibraのコンテンツをシームレスに検索できるようにするために、Webコンテンツのメタデータを収集し、検索用のDBに保存する必要がある。そこで、検索ロボットにより、有用なコンテンツを取捨選択し、Webコンテンツのメタデータを収集する。
収集したメタデータの格納方法として、
の2通りがある。Webコンテンツは、電子図書館のコンテンツとは異なり、改編や削除の周期が短いので、検索ロボットを起動するたびにデータの修正が数多く発生すると考えられる。データのバックアップ等、システムの保守・運用という観点からは、更新の多いデータは、更新の少ないデータと別に扱うほうが良い。そこで、WebコンテンツのメタデータをNetLibraと別のDBに保存する後者の方法を採用した。
(2) 検索方法の高度化
関連のあるコンテンツへ利用者をナビゲートする機能を実現するために、筆者らが開発したノウハウ蓄積システムFISH[5]で提案した自動リンク機能を用いてコンテンツ間のリンクを生成する。
FISHでは、内容が多様で、従来のデータベースのような属性と値による定型化が困難な情報を、仮想的なカードに細分化し、各カードにキーワードを付与して表現する。各カード間は、キーワードによりリンクで結ばれ、関連情報の参照を容易にする。
キーワードによるリンクは、HTMLのようにコンテンツ作成時に埋めこまれるのではなく、カード参照時に自動的に生成されるため、
を実現できる。
この自動リンク機能を、電子図書館のコンテンツとWebコンテンツに拡張することにより、コンテンツ間の連携が可能となり、関連のあるコンテンツへナビゲートする機能を実現した。なお、自動リンクの基となるキーワードは、コンテンツおよびメタデータから形態要素解析によって抽出された名詞を用いた。
(3) 有料コンテンツへの対応
有料コンテンツ対応としては、市販されている電子決済モジュールをWebシステムに組み込むことにより実現した。有料のコンテンツは、購入を希望する利用者にできるだけ紹介したいという販売側の意思があるので、そのメタデータは、コンテンツ登録時に詳細に登録されることが多い。そこで、有料コンテンツのメタデータは、コンテンツ入力時に整備することとした。その際のメタデータの形式は、インターネット上での情報資源の発見を目的として提案され、標準化が進んでいるDublin Core Metadata[4]に基づき保存する。同様に、ロボット収集したWebコンテンツのメタデータに関しても、可能な項目に対して、Dublin Core Metadataに準拠する形式で保存する。
図2 Net-X の概念図
図3 ハードウェア構成図
図4 ソフトウェア構成図
既存Webサーバのメタデータは、検索ロボットにより定期的に収集され、メタデータDBに保存される。有料コンテンツサーバのメタデータは、コンテンツ登録時にNet-Xサーバに送られる。利用者がWebクライアントから検索を実行すると、入出力制御部から検索モジュールに検索指示が出され、Webコンテンツ検索部はメタデータDBを検索し、NetLibra検索部は、CORBAを利用してNetLibraサーバを検索する。自動リンク生成部は、コンテンツ自身の本文に対してと、メタデータ中の要旨に自動リンクを作成することができる。
一方、Net-Xでは、「コンテンツ表示」で表示されるコンテンツ内にキーワードによる自動リンクが張られているので、そのリンクをクリックすることにより、「検索結果一覧」が表示される。すなわち、従来の検索システムで必要な「検索条件入力」を省略できるのである。
また、従来のシステムでは、利用者が「コンテンツ表示」で興味を持ったキーワードで検索を行った場合に、検索結果0件という結果もあり得る。その場合、他のキーワードを考え、再入力する必要があった。しかし、Net-Xでは、自動リンクのキーワードとコンテンツは必ず対応しているので、検索結果0件ということはない。
このように、Net-Xでは、人間の思考を妨げないシームレスな検索を実現できる。
が用意されている。これらの検索に該当したコンテンツのリストが、その下部に表示される。リスト表示の上部分は、該当した既存Webコンテンツと有料コンテンツのリストである。リスト表示の下部分は、該当したNetLibraコンテンツのリストである。
図5 コンテンツ検索画面
(1) 有料コンテンツの表示
検索結果リストの中から有料コンテンツを選択した場合は、右側にそのコンテンツのメタデータが表示される(図6)。
図6 メタデータ表示画面
メタデータの表示では、そのコンテンツの分野、地域、年代に相当する属性のシンボルが画面上部に表示される。画面中央にはDublin Core準拠のメタデータとコンテンツのサムネイルが表示される。メタデータの概要に関しては、自動リンクにより説明文がクリッカブルになって表示される。この文字をクリックすることにより、そのキーワードで検索される情報の一覧が左側に表示される。このメタデータとサムネイルを参照しながらの購入したいコンテンツが出現した場合、画面中の「購入」ボタンをクリックすることにより、電子決済によりネットワークを介して購入できる。
(2) Webコンテンツの表示
検索結果リストの中から既存Webコンテンツを選択した場合は、新しいウィンドウにそのページが表示される。Webコンテンツのテキスト部分に自動的リンクを生成することも技術的には可能であるが、著作権の問題を考慮して、そのままのページを別ウィンドウで表示することとした。
(3) NetLibraコンテンツの表示
検索結果リストの中からNetLibraコンテンツを選択した場合、右側にそのコンテンツそのものが表示される。そのコンテンツの説明文は自動リンクによりクリッカブルになって表示される。この文字をクリックすることにより、そのキーワードで検索される情報の一覧が左側に表示される。
今後は、様々なコンテンツを用いたコンテンツ連携機能の評価を行う予定である。
[2] 杉本 重雄:図書館情報大学におけるディジタル図書館システム, 第15回ディジタル図書館ワークショップ, pp.17-28, 1999.7.
[3] 萱野 忠, 西野 正和, 関 良明, 爰川 知宏:分散ネットワーキング電子図書館 NetLibra の提案, 第57回情報処理学会全国大会, 3-1, 1998.10.
[4] 杉本 重雄:Dubline Core Metadata Element Setについて-現在の状況と利用例, 第14回ディジタル図書館ワークショップ, pp.3-18, 1999.3.
[5] 関 良明:分散型ノウハウ蓄積システムGoldFISHにおける分散環境への適応, 情報処理学会論文誌, Vol.36, No.6, pp.1359-13366, 1995.
[6] T. Yamakami, Y. Seki, "Knowledge awareness in asynchronous information sharing":Proc. of the IFIP TC8/WG8.4 Working Conference, pp.215-225, 1993.