キーワード: 電子図書館システム、運用体制、研究組織、次世代システム
Keywords: digital library system, operation know how, research division, next generation system
現行の電子図書館システムは、1996年より実運用を開始しているが、これまで電子図書 館に関する研究的活動は情報科学研究科及び情報科学センターにおいて個別に行われてき た。しかし、運用と研究という相反する役割を円滑にかつ効果的に進めるためには、これ らをまとめる中心的役割をする組織が必要となってくる。そこで、1998年7月に附属図書 館研究開発室が設置され、この任にあたることとなった。研究開発室には、専任の助手2 名、技官1名、兼任の助教授2名(情報科学研究科及び情報科学センター)が配され、電子図 書館にかかわる研究開発を進めるとともに、導入される電子図書館システムの設計にもか かわっている。また、5名のRAとともに電子図書館システムにかかわるソフトウェア開発 も行っている。さらに、1999年度より情報科学研究科より研究開発室に学生が配属され研 究開発に携わるようになっている。現在は2名の学生がそれぞれの研究活動を行っている。
研究開発室設置から1年強が経過し、ここでの活動もようやく軌道に乗りはじめた状況 にある。現在ここでは以下に示すような研究テーマを中心に研究が進められている。
単純な情報検索でなく、意味検索やシソーラス検索、あるいは画像検索といった高度な 検索技術の研究開発を行っている。
Gigabitクラスのネットワークを背景に、ビデオストリームなどのマルチメディア情報背 信の仕組みについての研究開発を行っている。。また、ソフトウェアなど本学におけるプロ ダクトなど、従来の図書館では扱うことが困難であった情報を取り扱う仕組みについての 研究開発も行っている。
電子図書館の重要な役割の一つとして、持っている情報をいかに効果的に発信するかが ある。特に本学においては、先端科学技術にかかわる情報を広く伝えることが電子図書館 の大きな課題である。現在、授業を素材として、リアルタイム型と蓄積型の発信のメカニ ズムについて研究開発を行っている。
現在インターネットでは、電子図書館だけでなくさまざまな情報が分散配置されている。 これらの情報には非常に有益なものから、全くの雑音にすぎないものまでさまざまなもの が存在している。こうした中で正しく必要な情報に到達するようガイドする役割は、電子 図書館の重要な機能であろう。こうした情報ナビゲーション機能を実現するための研究開 発を進めている。特に、各情報に対して解説や整理、分類などを行うためのメタデータを 付与するための技術について研究を行っている。
電子図書館システムは、それ単体で利用されるものでは無い。オンラインジャーナルを 始めとしてインターネット上のさまざまな情報と有機的に組み合わせて利用することが、 情報を有効に利用するために不可欠である。このような時にサーバ同士を連携させこれら を有機的に統合する技術は非常に重要である。現在、このような機能を実現するため複数 の検索サーバを協調動作させるための仕組みに関する研究を進めている。
さらに、上の4つの要件を満たし続けるためには、高度情報化社会における図書館を取り 巻く状況の急速な変化(新しいメディアや情報サービス形態の出現、出版形態の変化、研究 発表・情報発信形態の変化など)に柔軟に対応する必要がある。このため、ある時点で可能 なサービスを固定的に提供するのではなく、常にサービスの種類・質と図書館の役割を検 討しつつシステム構築を進め、時代の変化に柔軟に対応することを目指している。また、 附属図書館は利用者サービスの観点からは以下の三つの性格を有することを目標としてい る。
電子図書館システムは、本学の情報環境(曼陀羅ネットワークおよび曼陀羅システム)を 基盤として、上述の理念を具体化するための中核設備である。
こうしたことを実現するため、原則としてシステム内に一次情報を蓄積し、それらを利用 者が検索して利用する機能を提供することを中核として、これらを支援する機能とともに 設計が行われている。具体的には、システムは以下の6つのサブシステムで構築されてい る。
(a) 一次情報入力システム
本システムは書籍情報の一次情報を電子化するために必要不可欠なデータ入力・メディ ア変換用機器群である。附属図書館が入力の対象とするメディアには、冊子体、CD-ROM 及びネットワーク経由のファイル入力があり、特に冊子体の場合はカラーで表現された写 真が含まれている。ここでは、冊子体情報をスキャナで読み込むとともに、OCRによる全 文検索用のデータの生成、目次情報の入力、システム内で利用されるデータ形式への変換 編集等が行われる。また、CD-ROMやネットワーク経由で入手されたファイルについては 必要なデータ形式への変換を経て、システム内に取り込まれている。
現在5台のモノクロスキャナ装置、6台のカラースキャナ装置とこれらを支援するための ワークステーション群で構成されている。
(b) ディジタルビデオシステム
今日の教育研究活動では、映像情報の重要性が増大している。本システムは、外部から 映像情報を収集するとともに、本学において映像情報を製作し、他の図書情報と統合化し た形でディジタルメディアに蓄積している。また、それを学内利用するだけでなく、学外 への発信をも目指している。システムでは、ビデオ情報をMPEG-2形式で保存し、ネット ワーク経由での閲覧機能を提供している。さらに、本学において映像情報を作成するため のスタジオ、編集装置なども本システムに含まれる。
現在、4MbpsストリームのMPEG-2ビデオを約600時間格納する容量を有している。
(c) 一次情報蓄積システム
ディジタル化された冊子体一次情報を蓄積するための大容量ファイルサーバである。最終 的に十数TBの容量を実現することを前提に設計されたため、容量のすべてをディスクアレ イで構成するのではなく、光磁気ディスクジュークボックス、磁気テープジュークボック スを用いた階層型の記憶システムによって構成されている。データの配置は、データの利 用頻度等によって自動的に行われるように管理されている。
現在、システム全体で7TBの記憶容量を有している。
(d) 検索システム
従来の図書館が提供する二次情報を用いた検索機能及び、OCRによって生成された一次 情報を用いた全文検索機能を提供する。現在2機のWebベースの検索サービスを提供して いる。
(e) ネットワーク接続装置
電子図書館のシステムは、これらの装置単独で動作するわけではなく、これらが有機的 に協調することによって全体のサービスを提供している。また、学内の情報システムであ る曼陀羅システム及び曼陀羅ネットワークとの協調も不可欠である。本システムは、これ らシステム間の協調を支援するための高速ネットワークである。現在、スイッチベースの FDDIで構成されている。
(f) 業務支援システム
電子図書館といえども、従来型の図書館機能を失っているわけではない。これは、著作 権の許諾の関係で電子化できない書籍等に対しての従来型サービスの提供だけでなく、電 子化作業の工程管理など電子図書館としても業務を支援する機能を必要としている。これ らの機能を提供するため従来型の図書館業務支援システムを拡張する形での実現を行って いる。
また、雑誌リストから巻号にしたがって、雑誌をブラウズすることも可能である。
これ以外に、新着図書の中から利用者が登録したキーワードを含むものがあった場合、 それを電子メールで知らせるサービスも提供されている。電子メールには文献名とともに それにアクセスするためのURLが含まれているため、通常はこれをクリックするだけで Webブラウザが起動され該当する一次情報を参照できるようになっている。
次期システムにおいて以下のような改善が行われている。
1. 一次情報蓄積システム構成の見直し
現行システムでは、一次情報蓄積システムは、ディスクアレイ/光磁気ディスクジューク ボックス/磁気テープジュークボックスの3階層の構成を採用している。しかし、当初 考えていたよりも磁気テープジュークボックスのアクセス速度が高速であることが判 明し、3階層の複雑構成を採用するよりも、ディスクアレイ/磁気テープジュークボック スの2階層構成の方が扱いやすく十分な性能が得られることが明らかになってきた。そ こで、現行システムの一部からこの構成を採用している。また実際の利用統計によると、 利用者がファイルを参照する状況は、個々の利用者によってさまざまであることが明ら かになってきている。したがって、頻繁に利用されるファイルを格納するキャッシュで あるディスクアレイの容量が当初予想していたものよりも多く必要であることがわか った。当初の設計では、全容量(磁気テープジュークボックスが提供する容量の総計)の 10%程度としていたが、現行システムの一部から25%としている。
2. 記事/論文単位でのファイル管理とPDF形式の導入
この問題は階層構成となっている一次情報蓄積システムと密接な関連がある。現行のシ ステムでは一次情報はページ単位でファイルに格納されている。そのためあるページを 参照している状況で、次のページを参照しようとすると異なるファイルへの参照が発生 する。このとき運悪くこのページが磁気テープジュークボックス中に格納されていた場 合、そのファイルがディスクアレイにコピーされるまで利用者はそのページの参照を待 たされることになる。こうした問題を避けるため、次期システムではPDF形式を採用 し記事/論文単位でのファイル管理を行うよう変更されている。これにより、記事/論文 が一括して管理されることとなり前述のような問題は解消される。
3. ネットワーククラスタ構成による検索サーバ
電子図書館システムにおいてデータは単調に増加することになる。その結果、同一の能 力を持つ検索サーバを用いている限り検索性能は少しずつ低下してゆくことになる。そ のため、データの増加に合わせて検索サーバの増強が必要になってくる。しかし、現行 のシステムでは、マルチプロセッサ型のサーバ構成を用いており、検索サーバの強化の ためには検索サーバ全体の更新が必要となってくるが、このような更新はレンタルによ る導入にはそぐわない点がある。現行のシステムにおいては、2機のサーバを用いてい るが、これらは目的別に利用を分割しており、能力の高いシステムを主に利用者のサー ビスに用いるようにしている。
こうした状況を解決するために、次期システムにおいてはネットワーククラスタ構成に よる検索サーバアーキテクチャを採用し、必要に応じてエンジンを追加していくことで 全体の検索性能を増強できるようにしている。また、このような構成を採用することで これまで夜間に行ってきたハウスキーピング処理をクラスタ中の一台のエンジンに割 り当てバックグラウンドで行うことができるようになる。これによりハウスキーピング 処理による、サービス性能の低下は最小限に留めることができるようになる。
この他、一次情報の入力作業をよりスムースにするためのシステム構成の見直しや、ネ ットワーク機能の強化が行われている。この次期システムは、今年度末に導入され試験運 用とデータの移行作業を経て来年度より実運用を開始する。
[参考文献]
Hideki Sunahara, Rei (Suzuki) Atarashi, Toru Nishimura, Masakazu Imai, Kunihiro Chihara: "NAIST Digital Library," Second European Conference on Research and Advanced Technology for Digital Library (ECDL98), Lecture Notes in Computer Science, 1513, pp.907-908, Sep. 1998.
Rei Suzuki, Hideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Buiilding Digital Library System - NAIST Challenge -," Proccedings of International Symposium on Research, Development & Practice in Digital Libraries 1997 (ISDL'97), pp.28-31, Tsukuba, Japan, Nov. 1997.
Masakazu Imai, Chinatsu Horii, Hisakazu Hada, Naokazu Yokoya, Kunihiro Chihara: "Design of a Digital University Library: Mandala Library," Proceedings of International Symposium on Digital Libraries 1995 (ISDL'95), pp.119-124, Tsukuba, Japan. Aug. 1995.