奈良先端科学技術大学院大学における電子図書館システム 〜 運用と次世代システムへ向けて 〜

砂原 秀樹, 今井 正和, 新 麗, 羽田 久一
奈良先端科学技術大学院大学
附属図書館研究開発室
〒630-0101 生駒市高山町8916-5
TEL: 0743-72-5151, FAX: 0743-72-5149, E-Mail: dl-lab@dl.aist-nara.ac.jp

概要

 本学における電子図書館システムの運用は1996年度より開始されすでに3 年半が経過した。この間、さまざまな経験とともに、運用的側面と研究的側面 からさまざまな成果を得ている。ここでは、昨年度設置された研究開発室の役 割と研究課題とともに、今年度末に導入される次期システムについて設計方針 を述べる。

キーワード: 電子図書館システム、運用体制、研究組織、次世代システム

The Digital Library System in NAIST 〜 Operation, Toward the Next Generation System 〜

Hideki Sunahara, Masakazu Imai, Rei S. Atarashi, Hisakazu Hada
Research Division, Digital Library, NAIST
8916-5, Takayama, Ikoma, Nara, 630-0101, Japan
TEL: +81-743-72-5151, FAX: +81-743-72-5149, E-Mail: dl-lab@dl.aist-nara.ac.jp

Abstract

 We have experience on operation of digital library system from 1996. We got several operation "know how" and research results. This paper describes research theme of research division, digital library, NAIST. We also discuss design concept of a new digital library system.

Keywords: digital library system, operation know how, research division, next generation system


1. はじめに

 本学における附属図書館の電子図書館化は、1991年より計画され、1994年にプロトタイ プシステムが完成している。その後、1996年度より本格運用が開始された。本格運用開始 からすでに3年半が経過しているが、この間さまざまな経験とともに、運用的側面と研究 的側面からさまざまな成果を得ている。ここでは、昨年度設置された研究開発室の役割と 研究課題について述べるとともに、今年度末に導入される次期システムについて、これま でシステムの見直しに基づく新たな設計方針を述べる。

2. 研究開発室設置の目的と研究テーマ

2.1. 目的

 本学における電子図書館システムの役割は、電子図書館システムを運用し利用者にサー ビスを提供するだけでなく、電子図書館を中心とした情報サービスシステムがどのような 方向性を持ち発展していくかを検討しそれを実現する研究的側面も有する。特に後者は、 本学が次世代電子図書館像を示し関係する分野において牽引役を勤めるために重要な要素 である。

 現行の電子図書館システムは、1996年より実運用を開始しているが、これまで電子図書 館に関する研究的活動は情報科学研究科及び情報科学センターにおいて個別に行われてき た。しかし、運用と研究という相反する役割を円滑にかつ効果的に進めるためには、これ らをまとめる中心的役割をする組織が必要となってくる。そこで、1998年7月に附属図書 館研究開発室が設置され、この任にあたることとなった。研究開発室には、専任の助手2 名、技官1名、兼任の助教授2名(情報科学研究科及び情報科学センター)が配され、電子図 書館にかかわる研究開発を進めるとともに、導入される電子図書館システムの設計にもか かわっている。また、5名のRAとともに電子図書館システムにかかわるソフトウェア開発 も行っている。さらに、1999年度より情報科学研究科より研究開発室に学生が配属され研 究開発に携わるようになっている。現在は2名の学生がそれぞれの研究活動を行っている。

2.2. 研究テーマ

 このような状況において研究開発室の役割は以下のように考えている。

 研究開発室設置から1年強が経過し、ここでの活動もようやく軌道に乗りはじめた状況 にある。現在ここでは以下に示すような研究テーマを中心に研究が進められている。

 単純な情報検索でなく、意味検索やシソーラス検索、あるいは画像検索といった高度な 検索技術の研究開発を行っている。

 Gigabitクラスのネットワークを背景に、ビデオストリームなどのマルチメディア情報背 信の仕組みについての研究開発を行っている。。また、ソフトウェアなど本学におけるプロ ダクトなど、従来の図書館では扱うことが困難であった情報を取り扱う仕組みについての 研究開発も行っている。

 電子図書館の重要な役割の一つとして、持っている情報をいかに効果的に発信するかが ある。特に本学においては、先端科学技術にかかわる情報を広く伝えることが電子図書館 の大きな課題である。現在、授業を素材として、リアルタイム型と蓄積型の発信のメカニ ズムについて研究開発を行っている。

 現在インターネットでは、電子図書館だけでなくさまざまな情報が分散配置されている。 これらの情報には非常に有益なものから、全くの雑音にすぎないものまでさまざまなもの が存在している。こうした中で正しく必要な情報に到達するようガイドする役割は、電子 図書館の重要な機能であろう。こうした情報ナビゲーション機能を実現するための研究開 発を進めている。特に、各情報に対して解説や整理、分類などを行うためのメタデータを 付与するための技術について研究を行っている。

 電子図書館システムは、それ単体で利用されるものでは無い。オンラインジャーナルを 始めとしてインターネット上のさまざまな情報と有機的に組み合わせて利用することが、 情報を有効に利用するために不可欠である。このような時にサーバ同士を連携させこれら を有機的に統合する技術は非常に重要である。現在、このような機能を実現するため複数 の検索サーバを協調動作させるための仕組みに関する研究を進めている。

3. 次期システムについて

 本学の電子図書館システムの調達は、1995年度より7ヵ年計画で導入が進行している。 この調達において、各年度に調達されるシステムは4年間のレンタルを基本としており、 1998年度(1999年1月)に導入されたシステムをもって、ひと区切りがついたこととなる。 今後は、導入されたシステムの更新と追加によって調達が進められることになるため、1999 年度の調達においては、これまでのシステムの設計を見直し、より快適なシステムの構築 と新たな技術の導入を行っている。ここでは、1998年度までに導入されたシステムの現状 を述べるとともに、次の4年間のシステム設計方針について概観する。

3.1. 現行システムの設計方針と現状

 大学附属図書館は、あらゆる情報源を利用して教育研究に必要不可欠な情報収集活動を支 援するものでなければならない。また、学内で生成される学術情報を外部に対して積極的 に提供するための情報発信機能も有していなければならない。このため、本学附属図書館 では以下のような目標のもとに、先端的な教育研究活動を支える基盤環境の構築を目指し ている。

 さらに、上の4つの要件を満たし続けるためには、高度情報化社会における図書館を取り 巻く状況の急速な変化(新しいメディアや情報サービス形態の出現、出版形態の変化、研究 発表・情報発信形態の変化など)に柔軟に対応する必要がある。このため、ある時点で可能 なサービスを固定的に提供するのではなく、常にサービスの種類・質と図書館の役割を検 討しつつシステム構築を進め、時代の変化に柔軟に対応することを目指している。また、 附属図書館は利用者サービスの観点からは以下の三つの性格を有することを目標としてい る。

 電子図書館システムは、本学の情報環境(曼陀羅ネットワークおよび曼陀羅システム)を 基盤として、上述の理念を具体化するための中核設備である。

 こうしたことを実現するため、原則としてシステム内に一次情報を蓄積し、それらを利用 者が検索して利用する機能を提供することを中核として、これらを支援する機能とともに 設計が行われている。具体的には、システムは以下の6つのサブシステムで構築されてい る。

(a) 一次情報入力システム

 本システムは書籍情報の一次情報を電子化するために必要不可欠なデータ入力・メディ ア変換用機器群である。附属図書館が入力の対象とするメディアには、冊子体、CD-ROM 及びネットワーク経由のファイル入力があり、特に冊子体の場合はカラーで表現された写 真が含まれている。ここでは、冊子体情報をスキャナで読み込むとともに、OCRによる全 文検索用のデータの生成、目次情報の入力、システム内で利用されるデータ形式への変換 編集等が行われる。また、CD-ROMやネットワーク経由で入手されたファイルについては 必要なデータ形式への変換を経て、システム内に取り込まれている。

 現在5台のモノクロスキャナ装置、6台のカラースキャナ装置とこれらを支援するための ワークステーション群で構成されている。

(b) ディジタルビデオシステム

 今日の教育研究活動では、映像情報の重要性が増大している。本システムは、外部から 映像情報を収集するとともに、本学において映像情報を製作し、他の図書情報と統合化し た形でディジタルメディアに蓄積している。また、それを学内利用するだけでなく、学外 への発信をも目指している。システムでは、ビデオ情報をMPEG-2形式で保存し、ネット ワーク経由での閲覧機能を提供している。さらに、本学において映像情報を作成するため のスタジオ、編集装置なども本システムに含まれる。

 現在、4MbpsストリームのMPEG-2ビデオを約600時間格納する容量を有している。

(c) 一次情報蓄積システム

 ディジタル化された冊子体一次情報を蓄積するための大容量ファイルサーバである。最終 的に十数TBの容量を実現することを前提に設計されたため、容量のすべてをディスクアレ イで構成するのではなく、光磁気ディスクジュークボックス、磁気テープジュークボック スを用いた階層型の記憶システムによって構成されている。データの配置は、データの利 用頻度等によって自動的に行われるように管理されている。

 現在、システム全体で7TBの記憶容量を有している。

(d) 検索システム

 従来の図書館が提供する二次情報を用いた検索機能及び、OCRによって生成された一次 情報を用いた全文検索機能を提供する。現在2機のWebベースの検索サービスを提供して いる。

(e) ネットワーク接続装置

 電子図書館のシステムは、これらの装置単独で動作するわけではなく、これらが有機的 に協調することによって全体のサービスを提供している。また、学内の情報システムであ る曼陀羅システム及び曼陀羅ネットワークとの協調も不可欠である。本システムは、これ らシステム間の協調を支援するための高速ネットワークである。現在、スイッチベースの FDDIで構成されている。

(f) 業務支援システム

 電子図書館といえども、従来型の図書館機能を失っているわけではない。これは、著作 権の許諾の関係で電子化できない書籍等に対しての従来型サービスの提供だけでなく、電 子化作業の工程管理など電子図書館としても業務を支援する機能を必要としている。これ らの機能を提供するため従来型の図書館業務支援システムを拡張する形での実現を行って いる。

3.2. 電子図書館サービス

 現行のシステムが提供しているサービスは、基本的に図1に示した通りである。利用者 は手元にあるシステムよりWebブラウザを用いて、電子図書館システムにアクセスする。 通常の場合、キーワードを入力し前文検索機能で該当する文献を探し出すということを行 うことになる。また、MPEG-2のビデオ閲覧はMPEG-2のデコード機能を有する端末のみ で行うことができるようになっている。

図1: Web による電子図書館サービスアクセス例

 また、雑誌リストから巻号にしたがって、雑誌をブラウズすることも可能である。

 これ以外に、新着図書の中から利用者が登録したキーワードを含むものがあった場合、 それを電子メールで知らせるサービスも提供されている。電子メールには文献名とともに それにアクセスするためのURLが含まれているため、通常はこれをクリックするだけで Webブラウザが起動され該当する一次情報を参照できるようになっている。

3.3. 現行システムの問題点と次期システムでの改善点

 4年間の運用経験によって、現行のシステムの問題点が明らかになってきた。これらの問 題点の中には、すぐに解決することは困難な問題もあり、研究開発室を中心として情報科 学研究科及び情報科学センターにおいて研究課題として問題の解決に努めている。しかし 一方において、現行システムの設計見直しによって解決可能な問題もあり、これらは1999 年度末に導入される次期システムの設計に反映されている。

 次期システムにおいて以下のような改善が行われている。

1. 一次情報蓄積システム構成の見直し

現行システムでは、一次情報蓄積システムは、ディスクアレイ/光磁気ディスクジューク ボックス/磁気テープジュークボックスの3階層の構成を採用している。しかし、当初 考えていたよりも磁気テープジュークボックスのアクセス速度が高速であることが判 明し、3階層の複雑構成を採用するよりも、ディスクアレイ/磁気テープジュークボック スの2階層構成の方が扱いやすく十分な性能が得られることが明らかになってきた。そ こで、現行システムの一部からこの構成を採用している。また実際の利用統計によると、 利用者がファイルを参照する状況は、個々の利用者によってさまざまであることが明ら かになってきている。したがって、頻繁に利用されるファイルを格納するキャッシュで あるディスクアレイの容量が当初予想していたものよりも多く必要であることがわか った。当初の設計では、全容量(磁気テープジュークボックスが提供する容量の総計)の 10%程度としていたが、現行システムの一部から25%としている。

2. 記事/論文単位でのファイル管理とPDF形式の導入

この問題は階層構成となっている一次情報蓄積システムと密接な関連がある。現行のシ ステムでは一次情報はページ単位でファイルに格納されている。そのためあるページを 参照している状況で、次のページを参照しようとすると異なるファイルへの参照が発生 する。このとき運悪くこのページが磁気テープジュークボックス中に格納されていた場 合、そのファイルがディスクアレイにコピーされるまで利用者はそのページの参照を待 たされることになる。こうした問題を避けるため、次期システムではPDF形式を採用 し記事/論文単位でのファイル管理を行うよう変更されている。これにより、記事/論文 が一括して管理されることとなり前述のような問題は解消される。

3. ネットワーククラスタ構成による検索サーバ

電子図書館システムにおいてデータは単調に増加することになる。その結果、同一の能 力を持つ検索サーバを用いている限り検索性能は少しずつ低下してゆくことになる。そ のため、データの増加に合わせて検索サーバの増強が必要になってくる。しかし、現行 のシステムでは、マルチプロセッサ型のサーバ構成を用いており、検索サーバの強化の ためには検索サーバ全体の更新が必要となってくるが、このような更新はレンタルによ る導入にはそぐわない点がある。現行のシステムにおいては、2機のサーバを用いてい るが、これらは目的別に利用を分割しており、能力の高いシステムを主に利用者のサー ビスに用いるようにしている。

こうした状況を解決するために、次期システムにおいてはネットワーククラスタ構成に よる検索サーバアーキテクチャを採用し、必要に応じてエンジンを追加していくことで 全体の検索性能を増強できるようにしている。また、このような構成を採用することで これまで夜間に行ってきたハウスキーピング処理をクラスタ中の一台のエンジンに割 り当てバックグラウンドで行うことができるようになる。これによりハウスキーピング 処理による、サービス性能の低下は最小限に留めることができるようになる。

 この他、一次情報の入力作業をよりスムースにするためのシステム構成の見直しや、ネ ットワーク機能の強化が行われている。この次期システムは、今年度末に導入され試験運 用とデータの移行作業を経て来年度より実運用を開始する。

4. まとめ

 電子図書館の運用については、そのKnow Howがようやく蓄積され始めたところであり、 研究活動と並行して、他の電子図書館システムと共に運用面/研究面の双方からの協調が不 可欠である。そのためには、電子図書館にかかわる技術的スタッフ間の相互協調組織の設 立が必要ではないかと考える。このワークショップを含め、今後こうした協調関係を確立 できるよう各方面との協力関係を確立していていくことを目指したいと考える。

[参考文献]

Hideki Sunahara, Rei (Suzuki) Atarashi, Toru Nishimura, Masakazu Imai, Kunihiro Chihara: "NAIST Digital Library," Second European Conference on Research and Advanced Technology for Digital Library (ECDL98), Lecture Notes in Computer Science, 1513, pp.907-908, Sep. 1998.

Rei Suzuki, Hideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Buiilding Digital Library System - NAIST Challenge -," Proccedings of International Symposium on Research, Development & Practice in Digital Libraries 1997 (ISDL'97), pp.28-31, Tsukuba, Japan, Nov. 1997.

Masakazu Imai, Chinatsu Horii, Hisakazu Hada, Naokazu Yokoya, Kunihiro Chihara: "Design of a Digital University Library: Mandala Library," Proceedings of International Symposium on Digital Libraries 1995 (ISDL'95), pp.119-124, Tsukuba, Japan. Aug. 1995.