また、他の文献データベースについても農林水産省内に提供するとともに書誌所在情報をも同時に提供を行い、併せて農林水産省試験研究機関で発行されている研究報告の全文情報を提供するシステムを開発している。これらの情報は有機的に統合され、ネットワーク上から利用できる。
本稿では、このネットワークライブラリシステムについて開発の経緯を踏まえた概要を紹介する。
情報センターでは1984年からNECの汎用機ACOS上のデータ応用システムDATA-710を利用してオンラインデータベース(表1)を農林水産省試験研究機関向けに構築・提供していたが、年々増加するデータのため検索レスポンスの悪化を招くに至った。また、コンピュータ技術の発展によりGUIを利用したインターフェイスが一般的になるなか、このシステムではコマンドラインを中心としたインターフェイスであるなど操作に熟練を要し、利用者からも不満が挙がっていた。
農林水産省の29の試験研究機関で所蔵する図書資料類の情報についても、それぞれの機関が独自の手法で収集・管理しており、各試験研究機関で所有している書誌類を機関間での相互利用を効率的に図るには情報センターでの総合オンライン目録作成が必要であるが、データ形式や目録基準の違いなどから困難な状況であった。
一方、計算センターに於いて進められていた農林水産省研究ネットワーク(Ministry of Agriculture, Forestry and FIsheries research Network : MAFFIN)の構築と、各試験研究機関でのTCP/IPによるネットワークの構築により、個々の研究室からインターネットを利用した情報へのアクセスが可能な環境が実現した。情報センターで提供している情報についても、ネットワークを利用しどこからでも簡易なインターフェイスで検索できる必要性が高まり、インターネットからのアクセス手法などについて検討を開始した。併せて、AGRISなど対外的に関心の高いデータベースについては、同様にインターネットを利用して公開する方向で検討が進められた。
を構築するべきであるとし、これらの情報を有機的に結合した上で統一的なインターフェイスから利用できるシステムとしてネットワークライブラリシステムの開発に1995年から着手した。
また、今後情報化を進める上で利用者が直接操作するインターフェイスとして何が適切かが重要な点であることに着目し、利用者の環境(Macintosh, MS-Windows, UNIX(X-Window), VTエミュレータ等)を考慮した結果、誰でも使えるあるいは使っているインターフェイスから利用できることとした。
ここで、プラットフォームに左右されず通常の環境下で利用できるインターフェイスである
の2つからの利用を前提として検討することとした。特にWWWブラウザからの利用は、著作権やライセンス上の問題が無い情報については農林水産省内に限定せずインターネット全域を通じての利用を想定することとした。システム全体の利用イメージを図1に示す。
システムとしては、メンテナンスのしやすさ・パフォーマンスの安定度・データベースの性質等、今後の管理・運用面を考慮して以下の3つのサブシステムから構成することとした。
なお、これらのシステムは互いの参照が不可欠なことから高速なネットワーク接続も必要であり、このための環境も有している。(図2)
以下、各システムごとにその構成や概要について述べる。ハードウェア構成は表2に示す通りである。
従来はACOSを利用して英語あるいは日本語で記述された6種類の文献情報データベースを提供しており、規模の大きいものは600万件(4年後には800万件)を超えていた。情報センターで提供しているデータベースには、農林水産省内に公開を限定しているデータベースから誰でも利用可能なものなどが混在していたが、ACOSの利用には専用の端末が必要であったため、農林水産省外への直接の公開は困難であった。
データベースシステムの更新を検討していた1994年当時、すでに計算センターではインターネットに接続しており、需要増から全国の試験研究機関との接続をISDNから専用回線に移行する計画が進行していた。この流れを受けて情報センターの文献情報データベースを農林水産省試験研究機関のみならずインターネットを経由しても利用できるようにすることが検討された。
その手段として、インターネット上の情報に簡易にアクセスする手段として普及し始めていたWWW(World Wide Web)に注目した。WWWのブラウザはMS-Windows、Macintosh、X-Windowなど多くのシステムで利用でき、また千葉大学附属図書館など一部の図書館ではすでにWWWを利用した蔵書検索システムを稼働させていた。情報センターでもその操作の簡易さや普及度などの面に着目して文献検索のためのインターフェイスとしてWWWブラウザを採用することとした。しかし、WWWでは操作の簡易さと引き換えに予め設定された仕組に沿ってしか検索できないため、操作に熟練した利用者にとっては不十分なインターフェイスになることも危惧された。特に農林水産省各試験研究機関で研究者から依頼を受けて実際に検索を行う情報資料担当部署のサーチャーからも旧来のシステムや商用データベースで利用されていた自由に検索式を組み合わせて絞り込みも行えるようなコマンド形式でも検索が可能なようにし、かつ機能の強化を図ることとした。
このような経緯のなか、以下のポイントに沿って検索システムを開発し文献情報を広く一般に公開することとした。
その結果、1995年に研究情報公開システムが完成し、翌年1月から日本国内向けにデータベースを提供できる運びとなった。しかし検索速度や安定性は十分なものとはいえず、利用者インターフェースの充実およびシステムの安定運用が重要な課題であった。
そして、1996年にこれらシステムを包含したネットワークライブラリシステムの一つのサブシステムとして文献情報システムを開発することとなった。
ネットワークライブラリシステムでは、研究情報公開システムに加え文献情報の検索結果からその文献の書誌所在情報(図書資料管理システム)や全文情報(全文情報システム)の表示が可能なよう設計が進められた。文献情報システムは先に開発された研究情報公開システムにデータベースの増設などを考慮した設計となっていたため、専用サーバの増設を行うだけで容易に拡張が可能であった。
先のシステムを含めたシステムの特徴としては、以下の項目が挙げられる。
・高速な検索処理のためのマシン構成。
- 利用者からの接続と検索リクエストを処理するフロントエンドサーバ(Digital AlphaServer2100、1CPU)と検索処理を行うバックエンドサーバ(Digital AlphaServer4100 3台、各4CPU)の4つのサーバをクラスター接続。
- 12のCPUをフルに生かし、高速な検索を実現。3つのバックエンドサーバにはそれぞれ4枚のCPUが搭載されており、検索時にはデータベースを11分割して11のCPUが並列処理を行い、この処理結果を1CPUで統合してフロントエンドサーバに引き渡す。
- 1CPUあたり最大250万件規模のデータベースを検索処理可能。
・WWWからの検索リクエストはWWWサーバからCGI(Common Gateway Interface)を使ってフロントエンドサーバに処理等を要求。
・検索処理等バックエンドサーバにわたす命令はコマンド検索およびWWW検索とも同一とし、汎用性を持たせている。
このシステムは、将来的にデータベースの収録件数の拡充や新規データベースを追加する場合にもバックエンドサーバを追加することで検索レスポンスを悪化させることなくデータベースの構築が可能である。また、コンピュータシステムの発達に伴い新しいインターフェースが開発されても、フロントエンドサーバあるいはCGIプログラム等インターフェイスとのゲートウェイ部分を変更・開発していくだけで、データベースシステムと構築されたデータに手を加えることなく情勢に適した検索システムを提供が可能である。
ネットワークライブラリシステムの導入前は、これらの図書館資料は各図書室で市販のデータベースソフトを使用して目録整理を行い、各機関内でオフラインでの利用に供していた。これらの情報の有効利用を図るため、逐次刊行物については1984年度より各機関の購入洋雑誌全国リストを作成し、各機関間相互で紙と郵便、FAXによるコンテンツ情報と原文献の提供サービス等を行っていた。図書館資料の所在情報はACOS上でデータベースを構築し提供を行っていたが、データ更新が遅いため実際の所在情報は反映されず、各機関の担当者間で直接の所蔵調査を併せて行うことが必要であるなど、活用は図れなかった。また、一般の商用データベースの導入状況等によって、ユーザーへのサービスに差異が生じていた現状があり、各試験研究機関の図書室で受けられるサービスの均一化は、全国異動を伴う研究者にとってかねてよりの要望事項であった。
今回開発を行ったネットワークライブラリのひとつの柱となる図書資料管理システムは、各試験研究機関に分散していたこれらの図書および逐次刊行物の所在情報及び書誌情報を有効活用し、ユーザー(研究者)側からの利用を想定した情報提供・収集の効率化、省外に対する情報公開を目的としている。
本システムの特徴としては、
が掲げられる。
まず、システムの構築に合わせ各機関のデータの取り込みを開始した。図書データは各機関で所蔵していた過去5〜10年間の図書の所蔵データ(約28万件)を図書資料管理システムの仕様にあわせ一括登録を行い、逐次刊行物データは学術情報センターのNACSIS-CATに登録済みの所蔵データ(約1万4千件)を格納、書誌データ以下に各所蔵機関の所蔵データをリンクしている。また、新規書誌の登録方法としては、農林水産省の目録データベースのほかに学術情報センターの総合目録から書誌データを流用することにより書誌情報の均一化及び業務の効率化を図っている。
そこで全文情報システムでは、
を目的として開発が進められた。
このシステムは他の2つのシステムともリンクしており、所蔵情報やAGRIS、日本農学文献記事索引などの文献データベースの検索時に全文情報システムで蓄積している論文が有る場合にはこれをハイパーリンクにより参照することを可能にしている。
ドキュメントの構築は印刷体だけでなくCD-ROMなど各種の電子媒体への変換へも柔軟に対応するべくSGML(Standard Generalized Markup Language)で行っている。また、SGMLでフォーマットされた文書だけでなく、すでに各試験研究機関でHTMLで作成されWWWを使い公開されている研究成果についても無視できない。このため、これらのWebページの収集とデータベース化にも対応できるようシステム開発を行った。
最終的にこのシステムでは、
を行うこととした。
データベースシステムには、SGMLの取り扱いに定評のあるOpenTextを導入した。ドキュメントの入力から追加・訂正、検索までの構築に関わる作業やシステムの管理は、全てWWWのブラウザを経由して行うことができる。WWWサーバソフトウェアとしてはNetscape Commerce Serverを導入してドキュメントの構築時にSSL(Security Socket Layer)を利用して送受信されるデータの暗号化を実施している。これにより、公開前のドキュメントや利用者のパスワードなどの情報を保護しデータ取り扱い時の信頼性を向上させている。
Webページの収集とデータベース化もOpenTextとWebページ収集ロボットであるSpiderで行い、現在各試験研究機関のWebページの自動収集とデータベースの構築試験を行っているところである。最終的には国内の農林水産関係のWebページについてのデータ収集とデータベース化を目標としている。
当面は、図書資料類所在情報・文献情報・全文情報の各システム間をリンクしたネットワークライブラリの完成を目標とする。さらに、
などのより使いやすく高度なシステムへ向け構築を行う予定である。
文献情報システムはAGRIS及びJASIについては国内向けに、この他のデータベースは農林水産省内向けで運用中であるが、月平均の利用者数は旧システムでの運用時と比較して倍以上に増加している。特にAGRISについての関心は高く、外部からの検索利用者のうち半数以上がAGRISを利用している。しかし、WWWブラウザ経由の利用では検索速度は旧来のシステムより高速になったもののデータベースとのゲートウェイ部の不備から利用できなくなることもあるため、安定稼働へ向けて調整を随時行っている。
図書資料管理システムは部分的に稼働中で、図書管理については1997年4月から業務を開始している。また、機関間相互貸借システムも一部試行中で雑誌管理業務は1998年1月からの運用開始を予定している。さらに、学術情報センターがサービスするNACSIS-CAT、NACSIS-ILLの新しいバージョンである新目録所在情報システムについても、これに対応するべく検討を行っている。将来的には書店・取次店などとの協力によって発注業務を効率化することも考えられている。
現在は、業務と平行して各機関から集めたデータの整合性の確認や、複数の書誌情報の統合などの作業を行っている。しかし、日本語辞書が不十分で、特に農林水産分野の用語について辞書を整備して検索精度を向上させるなどの改良が進められている。
また、担当者への教育・研修の実施やマニュアルの整備も進行中である。特に本システムでは担当者が全国に分散しているため、筑波で行われる研修会をネットワークを利用して全国に放送するなどテレビ会議システムを応用した研修システムについても実験が行われている。
全文情報システムについては、論文を章単位に表示するなど利用者インターフェースの改善に主眼を置き改善を進めている。また、ネットワークからの不正な利用を防止するための対策を検討中で、まず著作権表示を行えるよう追加作業中である。すでに、各試験研究機関の研究報告のうち平成7年度分の入力とデータベース構築を完了しているが、これら著作権に関する問題がクリアされた後に公開を行う予定である。今後は電子署名を埋め込むなど認証のための手法についても考慮が必要であろう。また、フォーマットとしてSGMLを利用しているが、現在はパラグラフ単位の検索のみでSGMLの特質を生かし切れているとはいえない。今後は、SGMLの特質を生かした構築法の確立や提供法を検討すると同時にPDF(Portable Document Format)など各種の媒体による提供などについても積極的に取り組んでいきたい。
根本彰, Digital Libraryは図書館か - ある図書館研究者のインターネット体験, ディジタル図書館(ISSN 1340-7287), No.2, p.15-32, 1994.11
石塚英弘, ディジタル図書館における基本出版技法:SGML, ディジタル図書館(ISSN 1340-7287), No.2, p.3-14 ,1994.11
桧垣泰彦,有岡圭子,池田宏明 : 千葉大学附属図書館のインターネット情報サービス, 医学図書館, Vol. 41, No.3, pp.277-285 (1994.9)