Z39.50とDublin Coreを用いた郷土関係電子図書館ネットワークの構築
ー「デジタル岡山大百科」における構想と課題ー
森山 光良
岡山県総合文化センター
〒700-0814 岡山市天神町8-54
Tel: 086-224-1286, Fax: 086-224-1208, E-Mail:
moriyama@libnet.pref.okayama.jp
概要
岡山県総合文化センター(岡山県立図書館)では,県内各図書館,機関で蓄積してきた郷土関係マルチメディア情報(資料,記事の本文,画像,音声,動画,ホームページ等)を各サーバにデータベース蓄積し,横断検索できる仕組みの構築に取り組んでいる。併せて,インターネットを通じて,県民もデータ提供できる県民参加型システムについても構想している。技術的基盤にZ39.50,Dublin
Core Metadata Element Setを据えたこの取り組みについて,基本コンセプトと現研究段階での現場課題を中心に考察する。同時に,産学官民連携,ネットワークのための組織化についての考察も行う。
キーワード
Z39.50, Dublin Core Metadata Element Set, 電子図書館ネットワーク, 知識創造,
組織化, ネットワーク
Constructing a local digital library network
using Z39.50 and Dublin Core
- Plan and subject in "Digital Okayama
Encyclopedia"ー
Mitsuyoshi Moriyama
Okayama Prefectural Cultural Center
8-54, Tenjin-cho, Okayama City, 700-0814,
JAPAN
Phone: +81-86-224-1286, Fax: +81-86-224-1208,
E-Mail: moriyama@libnet.pref.okayama.jp
Abstract
Okayama Prefectural Cultural Center (Okayama Prefectural Library) has been
trying to construct a system which realize cross-reference and accumulation
of the local multimedia information (materials, the text of reports, pictures,
sound data, animation data, homepages, etc.). All the multimedia information,
accumulated by the libraries and other organizations in Okayama prefecture,
is stored in the databases on the servers of each building. It is also
planned to construct a system which the people of Okayama prefecture can
offer information via Internet. This thesis considers those attempts technically
based on Z39.50 and Dublin Core Metadata Element Set, focusing on the basic
concept and the on-the-spot subject at the present research stage. Simultaneously,
this thesis considers the systematization for the cooperation and networking
among industry, academics, government, and piople.
Keywords
Z39.50, Dublin Core Metadata Element Set, Digital library network, Knowledge
Creation, Systematization, Network
1. はじめに
都道府県立図書館の基本的な任務と役割に,都道府県内郷土関係資料の網羅的収集,保存,提供がある。全国の都道府県立図書館は,これまで文献資料を主な対象としてその実践に努めてきたが,今日では電子図書館への取り組みによってその機能を果そうとしてきている。
網羅的収集,保存,提供の範囲は,インターネットでの情報発信が普通となった現在,マルチメディア情報(資料,記事の本文,画像,音声,動画,ホームページ等)へ拡大することは,ごく自然の成り行きと言える。ただし,このことには次の三つの問題が伴う。第1に,もともと,古文書,貴重書等は都道府県内各図書館,機関,あるいは個人に散逸する傾向があったが,インターネットでの情報源の多様化でこのことは助長され,都道府県立図書館が自前で行える網羅的収集,保存,提供はより困難になることである。第2に,文献以外の情報の収集,整理基準が未確立なことである。第3に,汎用的な情報提供方法が未確立なことである。電子図書館における一次情報の提供方法は,現段階ではHTML形式での一覧表示とページ間のリンク展開を行う単純な方式の枠を越えるものではない。一次情報の電子化点数が増加した場合,この方式の有効性は逓減するとともに,自己完結的で,電子図書館間を横断検索する汎用性はない。
今回の実践では,上記三つの問題に対し,第1に連携で,第2にメタデータの入力基準にDublin
Core Metadata Element Set (Dublin Core)を採用することで,第3にZ39.50に対応した検索環境を構築することで,それぞれ解決を試みている。
本稿は以下の内容から構成される。第1に,わが国の図書館の電子図書館システムへの取り組み状況と問題点を概観する。第2に,「デジタル岡山大百科」構想における郷土関係電子図書館ネットワークの概要について述べる。第3に,産学官民連携による組織体制について述べる。第4に,Z39.50とDublin
Coreを活用した技術基盤について述べる。第5に,課題と解決への指針について考察する。
2. わが国の図書館の電子図書館システムへの取り組み状況と問題点
ここでは利用者の視点に立ち,電子図書館システムに望まれる当面の目標は何であるかを簡単に考察し,それに対するわが国の図書館の電子図書館システムへの取り組みは適切であったかを検証する。さらに,取り組みが適切でなかった場合には,それは何に起因するか,問題点を考察する。
2.1 電子図書館システムに望まれる当面の目標
今日,わが国の図書館において,電子図書館と呼称するシステム,組織は数多いが,実現される機能の差は大きい。これは,電子図書館という言葉の意味が,狭義,広義さまざまで,技術の進歩やサービス範囲の拡大によって不断に変化していることによる。
こうした電子図書館システムの代表機能の一つに,一次情報提供機能がある。この機能に焦点を絞ると,今日のインターネットを前提とする社会環境で,電子図書館システムに望まれる当面の目標は,一般利用者にストレスなく,思い描く一次情報へ誘導する仕組みを整備することであると考えられる。さらに,この仕組みは,単独館レベルの自己完結的なものでなく,複数の電子図書館システムを横断検索する汎用性,情報共有機能を含む必要がある。
この目標を達成するために,電子図書館システムは,次の二つの条件を満たすことが必要となる。すなわち,第1に,メタデータ(二次情報)の検索から一次情報提供への展開の仕組みが用意されていること,第2に,各電子図書館のデータベース間を横断検索するため,データのやり取りの標準ルールに対応していることである。
横断検索方式は次の2方式に大別できる。第1に,検索ルールの異なる各サーバに,クライアントが個別対応ソフトで働きかけ,データをやり取りする方式(以下個別対応型と略す),第2に,各サーバとクライアントに検索プロトコルを実装し,データのやり取りの際に介在,制御する方式(以下検索プロトコル実装型と略す)である。後者の検索プロトコルのうちメタデータを対象としたものとして,Z39.50[1]や,最近ではOpen
Archives Initiative[2]によるものがある。
メタデータの横断検索は,個別対応型の概念である程度対応できるが,ルールや標準化のないままでの個別対応は煩雑で,限界も明らかである。したがって,各システムが自己完結的な独自仕様でなく,標準的な検索プロトコルを実装することによって,上記第2の条件が達成される。こうした点に着目し,今回の実践では,検索プロトコルとして国際標準規格のZ39.50を採用し,メタデータの仕様として標準に位置付けられつつあるDublin Core Metadata Element Set(略称:Dublin Core)を採用する。以下では,大学図書館,公共図書館におけるZ39.50と:Dublin Coreの採用状況を概観する。
2.2 大学図書館の取り組み状況
Z39.50ターゲットの構築は,大学図書館では最近珍しくなくなってきており,データベースの内容としては,OPACのほか,所蔵コレクション(貴重書)目録,記事(論文)索引,会議録索引,レファレンス事例集,および関連するインターネットリソースデータ等の多岐にわたる。
現時点で,Dublin Core仕様でZ39.50ターゲットを公開している館として,図書館情報大学(図書館情報学関連インターネットリソースデータ),大阪国際女子大学(OPAC,記事(論文)索引),岡山大学(所蔵コレクション(貴重書)目録)が挙げられる。なお,OPACを除き,メタデータの検索から一次情報提供への展開の仕組みを用意している。
一方,Dublin Core以外のデータ仕様でZ39.50ターゲットを公開している館として,秋田大学(OPAC),東北大学(所蔵コレクション(貴重書)目録),図書館情報大学(OPAC),東京工業大学(OPAC,記事(論文)索引,会議録索引,理工学関連インターネットリソースデータ),早稲田大学(OPAC),金沢工業大学(OPAC),京都産業大学(OPAC),大阪市立大学(所蔵コレクション(貴重書)目録),熊本大学(レファレンス事例集),鹿児島大学(所蔵コレクション(貴重書)目録),および国立情報学研究所(NACSIS-CATの教育用データ)が挙げられる。なお,いずれもメタデータの検索に止まり,一次情報提供への展開については,インターネットリソースデータを除いては確認できない(ただし,いくつかの館において,学内向けに外部有料データベースの一次情報提供が行われている)。
ところで,上記以外の大学図書館において,Z39.50ターゲットは構築されても非公開というケースが少なくない。これは,セキュリティの問題,検索サービスを公開するに堪えるほどコンテンツが充実していないことにもよると考えられるが,Z39.50ターゲットを社会共有の財産,つまり公共財ととらえると,一般公開することが望ましい。
2.3 公共図書館の取り組み状況
現時点で,メタデータの検索から一次情報提供への展開の仕組みを用意し,Dublin
Core仕様のZ39.50ターゲットを実験公開している館として,岡山県総合文化センター(岡山県立図書館;提供情報については3.3参照)が挙げられる。その他の館に,Z39.50ターゲットを公開している館は確認できない。
公共図書館では,主に都道府県立図書館が,文部科学省,総務省(旧自治,郵政省)等の補助金に依存しながら,あるいは単独予算で,電子図書館システムに取り組みつつある。ただし,システム内容としては,メタデータの検索機能なしに一次情報を提供する方式がほとんどである。一次情報の電子化点数が増加した場合,この方式の有効性は逓減するとともに,自己完結的で汎用性はない。この点については,地域電子図書館構想検討協力者会議『2005年の図書館像 地域電子図書館の実現に向けて(報告)』においても,電子図書館間の連携,メタデータ作成に係る標準化・規格化の推進が強調されている[3]。
『公立図書館の設置及び運営上の望ましい基準(平成13年7月18日)』の2(2)3において,市町村立図書館でも,「電子資料の作成、収集及び提供並びに外部情報の入手に関するサービス等に努めるものとする」と記載されているが,事例の確認はほとんどできない。市町村立図書館においては,今後も電子図書館担当や予算がつく事が困難なこと,さらに2.1
の電子図書館が目指す当面の目標を実現することは単独館レベルでは困難なことを考えると,都道府県立図書館が中心となって都道府県域レベルで電子図書館ネットワークの仕組み,環境を構築することが望ましい。
一方,国立国会図書館では,『国立国会図書館電子図書館構想』において,電子資料の網羅的収集,作成,提供に関する考え方が述べられている[4]。ただし,現状ではZ39.50ターゲットの構築は行われていない。
2.4 個別の図書館レベルの問題
以上の電子図書館システムへの取り組み状況の概観より,個別の図書館レベルの問題が明らかになってきた。すなわち,電子図書館における一次情報の提供については,現段階では,HTML形式での一覧表示とページ間のリンク展開,すなわち,メタデータの検索機能なしに一次情報を提供する単純な方式の枠を越えるものではない。メタデータ検索から一次情報提供へと展開する本来あるべき姿になっていない原因は,第1に,ともかくホームページを充実させたい,という短期的視点に立ったコンテンツ作りの姿勢に起因している。第2に,検索サービスを公開するに堪えるほど,一次情報のコンテンツが量的に充実していないことにもよる。ただし,たとえこうした枠を越えたとしても,電子図書館間の相互利用に対する意識が欠如しているため,電子図書館間の横断検索という汎用利用,高度利用,二次利用が円滑に行えないでいる。つまり,図書館間における情報共有が進展しない背景には,技術的側面における汎用性意識の欠如がある。
2.5 標準化レベルの問題
もっとも,電子図書館システムの問題を,個別の図書館レベルにのみ求めることは必ずしも適切ではない。むしろ,個別の図書館レベルで,2.4に挙げた問題を克服できない原因は,現段階ではより上位の標準化レベルに不透明部分があるためと考える方が適切である。具体的には,Z39.50の国内普及のための問題,つまりわが国固有の問題が解消されていないため,本来は個別の図書館レベルで汎用性を備えたシステムを導入したいが,今は時期尚早という様子見意識に支配されていると考えられる。ここで,Z39.50の国内普及のための問題4点を挙げておく[5]。
第1に,Z39.50の仕様には文字コードに関する記載がないため,2バイトコードを使用するわが国では標準文字コードを何にするかが問題となるが,公式決定されていない。ただし,現時点での国内における一般的な選択は,ほとんどのZ39.50ターゲット公開館で提供されているEUCである。なお,早稲田大学ではEACC,国立情報学研究所ではEUCのほかにJISとUnicode(UTF-8)が提供されている。
第2に,各サーバ内部で保持されるデータは,検索時にZ39.50の代表的attribute setで書誌情報検索のために作成されたBib-1の項目(Use Attributes)にマッピングされるが,マッピングの規則が公式決定されていない。たとえば日本語書誌データ特有のふりがな項目は,USMARCフォーマット準拠のBib-1に直接対応する項目がないため,一般的な解決方法として,対応する漢字項目と共に同一フィールドに併記して,ふりがな検索を可能にしている。今後,国際標準との整合性のある拡張基準を決めていく必要がある。Dublin Coreについても同様である。Bib-1のUse Attributesに拡張提供されているDublin Core用の項目(1097〜1111)へマッピングするか,通常のBib-1で使用されるTitle(4)やAuthor(1003)の項目へマッピングするか,二重に行うかということが問題になる[6]。現時点では,Dublin Coreを知らない利用者あるいは,拡張の項目を指定できないクライアントを使う利用者等のために,二重に行うことが一般的な解決方法である。なお,後者のDublin Coreの問題は,わが国固有の問題でなく,一般問題である。
第3に,上記問題の検討や標準化推進のための機関が国内に存在しない。
第4に,Z39.50サーバを対象とした横断検索システム(クライアント機能)の開発経費が高価である。2000年末時点の総合目録ネットワークを例に挙げると,Z39.50サーバを対象とした横断検索システムの一般的な新規開発経費は,SE10〜30人月であった[7]。一方,個別対応型は,SE2.8人月(岐阜の公共図書館都道府県域総合目録ネットワークの場合)[8]であった。ただし,現時点では前者のシステムは製品化されて費用は逓減している。たとえば当実証実験で活用するInfoLib-Global
Finderは,クライアント機能のほかにサーバ機能をも内包して,5人月(定価ベース)程度である[9]。
このうち,特に第3の標準化推進機関が国内に存在しないことが現在の最大の問題と考えられる。ほかに,返戻データの二次利用(ダウンロード)について,著作権問題の検討を要する等の拡張機能の問題も抱えるが,長期的視点に立つと,以下の2点からZ39.50はなお有望視される。
第1に,ネットワークの世界でポイントとなる国際標準規格である点による。
第2に,拡張機能に富み,図書館ネットワーク全般の基盤となる規格である点による。
さらに,問題点の中で述べたように,一般的な解決方法はかなり進んでおり,国内での実用化の目途は立ってきている。それを示し,消極的な様子見意識を払拭する先導役を誰かが果さなければならないのではないか。我々の構想の原点には,こうした動機も含まれている。
3. 「デジタル岡山大百科」構想における郷土関係電子図書館ネットワークの概要
ここではまず,「デジタル岡山大百科」構想の経緯について簡単に触れ,このうち,上記考察を踏まえて取り組む郷土関係電子図書館ネットワークの概要とコンセプトについてより詳しく述べる。
3.1 「デジタル岡山大百科」構想の経緯
「デジタル岡山大百科」構想は,岡山県の事業として1996年度より着手された県域高速通信網の「岡山情報ハイウェイ[図1]」上での充実したコンテンツ配信を目指して考案されたものである。岡山県総合文化センターが中心となり,県内市町村立図書館と連携しながら,公共図書館都道府県域総合目録ネットワークと郷土関係一次情報提供システムの両機能の構築を目指した。
図1.「岡山情報ハイウェイ」概念図
このうち,公共図書館都道府県域総合目録ネットワークについては,インター
ネット上に分散した複数館のサーバを横断検索するサーバ管理方式,すなわち
分散型で,1999年11月から稼働した[図2]。検索プロトコルの実装により,各
館サーバとクライアントとの間で,やり取りされるデータ構造は標準化されてい
る。ただし,検索プロトコルはXML形式によるものの,Z39.50でなくNEC作成の独
自規格で,Z39.50との互換性はない。Z39.50を採用しなかったのは,当時主要ベ
ンダーが対応技術を持っていなかったためである。現在のデータ提供館,すなわ
ちサーバ公開館は,県立,7市町立(岡山市立,倉敷市立,津山市立,早島町立,
山陽町立,里庄町立,奈義町立)である。各館は,それぞれのサーバで,目録
データ提供以外に,予約等,独自のサービス提供を検討中である。情報のやり取
りのみでなく,資料搬送についても,岡山県公立図書館ネットワーク推進協議会
等における各館とのコミュニケーションを通して,資料搬送網の充実を図ろうと
している。郷土関係一次情報提供システムと比較して,公共図書館都道府県域総
合目録ネットワーク事業が先行した理由は以下の3点による。第1に,図書館協力
の中の相互貸借を支える中核要素という性格,あるいは実用性の高さから,構築
が優先的に進められてきたことによる。第2に,コンテンツとしての目録データ
は,購入あるいは日常業務で不断に追加,更新され,コンテンツ作成のための特
別な配慮が不要なことによる。第3に,岡山県総合文化センターが主要ベンダー
に,県内公共図書館の図書館パッケージへ総合目録ネットワーク参加のための技
術条件を包含するよう依頼し,参加を促進する環境を整備していることによる。
一方,1996年度当初に構想された郷土関係一次情報提供システムは,次の三つの柱から成り,1998年2月に公開された。第1に,新旧地図を使い,行政区域,交通等の変遷する様子を案内する「地図でみる岡山のうつりかわり」。第2に,岡山県と関係のある人物の説明を通して,岡山の一面を浮き彫りにする「岡山人物往来」。第3に,これまで紙で配布されてきた岡山県総合文化センターニュースの電子配布である。このうち,第1,第2の柱は,メタデータの検索機能なしに一次情報を提供する方式に止まる。第3の柱はPDFファイルの配布で,今日では一般的に行われているものである。郷土関係一次情報提供システムはその仕組みも然ることながら,コンテンツの内容的広がりと量的充実が不足していた。内容的広がりの不足理由としては,日常業務の延長線上にないアイデアや知識を要するため,量的充実の不足理由としては,一次情報の作成が目録データのように容易ではないためによる。
以上のように,「デジタル岡山大百科」の両機能うち,公共図書館都道府県域総合目録ネットワークの機能については既に一定の水準に達している。一方,郷土関係一次情報提供システムについては,第2章で述べたような問題を抱えてたままであり,解決を要していた。以下では,「デジタル岡山大百科」の機能のうち主に,郷土関係一次情報提供システムに汎用性を備えた郷土関係電子図書館ネットワークの実証実験について考察する。
3.2 郷土関係電子図書館ネットワークのコンセプト
1996年度当初の「デジタル岡山大百科」全体を貫くコンセプトは,当該サイトにアクセスすれば,複数の外部サイトと結びついて,岡山県のことを百科事典的に知ることができるというものであった。すなわち,岡山情報ハイウェイ上に,地域の歴史,風土,人物等の情報を,二次情報のみならず一次情報も含めて提供し,県民がパソコンでインターネットに接続すれば,地域の姿を百科事典的に見られるように,また調査研究できるようにしていくことを目標とした。
このコンセプトは,今日も何ら色褪せるものではない。当初からの分散指向,つまりインターネット上に分散した各サーバを横断検索するという姿勢は変わらない。このコンセプトを郷土関係電子図書館ネットワークにで具現化する,汎用性を備えた技術基盤がZ39.50である。今回連携する岡山大学附属図書館がOPACをZ39.50ターゲットで構築することが既に決定していること,および今後,異館種やその他の機関との多様な連携を考慮し,公共図書館都道府県域総合目録ネットワークで採用している独自規格の検索プロトコルよりも,相互利用性,汎用性に優れたZ39.50を採用する。
現在では,こうした地域への情報提供機能に加え,地域からの情報発信要求を受け入れる機能を併せ持つことも期待される[10]。つまり,インターネットを通じて,県民もデータ提供できる県民参加型の仕組みを郷土関係電子図書館ネットワークの中に構築することを目指す。県民にとっては参加の充実感と学習成果発表の機会が得られる一方,図書館にとってはコンテンツの充実が期待できる。すなわち,郷土関係情報を基点とした県民参加のコラボレーション(協働)環境の構築と,ネットワークの双方向通信による情報循環環境を目指す。この考え方を具体化し,専門家でなくともデータ提供に容易に参加できるよう,メタデータの仕様として,MARCフォーマットのように項目が多岐にわたらず15項目に限定されたDublin
Coreを採用する。
また,2.3で述べたように,本来なら各市町村立図書館も地域での電子図書館構想を実現していくべきであるが,現段階では人的,財政的に困難であるため,当面は専用サーバを保持していなくても参加できる受入環境を用意する。
3.3 郷土関係電子図書館ネットワークの提供情報
郷土関係電子図書館ネットワークの提供情報としては,所蔵コレクション(絵図,古文書,児童文庫)目録,他機関所蔵コレクション(絵図,古文書),新聞(地元紙)記事索引,雑誌(郷土雑誌)記事索引,郷土映像VTR,県民提供データ等を予定している。このほか,郷土関係情報という範疇から外れるが,レファレンス事例集,重点収集資料(交通文化資料)目次等も含めて提供する。このうち,新聞記事索引,レファレンス事例集を除き,一次情報提供への展開の仕組みを用意する。現時点では,所蔵コレクションのうちの絵図を一般提供している。
4. 産学官民連携による組織体制
前章で述べたコンセプト実現と問題解決のための全般的な基盤となるものが組織体制である。自己完結的でなく,分散指向および横断検索の仕組みを,形式だけでなく内容的にも充実したものとするためには,組織間の有機的連携が必要不可欠である。ここでは,産学官民の各主体が,人材,コンテンツ,技術,ノウハウ,機材等の各種資産をそれぞれ持ち寄り,共通目的の郷土関係電子図書館ネットワーク構築の実証実験に臨む産学官民連携の組織体制について述べる。
4.1 産学官連携による組織体制と研究の方向
産学官民連携のうち,連携の中核を構成するのが産学官の組織,機関である。具体的には,官(岡山県総合文化センター),学(岡山大学附属図書館),産(インフォコム株式会社)が,各種資産と組織別の研究目的を持って連携し,共同研究プロジェクトの郷土関係電子図書館ネットワーク構築の実証実験に臨んだ[図2]。
図2.産学官連携の組織体制
組織別研究目的は以下に挙げる通りである。
(1) [官]岡山県総合文化センター
研究目的:デジタル岡山大百科の構築仕様策定
岡山県総合文化センターでは,2004年度の新館開館に向け,これまで述べてきた「デジタル岡山大百科」構想のうち,郷土関係電子図書館ネットワークの構築を進める。今回の共同研究の実施により,その成果を構想実現にむけた仕様策定へと反映することを目的とする。
(2) [学]岡山大学附属図書館
研究目的:池田家文庫絵図類総覧の構築仕様策定
岡山大学附属図書館では,平成8年度から平成11年度において,図書館所蔵の池田家文庫に含まれる絵図史料の電子化と「池田家文庫絵図類総覧」の公開を行ってきた。しかしながら,池田家文庫の膨大な全絵図を全て電子化するまでには至っていない。また,ここ数年間におけて高精細画像を作成・閲覧する技術は,急速な進歩を見せた結果,画像の再作成の必要性が生じている。日本の近世歴史研究を推し進めるためにも,高機能な情報利用環境や高精細画像を備えた「池田家文庫絵図類総覧」へと改善する。今回の共同研究の実施により,その成果を構想実現に向けた仕様策定へと反映することを目的とする。
(3)[産]インフォコム株式会社
研究目的:次世代統合検索システムの構築仕様策定
インフォコム株式会社では,1995年より汎用的な電子図書館パッケージを構築してきた。以来,市場ニーズに併せて改修を行い,現在,検索プロトコルとして国際標準のZ39.50,メタデータの仕様としてDublin
Coreを採用し,統合検索パッケージへと機能拡張を進めている。技術革新とともに,膨大なデジタルアーカイブの現出とその情報活用方法が問われる現在,それらパッケージ技術をさらに昇華できる新パッケージ機能仕様を模索している。今回の共同研究の実施により,その成果を構想実現に向けた仕様策定へ反映することを目的とする。
さらに,重なり合う共通の研究課題として以下のことが挙げられる。
(1) 汎用メタデータとしてのDublin Coreの採用実験
[官]岡山県総合文化センター,県内市町村立図書館,県内機関,団体,個人等が収集,作成する郷土関係マルチメディア情報(資料本文,記事本文,画像,音声,動画,ホームページ等)のメタデータをDublin
Core仕様で作成する。
[学]岡山大学附属図書館所有の池田家文庫絵図目録のメタデータをDublin Core仕様で作成する。
(2) 国際標準検索プロトコルZ39.50の採用実験
[官]岡山県総合文化センター,県内市町村立図書館,県内機関,団体,個人等が収集,作成する郷土関係マルチメディア情報(資料本文,記事本文,画像,音声,動画,ホームページ等)をZ39.50準拠システムにより公開発信する。
[学]岡山大学附属図書館所有の池田家文庫絵図目録をZ39.50準拠システムにより公開発信する。
(3) 高度情報利用環境の模索と実験
[産学官]HTTP(Web)検索システムを同時公開発信する。
[産学官]GIS(地理情報システム)と上記HTTP検索システムとの連携実験を行う。
[産学官]広範囲情報利用者環境の模索,すなわち,モバイルネットワークへの応用,音声認識技術の応用,蓄積情報の教育用資料としての活用(Web
Base Training)を行う。
4.2 充実した独自コンテンツ作成のための産学官民の有機的連携
各図書館が自前で,質的,量的に充実したコンテンツを継続作成していくことは非常に困難である。単なる目録情報の蓄積とOPAC公開であれば,極論すればMARCとパッケージを購入するということで解決する。そこには,重複の回避や,各館が知恵を出し合い同じ方向に向かって協働するという必要性は発生しない。しかし,一次情報の提供も含む電子図書館は,膨大な費用,手間,さらには他にはないユニークなコンテンツを創造するための知識が要求されるため,こうした意識の延長線上にいることは許されない。もしも,各館が自己完結的姿勢を貫き,有機的連携を欠いたままで進むと,早晩閉塞状態に陥ってしまう。質的,量的に充実したコンテンツを蓄積する電子図書館を構築するには,模倣や転用可能な汎用技術も然ることながら,同じテーマや目標を持った組織が,独自の知識創造という同一目標を目指して,有機的連携と組織化を図る必要がある。さらに,インターネットへの情報発信が個人でも一般的となった今日,組織だけの連携では効果は薄い。つまり,産学官の連携に加え,民(県民)も参加することのできる受け口を作るものとする。技術的にはWebからも県民がデータ登録できる仕組みを構築する。
産学官民のうち,中核となる産学官は以下のような民(県民)との協力体制の取りまとめをしていくことを目指す。
(1) [官]岡山県総合文化センター
県立および県内市町村立図書館利用者の中から依頼した特派員,郷土史研究者,民話の会等,より地域に密着した人的協力体制の確立を目指す。
(2) [学]岡山大学附属図書館
学内研究者(教職員,学生),学外研究者等,より専門的な背景での人的協力体制の確立を目指す。
(3)[産]インフォコム株式会社
社内資源はもとより,システム,コンテンツを得意とする企業間での人的協力体制の確立を目指す。
5. Z39.50とDublin Coreを活用した技術基盤
ここでは,Z39.50とDublin Coreを活用した技術基盤について,具体的なハードウェア環境,ソフトウェア環境,サービス環境の各環境を紹介する。
5.1 ハードウェア環境
ネットワーク環境として,岡山県総合文化センターと岡山大学附属図書館のサーバを利用者が横断検索できる環境を提供するものとする。このうち,岡山県総合文化センターのサーバについては,当面インフォコムポータルサイトのサーバを活用するものとする.[図3]。
図3.ネットワーク環境
サーバのマシンスペックは以下の通りである。
(1)岡山県総合文化センター(インフォコムポータルサイト)
Sun Ultra 5
(400MHz UltraSPARC processor module)
CPU 1CPU
MEM 512MB
DISK 18.2GB
(2)岡山大学附属図書館
Fujitsu S-7/300U model 200E
(UltraSPARC200MHz SPECint95 7.44/SPECfp95 10.4)
CPU 1CPU
MEM 256MB
DISK 20.3GB
5.2 ソフトウェア環境
実証実験のソフトウェア環境を構成する個々のアプリケーションについて以下に簡単に説明する。
(1)WWWサーバ
インフォコムでのこれまでの実績からApacheを使用することとする。
(2) OpenText
OPENTEXT社の全文検索エンジンである。
(3) InfoLib-META
インフォコム製の電子図書館パッケージで,Dublin
Coreを基軸に設計されたメタデータ検索システムである。検索エンジンとしてOpenTextを使用しており,Web(HTTP)に対応する。
(4) InfoLib-Global Finder
インフォコム製のZ39.50パッケージである。Z39.50サーバ機能,Web(HTTP)からZ39.50へのゲートウェイ機能,Z39.50から複数のZ39.50サーバに対するゲートウェイ機能が含まれる。
Global Finderの内部機能の概要を以下に挙げる。
(4-1) Z39.50 to HTTP Gateway (HTTP to Z39.50
Gateway)
利用者がWebブラウザを使用してZ39.50サーバの検索を行うことができる機能である。Web(HTTP)からZ39.50へのプロトコル変換を行う。
(4-2) Z39.50 Target
Z39.50サーバである。検索エンジンとしてOpenTextを使用する。
(4-3) Z39.50 to Z39.50 Gateway
Z39.50サーバとして起動し,他のZ39.50サーバの横断検索を実現する機能である。複数のZ39.50サーバをあたかも一つのZ39.50サーバとして扱う事ができる。
以上のソフトウェア環境としてのシステム構成概念図を図4に挙げる。
図4.システム構成概念図
このほか,メタデータ作成支援ツールには,InfoLib-EDITがあり,Oracleを要する。図5はその画面であり,メタデータの入力のほか,一次情報の登録機能もある。Web(HTTP)に対応しており,遠隔地から県民がデータ登録する主要ツールとなる。実際の県民参加については,県立および市町村立図書館利用者の中から,特派員として依頼する形をとる。簡単な研修を行い,ID,パスワードを交付する。なお,サーバ公開は現在,岡山県総合文化センターと岡山大学附属図書館のみであるため,県民や市町村立図書館からのデータ入力については当面,岡山県総合文化センターのサーバ,すなわちインフォコムポータルサイトのサーバに対して行う。
図5.InfoLib-EDITのメタデータ入力,一次情報登録画面
以上の中核システムを支援し,一次情報の円滑な提供を行うため,Gigaview等の高精彩画像閲覧用ソフトとの連携も視野に入れている。今回提供する一次情報には,原画全体が数十メートル四方,その一方で書き込まれている文字が数ミリという複雑な性格を持つ絵図類が数多く含まれている。原画全体は分割された複数ファイルから構成され,高速で部分と全体を拡大,縮小できる高精彩画像閲覧用ソフトの利用が欠かせない。一方,絵図,古文書等に記述されているくずし字を読める利用者が少ないことを考慮し,Gigaviewの文字情報関連付け機能を活用し,解読した文字の関連付けを予定している。この解読した文字の関連付けについては,そのためだけに行うというよりは,後述する絵図,古文書等の人権問題に対応することに着目し,その副産物として作成するという意味合いが強い。したがって,文字を逐次付加するか,解題程度に留めるかについては,組織体制,作業量,手間等を考慮しながら検討していく。
5.3 サービス環境
(1)現在のサービス環境
以下のURLで,横断検索環境を2001年10月より実験公開中である[図6]。
http://www.dl-okayama.net/
図6-1.検索条件入力画面
図6-2.データベース別検索結果画面
図6-3.検索結果一覧画面(デジタル岡山大百科)
図6-4.詳細表示画面(デジタル岡山大百科)
図6-5.一次情報表示画面(デジタル岡山大百科)
(2)モバイル向けサービスとGIS連動サービスの模索
現在の本システムのサービス環境は,パソコンユーザーのみにほぼ限定したものである。パソコン以外の代表的な情報機器は携帯電話であるが,現時点では,画面が狭い,通信速度が遅い,記憶容量が小さい等の不足感は否めず,電子図書館が対象とする一次情報のほとんどは提供不能である。しかしながら,パソコンを所持しない携帯電話利用者の増大,携帯電話,PDA(携帯情報端末)をはじめとしたモバイルの普及状況,携帯電話のデータ通信機能がパソコンに接近しつつある状況を考慮に入れると,パソコンユーザーのみを想定した情報提供サービスは不十分であると言わざるを得ない。今後の広範囲,利便性の高い情報提供環境を目指すのであれば,当然ながらモバイルを視野に入れる必要がある。また,情報通信技術の急速な進展は,上記の不足感も早晩解決されるであろう。
具体的サービスとしては,施設情報,史跡情報,歴史人物情報とGIS(Geographic
Information System;地理情報システム)との連動の可能性を探っていきたい。地域の歴史探訪や名所巡り等の際に,Dublin
Coreの時間・空間特性の項目や,日付,主題等の項目間で論理演算し,さらに複数サーバを横断検索するというDublin
CoreとZ39.50のメリットを引き出すことが考えられる。
6. 課題と解決への指針
6.1 一次情報の公開に際しての人権問題への対応
電子化する絵図,古文書等については,同和問題等の人権問題への対応が必要である。本文に差別用語が含まれることはもちろん,古地図等の地名に問題を有していることがあるので,一次情報の公開には細心の注意を払う必要がある。基準として次のことが考えられる。地名と身分が一緒になっている等,差別の根拠となる事項がある資料は公開しない。同和用語と地誌,人名に関する記述により,地域等の特定ができるかどうかを判断する。ただし,歴史的な身分制度として表現されている場合は公開する。今回,判断のための資料の解読等については,岡山大学の学内研究者(教職員,学生),学外研究者,郷土史研究者等の協力を得るとともに,岡山大学附属図書館,岡山県総合文化センターの協議に基づいて判断を行うこととした。知識,手間ともに図書館職員の内部努力だけでは限界があり,内外の関係者との組織的連携はここでも欠かせない。
6.2 実用データ提供に向けての仕組み作り
伝統的な図書館業務の枠組みから考えると,電子図書館において収集,作成,
提供する一次情報の範囲は,著作権に抵触しない所蔵印刷物を電子化したもの
という考え方がなじみやすい。ただし,この考え方に基づくと,対象の多くは歴
史的資料となる。確かに文化的価値は高いが,愛好者以外の一般利用者にとって
はあまり興味が起きないものであろう。また,情報の鮮度も低い。もし,電子図
書館に不特定多数の関心を向かせようと考えるなら,実用データを取り込む,あ
るいはそれに導くことが欠かせない。『国立国会図書館電子図書館構想』による
と,国立国会図書館で収集する電子情報としては,電子出版物,印刷物を電子化
したものとともに,インターネット上で提供される情報資源が挙げられている。
その提供にあたっては,財政的課題,外部機関との連携,出版者との協議,著作
権や課金システム等の制度的課題の整備状況等を勘案しながら行うとしている[11]。
従来の対象範囲に較べると広範囲であるが,著作権や課金等の関係から電
子図書館で提供できるものはごく限られてくる。このうち,インターネット上の
情報資源は実用性が高いとともに,既に一次情報の形態で提供済みという特色が
あり,図書館が取り組みべきことは,了解を得た上でのメタデータの作成,ある
いは作成依頼,一次情報に導く仕組みの構築である。このうち,了解が得やすく,
実用性の高い情報として行政情報が挙げられる。現状ではHTML形式での公開に
止まり,検索できる仕組みを作っている場合は少ない。公開されたものについて
メタデータを作成すれば,行政情報の透明化,共有化につながる。ただし,行政
情報のうち,個人情報等については当然非公開とすべきであるから,こうした非
公開情報も含め,公開,非公開の仕組みを作った上で,メタデータの検索から一
次情報提供への展開の仕組みを作ることは,行政組織内部の情報共有にとって意
義深い。図書館が仕組みを作った上で,メタデータの作成は行政組織の各部署に
任せるという,いわば官官連携が望まれる。Z39.50とDublin
Coreを活用して,地域レベル,全国レベルでこうした仕組みを作り,ネットワークセンター機能を果すことこそ,今日の図書館の使命であると考えられる。
6.3 過渡期における技術的課題
最近,Z39.50サーバの公開は進展してきているが,Z39.50に準拠していない
サーバはまだ圧倒的に多い。図書館以外の機関はなおさらその傾向が強く,それ
ぞれのデータベースフォーマットに固執する傾向がある。郷土関係情報の網羅提
供を目指して横断検索環境を構築する場合,このような過渡期にどのように対応
すべきであろうか。Z39.50ターゲット以外のデータベースを横断検索対象に加え
ることは,そもそも標準化と矛盾するため問題点が多いが,二つの選択肢がある。
第1の選択肢は,検索ルールやデータベースフォーマットの異なる各サーバに,
個別対応ソフトで働きかけ,データのやり取りをする方式で,わが国の総合目
録ネットワークに多く見られるものである。ただし,二つのデメリットがある。
一つは,サーバ毎に個別対応したプログラム作成の必要があり,サーバの新規追
加,変更に対してもSEによる個別対応,逐次修正が必要となる点である。もう一
つは,サーバ毎の検索ルールや検索項目の有無を統一しない状態で横断検索する
ので,検索条件と結果間のゆれが大きく,検索漏れが起こる点である。第2の選
択肢は,データ抽出ソフト(コンバータ)を作成し,自館のサーバに定期的に取
り込む方式である。コンバート項目のマッピングを検討した上で行うという点で
厳密である。デメリットとして,そっくり取りこむという点でデータベースの著
作権問題が発生する。すなわち,データ仕様の開示を前提とするとともに,デー
タを取り込むことに対する抵抗感がある。
なお,対象がデータベースサーバでなくHTMLであれば,自動巡回ロボットでデータ収集し,メタデータを作成する方法がある。ただし,全自動という訳にはいかず,人手を要する半自動となる傾向がある。図書館情報大学,東京工業大学の両附属図書館でこの方法が採用されている。
さらに,国内で日本語に対応したZ39.50を普及させるためには,Z39.50サーバ指定をパラメータで簡単にできるクライアントソフトを開発する必要がある。欧米ではZ39.50に対応するフリーソフトが数多く作成され,一般ユーザもクライアント用ソフトでサーバを指定して,自分用の検索環境を設定できるほど環境が整っている。
7. おわりに
今回の構想は,技術基盤に39.50とDublin Coreを採用し,インターネット,情報提供に岡山情報ハイウェイ,インターネット等が介在するという点で,物理的なネットワークの存在に目が奪われがちである。しかしながら物理基盤の整備が落ち着く今後は,それらを活用して付加価値を生む側面に目を移し,継続的なコンテンツ作成の仕組み,効果的な情報提供の仕組みをいかに構築していくかを新しい課題とする必要がある。その解決のためには,組織や個人の有機的連携,人的ネットワーク,組織化は欠かせず,情報共有,学習,知識創造というプロセス重視の姿勢が重要である。有機的連携,人的ネットワーク,組織化は本構想のかぎであり,今後もさまざまな継続的努力が欠かせない。
参考文献
[1]http://lcweb.loc.gov/z3950/agency/
[2]http://www.openarchives.org/OAI/openarchivesprotocol.html
[3]地域電子図書館構想検討協力者会議『2005年の図書館像 地域電子図書館の実現に向けて(報告)』地域電子図書館構想検討協力者会議,2000,p.36-37. http://www.mext.go.jp/b_menu/shingi/chousa/shougai/005/toushin/001260.htm
[4]国立国会図書館『国立国会図書館電子図書館構想』国立国会図書館,1998,20p.
[5]森山光良「分散型総合目録ネットワークの分類と評価―図書館ネットワークの発展段階と標準化過程におけるZ39.50の位置付け―」『図書館雑誌』Vol.95.No.8,2001.8,p.557.
[6]Bib-1 Attribute Set; http://lcweb.loc.gov/z3950/agency/defns/bib1.html
[7]尾城孝一「横断検索と公共図書館 平成12年度第1回図書館システム・ネットワーク研修会」2000.11.http://home.catv.ne.jp/rr/ojiro/saitama/index.htm
[8]土本潤「分散型総合目録とその発展の可能性について」『情報の科学と技術』Vol.50,No.10,2000.10,p.508.
[9]http://www.infocom.co.jp/cone_new_jp/t_shouhin/download/InfoLib_cat.pdf
[10][前掲3],p.4.
[11][前掲4],p.6.