これまでミシガン大学のSchool of Information や図書館と本学との間で共同研究を行なって きたことから、今年度より本学附属図書館においてIPLのミラーサイトを始めた[2]。このよう な背景から、学内特別研究推進経費の補助を得てインターネット上の公共図書館に関する研究を 行なっている。そのような研究に関連して、アジアにおけるインターネット上の情報資源を対象 としたInternet Public Library(IPL‐Asia)を構築することになった。
IPLの機能は、様々な情報資源へのゲートウェイ機能と参考サービスの2つに大別できる。IPL ‐Asiaでは、まずアジアの情報資源を対象としたゲートウェイ機能の構築から始める。本ゲー トウェイは、ミシガン大学IPLと同様に、幼児向、ヤングアダルト向、教育、図書館などに関 する情報資源に関するメタデータを作成・分類し、利用者に提供する。ミシガン大学IPLのメ タデータは英語のみで作成されているが、アジアの情報資源を対象とした場合、情報資源を記述 している言語は、日本語、中国語、韓国語、タイ語など様々である。そこで、IPL‐Asiaでは、 利用者により多くの情報資源を提供するための試みとして、一つの情報資源に対して様々な言語 でメタデータ作成する。
本稿では、IPL‐Asiaにおけるメタデータの作成方法とメタデータ記述規則、そしてIPL‐Asia を構成するためのツールについて述べる。
1) 情報資源の収集を行なう。
2) まず、情報資源の記述に用いられている言語を母国語とする人がメタデータを作成し、 データベースに登録する。
3) データベースに蓄積されているメタデータに対して、複数のメタデータ作成者が共同で 当該情報資源を記述している言語以外の言語でメタデータを作成してデータベースに登 録する。
例えば、韓国語で記述された情報資源の場合、まず韓国語を母国語とする人が情報資源を探し、 韓国語でメタデータを作成しデータベースに登録する。その後日本語のメタデータ作成者はデー タベースを調べ、日本語でメタデータを作成して蓄積する。中国語の場合のメタデータ作成も同 様に行なう(図1参照)。
図1 メタデータ作成方法
Main-Title:Titleのサブエレメント。リソースの主たる名前。省略可。
Sub-Title:Titleのサブエレメント。副題を記述する。省略可。
Creator:リソースの内容に関して責任を持つ人または組織。この要素は1回しか使えない。必 須。
Author:Creatorのサブエレメント。一人のCreatorを複数の言語を用いて記述する場合のグ ルーピングに用いる。
Publisher:リソースを現在の形態にしたことに責任を持つ団体。出版社や大学など。省略可。
Identifier:リソースを一意に識別するための番号あるいは名前。URLや雑誌名など。この要素 は1回しか使えない。必須。
Description:リソースの内容に関する記述。抄録やイメージデータの説明など。この要素は1 回しか使えない。必須。
Type:リソースのカテゴリ。ウェブページ、小説、詩、テクニカルレポートなど。この要素は 1回しか使えない。必須。
Format:リソースのデータフォーマット。この要素は1回しか使えない。必須。
Language:リソースの内容を記述している言語。この要素は1回しか使えない。必須。
Subject:リソースのトピック。必須。
Code:Subjectのサブエレメント。SubjectをUDCで記述する場合に用いる。省略可。
Keyword:Subjectのサブエレメント。一つのSubjectを複数の言語を用いて記述する場合のグ ルーピングに用いる。省略可。
Date:リソースが作成された、あるいは利用可能になった日付。この要素は1回しか使えない。 必須。
Audience:リソースの対象。この要素は1回しか使えない。必須。
Agerange:Audienceのサブエレメント。リソースの対象年齢の範囲を書く場合に用いる。省略 可。
Coverage:リソースの時間的・空間的な対象範囲。省略可。
Right:リソースの著作権などに関する記述や利用条件。省略可。
Cost:Rightのサブエレメント。リソースを利用する際の料金に関する記述。省略可。
Restrict:Rightのサブエレメント。リソースの利用条件を記述。省略可。
Relation:他のリソースとの関連付け。省略可。
Source:リソースの出所となった情報資源を一意に示す番号または文字列。
Contributor:著者ではないがリソースの作成に関わった人または組織。省略可。
Editor:Contributorのサブエレメント。編集者を記述。省略可。
Translator:Contributorのサブエレメント。翻訳者を記述。省略可。
Illustrator:Contributorのサブエレメント。イラストレータを記述。省略可。
Metametadata:当該リソースのメタデータに対するメタデータ。メタデータの作成者、作成日 などを記述する。この要素は1回しか使えない。必須。
IPL‐Asiaでは、上に挙げたそれぞれの要素に対して日本語、中国語、韓国語でメタデータ を作成する。メタデータの記述形式は、多言語に対応していることや、メタデータを様々な形式 に変換して利用するためのツールが整っていることから、Unicodeを用いてXML形式で記述し 蓄積する(図2)。IPL‐Asiaのメタデータでは、複数の言語での記述が同じメタデータの要素 を指し示していることを表す必要がある。そのため、図2に示したように、一つの要素の中で langstringサブエレメントを用いてグループ化し、xml:lang属性で言語を明示して複数の 言語を並べて記述する。
図2 メタデータのサンプル
(1) メタデータブラウザ
利用者がWebブラウザを介して情報資源のメタデータをカテゴリ別ごとに閲覧するため
のプログラム(サブジェクトゲートウェイ)。多言語による表示にも対応する。
(2) メタデータ検索
利用者がIPL‐Asiaに登録されているメタデータを検索するためのツール。
(3) メタデータデータベース
情報資源のメタデータを蓄積し管理するためのDBMS。既存のリレーショナルDBの利
用やXML文書の構造をそのまま格納できるデータベースの利用なども検討したが、多言
語への対応や開発プラットフォームの問題から、現在はJavaとサーブレットを用いて作
成したプログラムを利用してXML形式で記述したメタデータを蓄積し管理している。
(4) メタデータエディタ
複数のメタデータ作成者の協調作業を支援することができるメタデータエディタ。遠隔地
からメタデータの作成を行なうことも考慮し、Webブラウザをインタフェースに用いる。
(5) カテゴリ分類支援ツール
一つのカテゴリに分類されているメタデータ数が多くなった場合に、カテゴリ分けの支援
をするためのツール。
これらツールでは、メタデータをXML形式で記述していることから、XSLTスタイルシート 利用してメタデータの閲覧画面やメタデータ作成画面の生成をおこなっている。
[2] IPL のミラーサイト. http://ipl.ulis.ac.jp/
[3] Dublin Core Metadata Initiative. http://dublincore.org/
[4] IMS Meta-data Working Group. http://www.imsproject.org/metadatateam.html
[5] About BUBL 5:15. http://link.bubl.ac.uk/about515.htm