メタデータスキーマの再利用を指向したスキーマ設計支援システム

庄山 和男†,永森 光晴‡,杉本 重雄‡
†筑波大学図書館情報専門学群,‡筑波大学図書館情報メディア研究科

概要

 本研究では、既存のメタデータスキーマを基礎にして、メタデータスキーマの作成を支 援するシステムの開発に取り組んだ。本研究で開発したシステムは、Dublin Coreのアプリ ケーションプロファイルの概念を基礎として、応用目的にあった新しいスキーマを、既存 スキーマから作るプロセスを支援する。本システムは、目的のスキーマに再利用可能な記 述項目(エレメント)を既存スキーマの中で検索し、見つけたエレメントを基礎として新 規メタデータスキーマの定義作業を支援する機能を持つ。

キーワード

メタデータスキーマ,アプリケーションプロファイル,メタデータスキーマレジストリ, メタデータの相互利用性,メタデータスキーマの再利用

A Software Tool to Support Metadata Schema Development by Schema Search-and-Reuse

Kazuo SHOYAMA†, Mitsuharu NAGAMORI‡, Shigeo SUGIMOTO‡
†School of Library and Information Science, University of Tsukuba,
‡Graduate School of Library, Information and Media Studies, University of Tsukuba

Abstract

Metadata has been recognized as an important issue for the Internet and digital libraries. In general, we need to define a metadata schema(s) which is tailored to our applications and services. However, in general, it is expensive to develop a metadata schema from scratch. This paper describes a system to support metadata schema development based on Dublin Core Application Profile and the XML/RDF technology. The system help a user find metadata schemas and metadata elements from a metadata schema database and define a metadata schema as an application profile in accordance with the user's requirements. In other words, this system help users reuse existing schemas, which will not only decrease the cost of schema development but also enhance interoperability of metadata.

Keywords

Metadata Schema, Application Profile, Metadata Schema Registry, Metadata Interoperability, Metadata Schema Reuse

1 はじめに

 現在インターネットの発達とともに、ネットワーク上で提供されるリソースは増加の一 途をたどっている。その膨大な資源の中から、より目的に適合した情報を発見し、利用す るためにメタデータの重要性が広く認められている。

 現在までに様々なコミュニティにおいて、それぞれの目的に合ったメタデータスキーマ の開発が行われてきた。メタデータスキーマ開発者はメタデータスキーマの開発において、 メタデータの相互利用性を重視するか、コミュニティの利用目的に特化したメタデータ記 述の要望を満たすことを重視するか、いずれかを選択しなくてはならないというジレンマ に陥りがちである。前者では自身の利用目的に特化したメタデータ記述を排除することに なり、後者では新規にメタデータスキーマを開発しなければならない。また、ネットワー ク上で利用されるメタデータスキーマを記述するためにはXMLやXML/RDF等の知識が 必要であることや、多大な時間をかけて定義したメタデータスキーマのエレメントを再利 用するための具体的方法も普及していない。

 これら新規メタデータスキーマ作成に関わるジレンマやエレメントの再利用といった課 題を解決するには、既存メタデータスキーマとエレメントを発見し再利用するためのモデ ルと、応用目的にあった新しいスキーマを既存スキーマから作るプロセスを支援するツー ルが必要であると考える。そこで本研究では、既存メタデータスキーマから利用目的に沿 ったエレメントを見つけ出し、それらを組み合わせて新たなメタデータスキーマを作成す るためのモデルの提案と、本モデルに基づいたメタデータスキーマ設計支援システムにつ いて述べる。

2 メタデータスキーマとメタデータスキーマ開発

2.1 メタデータスキーマ

 メタデータスキーマとは、メタデータの記述形式を決める規則である。メタデータスキ ーマ[14]を用いることで、記述対象とするリソースの分野や言語の違い関わらずメタデータ を統一的に記述することができ、ウェブ上のリソース発見の効率化を図ることができる。 代表的なメタデータスキーマには、国際標準となっているDublin Core Metadata Element Set (DCMES)[5]がある。DCMESはウェブ上のリソースのメタデータを記述するためのも ので、Dublin Core Metadata Initiatives(DCMI)[4]によって定義されている。DCMESで は、語彙を定めるだけでその記述法や構文は定義しておらず、RDFやHTMLなどで記述 するための推奨方法は別途提案されている。

本研究では、メタデータスキーマは下記の要素からなると定義する。

(1) 属性集合(属性語彙)

メタデータとして記述するリソースの属性の定義。例えば、タイトル、著者、出版 者など、属性を表す語とその集合の定義。

(2) 属性値型集合(属性値型語彙)

メタデータとして記述する属性値の記述形式の定義。例えば、日付や名前の記述形 式、主題を表す統制語彙など、属性値の型あるいは形式を表す語とその集合の定義。

(3) 構造的制約(抽象構文)

属性値記述の省略可能性や繰返し条件などメタデータの構造的な制約。構造的制約 は、具体的なシステム上でのメタデータの実現形式に依存しないメタデータの構文 規則を決める。

(4) 実現形式(具象構文)

システム上でのメタデータの具体的表現形式。

 一般にメタデータ記述とは、リソースが持つ属性と属性値の組の記述の集まりと捕らえ ることができる。本論文では上に示した属性集合(属性語彙)をエレメントセットとし、 その要素を記述項目(エレメント)と呼ぶ。

2.2 メタデータスキーマレジストリ

 メタデータスキーマレジストリは、メタデータスキーマの正確な情報の提供や、メタデ ータスキーマの流通性を高めるといった役割を担う。メタデータスキーマレジストリは、 メタデータスキーマ閲覧や検索をする機能を持つ。メタデータ作成者にとってはメタデー タ作成のためのリファレンスとなる。メタデータスキーマ開発者にとっては、リファレン スとしてだけではなく、既存メタデータスキーマを発見するためのデータベースとしてメ タデータスキーマ開発に利用することができる。

 1999年頃からDCMIレジストリワーキンググループ[11]では、メタデータスキーマレジ ストリに関する議論と実装が行なわれている。DCMIレジストリワーキンググループでは、 メタデータスキーマ開発者のメタデータスキーマの発見、メタデータスキーマ開発の支援、 そして各種のソフトウェアから利用するためのアプリケーションインタフェースの構築を 目指している。

 DCMIメタデータスキーマレジストリ[12]では、DCMIによって定義されたメタデータス キーマに関する情報を提供している。また、多言語への対応を指向しており、2007年1月 現在で26ヶ国語によるDCMESが提供されている。メタデータスキーマの記述形式には RDFを採用し、RDF形式のメタデータスキーマであればDCMIによって定義されたもの 以外も登録可能である。レジストリの機能には、スキーマの検索と閲覧、スキーマの修正、 登録の管理、ウェブサービスを利用したアプリケーションインタフェースの提供等がある。

 われわれの研究室では、筑波大学レジストリとして、DCMIの定義するメタデータスキ ーマ以外のメタデータスキーマをレジストリに登録する試みを行っている[13]。筑波大学 レジストリでは、60種類以上のメタデータスキーマを収集・蓄積し、提供している。

2.3 関連研究

 メタデータスキーマを収集し検索、閲覧可能にする試みが、幾つかのプロジェクトによ り行われている。ここではSwoogle[6]とSchemaWeb[7]について述べる。

 Swoogleは、ウェブ上で公開されているセマンティックWEB文書を対象とした専門検索 エンジンで、RDF文書やHTMLに埋め込まれたRDF、N3文書、メタデータスキーマ等 を収集している。収集された文書の関係が計算されインデックスがつけられている、検索 結果はオントロジーの統計等に基づいてランキング表示される。Swoogleでは、ウェブサ ービスとしてソフトウェアエージェントへのサービスも提供している。

 SchemaWebでは、登録されたメタデータスキーマに対してディレクトリ型の閲覧、検索 が可能である。登録されたスキーマの閲覧、スキーマに含まれるエレメント情報の閲覧、 スキーマの全文検索、蓄積されたスキーマに関する情報を呼び出すことができるウェブサ ービスが提供されている。Swoogleではメタデータスキーマへのリンクのみを提供してい るが、SchemaWebではメタデータスキーマの詳細(プロパティ、クラス等の一覧)が閲覧 可能になっている。

 SwoogleとSchemaWebではメタデータスキーマの検索と閲覧機能の提供は行っている が、メタデータスキーマ作成の機能は提供していない。

3 メタデータスキーマ作成支援モデル

 本研究におけるメタデータスキーマの設計はDublin Coreのアプリケーションプロファ イル[8]の概念を基礎として、既存メタデータスキーマから利用目的に沿ったエレメントを 見つけ出し、それらを組み合わせて再利用することで利用目的に沿った新規メタデータス キーマの設計を行う。

 本モデルでは、メタデータスキーマレジストリに登録されたメタデータスキーマからエ レメントを応用し新たなスキーマの作成に利用することで、従来のように新規にエレメン トを作成する手間を省く。また、アプリケーションプロファイルとして記述することによ り既存メタデータスキーマの再利用性を向上させることができる。作成したメタデータス キーマをレジストリに登録することで、アプリケーションプロファイルとして記述したメ タデータスキーマに関しても調査の対象とし、それを再利用可能とすることで再利用され たスキーマと再利用したスキーマ間での相互利用性を高めメタデータスキーマの設計に好 循環を生み出すことができると考える。本研究における新規メタデータスキーマ設計に必 要な手順は、A)既存エレメントの発見、B)発見したエレメントが要求に適しているか 検討、C)メタデータスキーマの記述とする。

A)既存エレメントの発見

 既存エレメントの発見には、既存メタデータスキーマを検索し利用目的に沿ったエレメ ントの発見を支援するシステムが必要とされる。

 全文検索によるメタデータスキーマ検索では、ユーザが入力したキーワードとメタデー タスキーマの定義文章内に含まれるテキストが一致している必要があった。しかし、利用 目的に沿ったエレメントを検索するには文字列の一致だけではなくエレメントの利用目的 に合わせて探せることが重要である。例えば、文字列の一致だけでは検索キーワードとし て「title」のようにエレメント名に相当する項目名を入力する場合においても、本の「title」 と人の肩書きの「title」といった意味的に異なるものも区別無く検索されてしまう。また、 利用目的を「Personal」のように入力する場合、文字列の一致のみでは、検索もれが大き くなる恐れがある。その原因の一つとしてメタデータスキーマのRDF記述の中には、利用 目的を示す単語が記述されていないものや、利用目的を明確に説明していないものが多く あることがあげられる。そこで、メタデータスキーマ及びそれに含まれるエレメントを意 味的な要素も含めて検索できるシステムが要求される。

 本研究ではメタデータスキーマ及びそのエレメントに対して利用目的等のコンテクスト を与えるカテゴリとの対応付けを与える。全文検索とカテゴリ検索を組み合わせることで、 ユーザの要求に一致したメタデータスキーマの発見を適切にナビゲートするシステムを実 現する。エレメントのカテゴリはDublin Coreを参考に作成した。Dublin Coreは含まれ るエレメント数は少ないが、広い範囲を示すエレメントが定義されているため、カテゴリ 作成の参考に適していると考えたからだ。Dublin Coreのエレメントでも意味的に重複する ものは統合し、Dublin Coreの概念に含まれないものに関しては随時追加していく。スキー マのカテゴリはスキーマを登録する際に随時スキーマの利用目的を示すワードを付与する こととした。

表 1 本研究でDublin Coreを参考に作成したエレメントのカテゴリ一覧

B)発見したエレメントが要求に適しているか検討

 エレメントが要求に適しているか検討するためには、エレメントが属しているスキーマ 情報及び関連するエレメントに対する理解も必要である。メタデータスキーマはテキスト で記述されることが多く、視覚化というのはあまり行われてこなかった。しかし、近年メ タデータの世界でもXML/RDFの普及とともにRDFグラフが様々の場面で使用されはじめ、 メタデータを視覚化する動きがみられる。前述した関連研究でのメタデータスキーマ閲覧 画面において、メタデータスキーマ情報はテキストで提供されている。本研究ではそれら を改善し、閲覧画面や検索結果画面にグラフ図での描画を用いることでメタデータスキー マ及びエレメント情報の直感的な理解を促す。

C)メタデータスキーマの記述

 スキーマの記述には、XMLやXML/RDF等の知識が必要である。ユーザであるメタデー タスキーマ開発者、学習者等はその知識を会得している必要があり、初めてメタデータス キーマを開発しようとしている者など、XML/RDF等の知識を持たない利用者にとって、 メタデータスキーマの作成はハードルの高いものとなっていた。前述した関連研究では、 既存スキーマの検索や閲覧機能は提供されているが、メタデータスキーマの新規作成機能 は提供されていない。本研究では、Dublin Coreのアプリケーションプロファイルの概念を 基礎として、応用目的にあった新しいスキーマを作成する。新規メタデータスキーマの情 報(名前や利用目的等)や既存のスキーマから再利用したエレメントの制約条件を対話的 に加えていくことで新規メタデータスキーマの作成を可能にする。

4 メタデータスキーマ設計支援システム

 本研究では、3章で述べたモデルに基づいたメタデータスキーマ設計支援システムを構築 した。本システムは、既存メタデータスキーマから利用目的に沿ったエレメントの発見を 支援し、それらエレメントを組み合わせた新規メタデータスキーマの作成を行う。

 既存メタデータスキーマを検索し利用目的に沿ったエレメントを発見する検索機能とし て、キーワード入力のたびごとにリアルタイムに候補を表示させるインクリメンタルサー チによる動的な検索を可能とした。さらに、意味的な要素も含めて検索できるように検索 の結果表示された候補からエレメントのカテゴリ及びスキーマのカテゴリ(利用目的を端 的に示した語彙)による絞込みを行うことができる。図1は、キーワード「name」+カテ ゴリ「name」でエレメント情報を検索した結果である。

 スキーマ情報及び関連するエレメントに対する理解を促す機能としてスキーマ及びエレ メント情報の表示機能に通常のテキスト情報に加え、カテゴリとの対応付けを元にエレメ ントの情報及びスキーマの情報をビジュアル化して表示できる。グラフ表示には、我々の 研究室で作成したシステムHybrid And Network-Assisted Vocabulary Interface(HANAVI)[9]のグラフ表示ライブラリとTouchGraph LinkBrowser[10]を用いた。 図2、3、4ではキーワード「name」+カテゴリ「name」でエレメント情報を検索した 結果をグラフ表示している。図2はHANAVIインタフェースでのグラフ表示、図3は TouchGraphインタフェースでのエレメントとカテゴリのグラフ表示、図4はTouchGraph インタフェースでのスキーマとカテゴリのグラフ表示である。

 本システムでは、Dublin Coreのアプリケーションプロファイルの概念に基づいてメタデ ータスキーマを記述する。検索されたエレメントから要求に一致したエレメントを選択し、 それに何回出現可能等の制約条件やメタデータスキーマの利用目的など、必要な項目を対 話的に入力することでメタデータスキーマの作成を半自動的に行う。図5に既存エレメン トに制約条件を入力するフォーム画面を示す。

 システムを利用したメタデータスキーマ設計は、まずエレメントを検索し、情報の理解 にはグラフ表示を参考にする。要求に一致したエレメントの選択は一時保存領域へのドラ ッグアンドドロップで行い、必要なエレメントがそろった所で必要な項目の入力画面に移 る。図6にエレメントの一時保存画面を示す。必要な項目を入力し、入力を完了すると新 規メタデータスキーマとしてシステムに保存される。保存されたメタデータスキーマは作 成者ごとに管理され、エレメントの追加・編集・削除といった編集作業が可能である。ま た、作成したメタデータスキーマのXML/RDF形式での出力をサポートしている。図7は、 本システムを用いて作成したメタデータスキーマのXML/RDF記述である。

5 おわりに

 本研究ではメタデータスキーマ開発者のための対話的なメタデータスキーマ開発支援シ ステムを構築した。検索機能では、単純な文字列の検索だけではなく、エレメントに対し て付与したカテゴリ情報やスキーマに対して付与したタグ情報を利用した。また、エレメ ントに含まれるドメイン(エレメントの記述対象がどういった部類に属するか)、レンジ(エ レメントの目的語がどういった部類に属するか)といった詳細情報を利用したメタデータ スキーマ及びエレメントの発見を試みた。表示機能では通常のテキスト情報での表示に加 えカテゴリやタグとの対応付けを元にエレメント間の関係及びスキーマ間の関係を視覚化 した。スキーマ及びエレメント情報の視覚化は、本システムの利用者であるメタデータス キーマ開発者やメタデータスキーマ学習者にとってメタデータスキーマの発見と利用を支 援するために有用である。

 今後の課題としてはオフラインでのメタデータスキーマ設計に対応すること、メタデー タスキーマレジストリとの相互運用、データベースにおけるXMLのネイティブなサポート などがある。現在エレメントの定義にドメインとレンジを含むメタデータスキーマは多く ないが、今後ドメインとレンジに関する情報を持つメタデータスキーマの増加が予想され る。本研究では、カテゴリに加えドメインとレンジの情報を考慮した検索機能を拡張する 予定である。また、RDFで記述されていないメタデータスキーマに関しても登録し参照で きるようにする仕組みも提案したい。

参考文献

[1] 杉本重雄「メタデータの基礎概念とモデル」『図書館目録とメタデータ』No.4,東京都, 2004.

[2] 神崎正英「セマンティック・ウェブのためのRDF/OWL入門」,東京都, 2004.

[3] 吉野真世「アプリケーションプロファイルを利用したメタデータスキーマ開発支援手法」,つくば, 筑 波大学, 2006. 修士論文.

[4] DCMI. (online), available from <http://dublincore.org/>

[5] DCMI. “Dublin Core Metadata Element Set, Version 1.1” (online), available from <http://dublincore.org/documents/dces/>

[6] Swoogle. (online), available from <http://swoogle.umbc.edu/>

[7] SchemaWeb. (online), available from <http://www.schemaweb.info/>

[8] CEN ISSS MMI-DC Workshop. “Guidelines for machine-processable representation of Dublin Core Application Profiles”. (online), available from <http://www.ukoln.ac.uk/metadata/cen/ws-mmi-dc/final-132/>

[9] HANAVI: Hybrid And Network-Assisted Vocabulary Interface. (online), available from <http://raus.slis.tsukuba.ac.jp/subjects/graph>

[10] SourceForge. “TouchGraph”. (online), available from <http://sourceforge.net/projects/touchgraph/>

[11] DCMI. “DCMI Registry Community” (online), available from <http://dublincore.org/groups/registry/>

[12] DCMI. “The Open Metadata Refistry” (online), available from <http://dublincore.org/dcregistry/>

[13] 筑波大学. “The Open Metadata Registry”. (online), available from <http://juror.slis.tsukuba.ac.jp/dcregistry/index.html>

[14] DCMI. “DCMI Abstract Model” (online), available from <http://dublincore.org/documents/abstract-model/>


図 1 エレメントの検索とテキスト表示


図 2 エレメントとカテゴリを繋ぐグラフ表示(HANAVIインタフェース)


図 3 エレメントとカテゴリを繋ぐグラフ表示(TouchGraphインタフェース)


図 4 スキーマとカテゴリを繋ぐグラフ表示(TouchGraphインタフェース)


図 5 エレメント制約条件の対話的付与


図 6 利用したいエレメント情報の一時保存


図 7 作成したメタデータスキーマ(アプリケーションプロファイル)の XML/RDF形式出力