Dublin Core − 最近の話題から

杉本重雄
図書館情報大学
sugimoto@ulis.ac.jp

概要

本稿では,Dublin Core Metadata Initiative(DCMI)における最近の話題について簡単に述べる。 はじめにDCMIの現在の構成とその再構成について述べ,DCMIのワーキンググループによる 最近の成果を紹介する。その後,Resource Description Framework (RDF)形式に基づくDublin Coreメタデータの記述形式に関する現在の推奨方法を紹介し,それに関する検討を示している。

キーワード

Dublin Core Metadata Element Set (DCMES),Dublin Core Metadata Initiative (DCMI),エレメント,限定子(qualifier),Resource Description Framework (RDF) によるDublin Core記述

Dublin Core - Recent Activities

Shigeo Sugimoto
University of Library and Information Science
sugimoto@ulis.ac.jp

abstract

This paper briefly shows the current activities of the Dublin Core Metadata Initiative (DCMI). Firstly, this paper describes the organization structure of DCMI and its re-organization which is being considered and, then recent outcomes from DCMI working groups. Secondly, this paper shows RDF/XML description of both Simple and Qualified Dublin Core based on the proposed recommendation documents issued in the summer 2001. Discussion on the proposed description is given in this paper.

Keywords

Dublin Core Metadata Element Set (DCMES),Dublin Core Metadata Initiative (DCMI),elements,qualifiers,Expressing Dublin Core in Resource Description Framework (RDF)

1. はじめに

 Dublin Coreの利用が多様な分野で進められている。Dublin Core Metadata Element Set (DCMES)の開発は,Dublin Core Metadata Initiative (DCMI)[1]として,OCLCのStuart Weibelを中心に,多くの草の根参加者によって進められてきたものである。基本15エレメント の定義を与えるSimple Dublin Coreに関しては1997年秋に実質的に確定し,その後,qualifier (限定子)の議論やいろいろな分野での利用に関する議論が進められてきた。2000年7月には 最初の推奨限定子セットをアナウンスした。また,エレメントや限定子の拡張に関するプロセス を確立させてきている。その間,2000年にヨーロッパのCEN/ISSSでの標準化(CWA 13874) に続き,2001年10月にANSIでの承認(Z39.85)がなされた。

 2000年にカナダ国立図書館(オタワ)で開催された第8回ワークショップ(DC-8)以降,そ れまでOCLCの大きな補助とボランティアである草の根参加者によって実質運営されてきた DCMIの再構成に関する議論が行われてきた。その意味では,現在Dublin Coreは開発のフェ ーズから,維持管理と継続的な開発のフェーズへと移りつつあるといえる。一方,第9回ワー クショップとして計画された国立情報学研究所(東京)での会議は,Dublin Coreワークショッ プの歴史の中では初めて研究や開発に関する論文発表を含む国際会議International Conference on Dublin Core and Metadata Applications 2001 (DC-2001)として2001年10月 22日から26日に開催されることになった。

 以下,本稿では,筆者の2000年9月の報告[2]以降の話題について簡単に述べる。本稿で述べ る話題を理解するのに必要な限定子やDumb-down原則などについては、昨年の報告等を参照 していただきたい。

2. 最近の話題から

2.1 DCMIの組織再構成

 現在のDCMIは全体の運営を行うDCMI DirectorateにExecutive DirectorとManaging Directorをおき,運営に関してDirectorateへの助言,フィードバックを行うExecutive Committee,ワーキンググループのリーダー他からなるAdvisory Committee,特定分野に関し て議論するワーキンググループ,エレメントや限定子に関して議論するUsage Boardからでき ている。これらは毎年行われてきているワークショップで設立,継続あるいは廃止を決めている。

 Dublin Coreの開発の進展とともに,様々な応用分野への適用が進み,多様な分野の要求に基 づくエレメントや限定子に対する要求が出てきている。一方,メタデータの表現と解釈の基礎を 与えるデータモデルの定義やDCMESの維持管理のためのレジストリ開発等も求められている。 このように,DCMIに対していろいろな活動を進める要求が寄せられる一方,OCLC以外には 大きなスポンサーはないこと,また,DCMIは基本的にボランティアによる組織であることな どのため,DCMESの維持管理や継続的な開発を進める上での限界が見えてきていた。そのた め,DC-8以降DCMIを再構成することが議論されてきている。現時点では会員組織 (membership organization)化することや,地域毎に組織をつくり,地域での要求に応じた新し いエレメントや限定子の開発,言語(たとえば日本語)での標準のメンテナンスなどを行うこと が検討されている。

2.2 ワーキンググループ

現在あるワーキンググループとその目的を表1にまとめて示す。以下にワーキンググループ の活動成果のいくつかをごく簡単に紹介する。

Educationワーキンググループからは,2000年10月に出されたworking draftで

(1) 資料の利用者を表すdc-ed:audienceエレメントとその限定子

(2) 教育やトレーニングに関する標準を表すdc-ed:standardエレメントとその限定子

(3) relationエレメントの詳細化限定子として,教育に関する標準との関連を表すための dc-ed:conforms 限定子

(4) IEEE LOMのnamespace内に定義されるデータエレメントの承認

が提案されている。

Libraryグループからはタイトルを必須とすること,資源の作成に関わった者に関する記述を 条件付きで必須とすること,資料の利用者や所蔵者に関するエレメントなどを定義した application profileが提案されている。

ArchitectureグループからはSimple Dublin CoreとQualified Dublin CoreのRDFによる 記述方法がProposed Recommendationとして出されている。レジストリワーキンググループで はレジストリに関する議論とレジストリの試作を進めてきている。これについては後節で述べる。

3. Resource Description Framework (RDF)による記述

ArchitectureワーキンググループからはSimple DC(DCS)とQualified DC(DCQ)のRDF による記述形式を定義した文書がProposed Recommendationとして,それぞれ本年9月と8 月に出されている[3][4]。以下にそこから記述例をいくつか紹介したい。なお,ここで参照して いる文書はrecommendation(推奨,勧告)と認められたものではなく,その前段階であるので これからの変更も有得る。

3.1 Simple DCの場合

例: DCMIのホームページのメタデータ
<?xml version="1.0"?>
<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2001 09 20//EN"
"http://dublincore.org/documents/2001/09/20/dcmes-xml/dcmes-xml-dtd.dtd">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns:dc ="http://purl.org/dc/elements/1.1/">
 <rdf:Description rdf:about="http://dublincore.org/">
   <dc:title>Dublin Core Metadata Initiative - Home Page</dc:title>
   <dc:description>The Dublin Core Metadata Initiative Web site.
      </dc:description>
   <dc:date>1998-10-10</dc:date>
   <dc:format>text/html</dc:format>
   <dc:language>en</dc:language>
   <dc:contributor>The Dublin Core Metadata Initiative</dc:contributor>
   <!-- guesses for the translation of the above titles -->
   <dc:title xml:lang="fr">L'Initiative de metadonnees du Dublin
            Core</dc:title>
   <dc:title xml:lang="de">der Dublin-Core Metadata-Diskussionen
      </dc:title>
 </rdf:Description>
</rdf:RDF>

DCSの場合,rdf:Descriptionタグで記述対象の資源を指示するとともに,エレメントを囲んで いる。各エレメントを表すタグはDublin Coreのエレメント名の前にnamespace名として"dc" が付いたタグになっている。また,この例の下の方にはフランス語とドイツ語によるタイトルエ レメントの記述がある。ここでは記述言語をあらわすためにrdf:lang属性を用いている。

3.2 Qualified DCの記述

DCQはエレメント詳細化(element refinement)とコード化スキーム(encoding scheme)の 2種類の限定子をどう表すかの定義をきちんとしなければならない。これらの限定子の意味を RDFのモデル上で定義することが求められるため,Proposed Recommendation文書もデータ モデルの説明にかなりの場所を費やしている。

例1: 詳細化(element refinement)

内容記述(description)エレメントの詳細化限定子であるabstractを用いた例である。RDF Schemaによってabstractがdescriptionのsub-propertyとして定義される。(この例ではRDF Schema記述が含まれている。)abstractがdescriptionの限定子であることは一意に定まるこ ともあり,dc:descriptionはこの例には現れず,直接dcq:abstractで表している。

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
            xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
            xmlns:dc="http://purl.org/dc/elements/1.1/"
            xmlns:dcq="http://purl.org/dc/terms/">
  <rdf:Description>
    <dcq:abstract>The paper resolves the issues of the data model
        draft.  </dcq:abstract>
  </rdf:Description>
  <rdf:Description about="http://purl.org/dc/terms/abstract">
    <rdfs:subPropertyOf
       rdf:resource="http://purl.org/dc/elements/1.1/description"/>
  </rdf:Description>
</rdf:RDF>

例2: コード化スキーム(encoding scheme)

subjectエレメントにMESHの値を入れている例である。dcq:MESHタグをdc:subjectの中に 入れ,その中にrdf:valueとrdf:labelの二つのタグを入れている。rdf:valueは主たる値を表す ために用いられるもので,rdf:labelは主たる値に付随する名前や説明を書くために用いられて いる。

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
            xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
            xmlns:dc="http://purl.org/dc/elements/1.1/"
            xmlns:dcq="http://purl.org/dc/terms/">
<rdf:Description>
 <dc:subject>
   <dcq:MESH>
     <rdf:value>D08.586.682.075.400</rdf:value>
     <rdfs:label>Formate Dehydrogenase</rdfs:label>
   </dcq:MESH>
 </dc:subject>
</rdf:Description>
</rdf:RDF>

例3: 言語属性

DCSではメタデータの記述に用いられる言語をタグ内にrdf:lang属性を用いて記述している。 一方,DCQに対するRDF記述の文書では,記述言語をタグとして表す方法を提案している。 下の二つの記述のうち,上はxml:lang属性を用いたもの,下はxml:langをタグとして用いた ものであり,この提案では後者を勧めている。

・xml:lang属性

<?xml version="1.0"?>
<rdf:RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns:dc="http://purl.org/dc/elements/1.1/">
  <rdf:Description>
    <dc:creator>Karl Mustermann</dc:creator>
         <dc:title>Algebra</dc:title>
         <dc:subject xml:lang="en">mathematics</dc:subject>
   <dc:subject xml:lang="de">Mathematik</dc:subject>
  </rdf:Description>
</rdf:RDF>

・xml:langタグ

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns:dc="http://purl.org/dc/elements/1.1/"
         xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
         xmlns:dcq="http://purl.org/dc/terms/">
  <rdf:Description>
    <dc:creator>Karl Mustermann</dc:creator>
         <dc:title>Algebra</dc:title>
         <dc:subject rdf:parseType="Resource">
      <rdf:value>mathematics</rdf:value>
      <dc:language>
        <dcq:RFC1766>
          <rdf:value>EN</rdf:value>
          <rdfs:label>English</rdfs:label>
          <rdfs:isDefinedBy
               rdf:resource="http://www.ietf.org/rfc/rfc1766.txt"/>
        </dcq:RFC1766>
      </dc:language>
    </dc:subject>
    <dc:subject rdf:parseType="Resource">
      <rdf:value>mathematik</rdf:value>
      <dc:language>
        <dcq:RFC1766>
          <rdf:value>DE</rdf:value>
          <rdfs:label>German</rdfs:label>
          <rdfs:isDefinedBy
               rdf:resource="http://www.ietf.org/rfc/rfc1766.txt"/>
        </dcq:RFC1766>
      </dc:language>
    </dc:subject>
  </rdf:Description>
</rdf:RDF>

Dumb-downに関しての検討:

DCQの記述はDumb-down原則に基づき限定子を取り除くことができなければならない。上の 記述の場合,ごく単純には,詳細化限定子の場合,その限定子が定義されたエレメントに置き換 えればよい。また,コード化スキーム限定子の場合はrdf:vaueで示された値を取り出し,その 限定子が定義されたエレメントの値とするという方法でDumb-downを行うことができる。

3.3 検討

上の記述形式に関して筆者の観点から検討を加えてみたい。Simple DCに関するRDF記述形式 は単純であり,これまでのHTMLのMetaタグを使った例と基本的に同じである。一方, Qualified DCは限定子という新たな概念が入ってきているため,複雑になっている。ここでは Qualified DCのRDF記述に関して簡単に検討してみたい。

(1) 詳細化限定子(element refinement qualifier)について

 現在までに承認されている詳細化限定子は,それが属するエレメントが一意に定まるという関 係で与えられている。(コード化スキーム限定子の場合は異なるエレメントに対して同じ限定子 が対応する場合がある。付録参照。)筆者には,ある詳細化限定子に対するエレメントが一意に 決まらなければならないという関係はかなり制約としては厳しく感じられる。今後,もしこの関 係が崩れた場合には対応できないことになる。

(2) コード化スキーム限定子について

 従来のSGMLの記述方法に基づくと,コード化スキーム限定子のように値の属性を定義する ものはタグそのものではなく,タグの属性として定義するのが好ましいと思われる。しかしなが ら,RDFは,Resource,Property,Valueの3つ組みでの表現を原則とするため,属性による 表現が行いづらい。そのため,ここではコード化スキーム限定子をタグとして記述するとともに, 主たる値を表すためのrdf:valueとrdf:labelを用いて主たる値とそれに付随する情報の表現を行 っている。また,構造を持つ値に関しては,推奨方式(DCSV)[5]を利用して文字列として表 している。

 RDFの制約上仕方ない点はあると思うが,構造が複雑になること,詳細化とコード化スキー ムの別を構文から知ることができないことなどの問題があるように思う。また,同様にメタデー タの記述言語を属性からはずしてタグとして記述していることも構造を複雑にしていると感じ られる。RDFの記述は複雑になることからも,適切なソフトウェアツールの整備が必要である ことが良く理解できる。

4. Dublin Coreレジストリ

 DCMIではDublin Coreのエレメントの定義をネットワーク上で登録,提供するレジストリ サービスが重要であると認め,レジストリワーキンググループを作ってソフトウェアの開発を進 めてきている。筆者等も基本15エレメントの参照記述とその翻訳をRDF Schema記述し,蓄 積した多言語メタデータレジストリを開発してきた[6]。DCMIではEric Millerを中心として EORと呼ぶレジストリのためのソフトウェアツールの開発を進めた。メタデータ規則を収集し 提供することを目的としてヨーロッパで進められたScehmasプロジェクト[7]ではEORを用い てレジストリを開発してきている。現在,DCMIでは新たにレジストリの開発を進めている。

 今後,レジストリはメタデータ規則(エレメント,限定子,application profileの定義や参照 記述)の登録,蓄積,提供のために用いられ,メタデータ規則の維持管理と継続的な開発や,メ タデータを利用するコミュニティ間でのメタデータの相互利用等のために重要な役割を持つと 期待されている。

5. おわりに

Dublin Coreは現在既に様々な分野での利用がひろがってきている。今後もこうした利用は広が りつづけると期待される。一方,WWWコンソーシアムによるSemantic Web activityのよう に,より内容的な理解を計算機に行わせることを目的とした研究開発が盛んに行われている。こ うした動きによって,語彙の定義などより意味的内容を形式的に定義することに関心がもたれて いる。Dublin Coreの場合,応用側では,こうした形式的取り組みとはあまり直接的なつながり は出てこないかもしれないが,アーキテクチャやレジストリなど基本的なデータモデルを扱う分 野にはごく近い取り組みであると思われる。

参考文献

[1] Dublin Core Metadata Initiative. http://dublincore.org/

[2] 杉本重雄,Dublin Coreについて−最近の動向,特にqualifierについて,ディジタル図書 館, No.18, 2000.9, http://www.dl.ulis.ac.jp/DLjournal/No_18/4-sugimoto/4-sugimoto.html

[3] Dave Beckett, Dan Brickley, Eric Miller, Expressing Simple Dublin Core in RDF/XML, http://www.dublincore.org/documents/2001/09/20/dcmes-xml/, 2001.9

[4] Stefen Kokkelink, Roland Schwaenzl, Expressing Qualified Dublin Core in RDF / XML, http://www.dublincore.org/documents/2001/08/29/dcq-rdf-xml/, 2001.8

[5] SimonCox,Renato Ianela, DCMI DCSV: A syntax for writing a list of labelled values in a text string, http://dublincore.org/documents/2000/07/28/dcmi-dcsv/, 2000.7

[6] Nagamori Mitsuharu, et al. A Multilingual Metadata Schema Registry Based on RDF Schema, Proceedings of DC-2001, 2001.10

[7] Forum for Metadata Schema Implementers, http://www.schemas-forum.org/

付録 基本15エレメントおよび限定子(qualifier)一覧