2000年にカナダ国立図書館(オタワ)で開催された第8回ワークショップ(DC-8)以降,そ れまでOCLCの大きな補助とボランティアである草の根参加者によって実質運営されてきた DCMIの再構成に関する議論が行われてきた。その意味では,現在Dublin Coreは開発のフェ ーズから,維持管理と継続的な開発のフェーズへと移りつつあるといえる。一方,第9回ワー クショップとして計画された国立情報学研究所(東京)での会議は,Dublin Coreワークショッ プの歴史の中では初めて研究や開発に関する論文発表を含む国際会議International Conference on Dublin Core and Metadata Applications 2001 (DC-2001)として2001年10月 22日から26日に開催されることになった。
以下,本稿では,筆者の2000年9月の報告[2]以降の話題について簡単に述べる。本稿で述べ る話題を理解するのに必要な限定子やDumb-down原則などについては、昨年の報告等を参照 していただきたい。
Dublin Coreの開発の進展とともに,様々な応用分野への適用が進み,多様な分野の要求に基 づくエレメントや限定子に対する要求が出てきている。一方,メタデータの表現と解釈の基礎を 与えるデータモデルの定義やDCMESの維持管理のためのレジストリ開発等も求められている。 このように,DCMIに対していろいろな活動を進める要求が寄せられる一方,OCLC以外には 大きなスポンサーはないこと,また,DCMIは基本的にボランティアによる組織であることな どのため,DCMESの維持管理や継続的な開発を進める上での限界が見えてきていた。そのた め,DC-8以降DCMIを再構成することが議論されてきている。現時点では会員組織 (membership organization)化することや,地域毎に組織をつくり,地域での要求に応じた新し いエレメントや限定子の開発,言語(たとえば日本語)での標準のメンテナンスなどを行うこと が検討されている。
Educationワーキンググループからは,2000年10月に出されたworking draftで
(1) 資料の利用者を表すdc-ed:audienceエレメントとその限定子
(2) 教育やトレーニングに関する標準を表すdc-ed:standardエレメントとその限定子
(3) relationエレメントの詳細化限定子として,教育に関する標準との関連を表すための dc-ed:conforms 限定子
(4) IEEE LOMのnamespace内に定義されるデータエレメントの承認
が提案されている。
Libraryグループからはタイトルを必須とすること,資源の作成に関わった者に関する記述を 条件付きで必須とすること,資料の利用者や所蔵者に関するエレメントなどを定義した application profileが提案されている。
ArchitectureグループからはSimple Dublin CoreとQualified Dublin CoreのRDFによる 記述方法がProposed Recommendationとして出されている。レジストリワーキンググループで はレジストリに関する議論とレジストリの試作を進めてきている。これについては後節で述べる。
<?xml version="1.0"?> <!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2001 09 20//EN" "http://dublincore.org/documents/2001/09/20/dcmes-xml/dcmes-xml-dtd.dtd"> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc ="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://dublincore.org/"> <dc:title>Dublin Core Metadata Initiative - Home Page</dc:title> <dc:description>The Dublin Core Metadata Initiative Web site. </dc:description> <dc:date>1998-10-10</dc:date> <dc:format>text/html</dc:format> <dc:language>en</dc:language> <dc:contributor>The Dublin Core Metadata Initiative</dc:contributor> <!-- guesses for the translation of the above titles --> <dc:title xml:lang="fr">L'Initiative de metadonnees du Dublin Core</dc:title> <dc:title xml:lang="de">der Dublin-Core Metadata-Diskussionen </dc:title> </rdf:Description> </rdf:RDF>
DCSの場合,rdf:Descriptionタグで記述対象の資源を指示するとともに,エレメントを囲んで いる。各エレメントを表すタグはDublin Coreのエレメント名の前にnamespace名として"dc" が付いたタグになっている。また,この例の下の方にはフランス語とドイツ語によるタイトルエ レメントの記述がある。ここでは記述言語をあらわすためにrdf:lang属性を用いている。
例1: 詳細化(element refinement)
内容記述(description)エレメントの詳細化限定子であるabstractを用いた例である。RDF Schemaによってabstractがdescriptionのsub-propertyとして定義される。(この例ではRDF Schema記述が含まれている。)abstractがdescriptionの限定子であることは一意に定まるこ ともあり,dc:descriptionはこの例には現れず,直接dcq:abstractで表している。
<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcq="http://purl.org/dc/terms/"> <rdf:Description> <dcq:abstract>The paper resolves the issues of the data model draft. </dcq:abstract> </rdf:Description> <rdf:Description about="http://purl.org/dc/terms/abstract"> <rdfs:subPropertyOf rdf:resource="http://purl.org/dc/elements/1.1/description"/> </rdf:Description> </rdf:RDF>
例2: コード化スキーム(encoding scheme)
subjectエレメントにMESHの値を入れている例である。dcq:MESHタグをdc:subjectの中に 入れ,その中にrdf:valueとrdf:labelの二つのタグを入れている。rdf:valueは主たる値を表す ために用いられるもので,rdf:labelは主たる値に付随する名前や説明を書くために用いられて いる。
<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcq="http://purl.org/dc/terms/"> <rdf:Description> <dc:subject> <dcq:MESH> <rdf:value>D08.586.682.075.400</rdf:value> <rdfs:label>Formate Dehydrogenase</rdfs:label> </dcq:MESH> </dc:subject> </rdf:Description> </rdf:RDF>
例3: 言語属性
DCSではメタデータの記述に用いられる言語をタグ内にrdf:lang属性を用いて記述している。 一方,DCQに対するRDF記述の文書では,記述言語をタグとして表す方法を提案している。 下の二つの記述のうち,上はxml:lang属性を用いたもの,下はxml:langをタグとして用いた ものであり,この提案では後者を勧めている。
・xml:lang属性
<?xml version="1.0"?> <rdf:RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description> <dc:creator>Karl Mustermann</dc:creator> <dc:title>Algebra</dc:title> <dc:subject xml:lang="en">mathematics</dc:subject> <dc:subject xml:lang="de">Mathematik</dc:subject> </rdf:Description> </rdf:RDF>
・xml:langタグ
<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dcq="http://purl.org/dc/terms/"> <rdf:Description> <dc:creator>Karl Mustermann</dc:creator> <dc:title>Algebra</dc:title> <dc:subject rdf:parseType="Resource"> <rdf:value>mathematics</rdf:value> <dc:language> <dcq:RFC1766> <rdf:value>EN</rdf:value> <rdfs:label>English</rdfs:label> <rdfs:isDefinedBy rdf:resource="http://www.ietf.org/rfc/rfc1766.txt"/> </dcq:RFC1766> </dc:language> </dc:subject> <dc:subject rdf:parseType="Resource"> <rdf:value>mathematik</rdf:value> <dc:language> <dcq:RFC1766> <rdf:value>DE</rdf:value> <rdfs:label>German</rdfs:label> <rdfs:isDefinedBy rdf:resource="http://www.ietf.org/rfc/rfc1766.txt"/> </dcq:RFC1766> </dc:language> </dc:subject> </rdf:Description> </rdf:RDF>
Dumb-downに関しての検討:
DCQの記述はDumb-down原則に基づき限定子を取り除くことができなければならない。上の 記述の場合,ごく単純には,詳細化限定子の場合,その限定子が定義されたエレメントに置き換 えればよい。また,コード化スキーム限定子の場合はrdf:vaueで示された値を取り出し,その 限定子が定義されたエレメントの値とするという方法でDumb-downを行うことができる。
(1) 詳細化限定子(element refinement qualifier)について
現在までに承認されている詳細化限定子は,それが属するエレメントが一意に定まるという関 係で与えられている。(コード化スキーム限定子の場合は異なるエレメントに対して同じ限定子 が対応する場合がある。付録参照。)筆者には,ある詳細化限定子に対するエレメントが一意に 決まらなければならないという関係はかなり制約としては厳しく感じられる。今後,もしこの関 係が崩れた場合には対応できないことになる。
(2) コード化スキーム限定子について
従来のSGMLの記述方法に基づくと,コード化スキーム限定子のように値の属性を定義する ものはタグそのものではなく,タグの属性として定義するのが好ましいと思われる。しかしなが ら,RDFは,Resource,Property,Valueの3つ組みでの表現を原則とするため,属性による 表現が行いづらい。そのため,ここではコード化スキーム限定子をタグとして記述するとともに, 主たる値を表すためのrdf:valueとrdf:labelを用いて主たる値とそれに付随する情報の表現を行 っている。また,構造を持つ値に関しては,推奨方式(DCSV)[5]を利用して文字列として表 している。
RDFの制約上仕方ない点はあると思うが,構造が複雑になること,詳細化とコード化スキー ムの別を構文から知ることができないことなどの問題があるように思う。また,同様にメタデー タの記述言語を属性からはずしてタグとして記述していることも構造を複雑にしていると感じ られる。RDFの記述は複雑になることからも,適切なソフトウェアツールの整備が必要である ことが良く理解できる。
今後,レジストリはメタデータ規則(エレメント,限定子,application profileの定義や参照 記述)の登録,蓄積,提供のために用いられ,メタデータ規則の維持管理と継続的な開発や,メ タデータを利用するコミュニティ間でのメタデータの相互利用等のために重要な役割を持つと 期待されている。
[2] 杉本重雄,Dublin Coreについて−最近の動向,特にqualifierについて,ディジタル図書 館, No.18, 2000.9, http://www.dl.ulis.ac.jp/DLjournal/No_18/4-sugimoto/4-sugimoto.html
[3] Dave Beckett, Dan Brickley, Eric Miller, Expressing Simple Dublin Core in RDF/XML, http://www.dublincore.org/documents/2001/09/20/dcmes-xml/, 2001.9
[4] Stefen Kokkelink, Roland Schwaenzl, Expressing Qualified Dublin Core in RDF / XML, http://www.dublincore.org/documents/2001/08/29/dcq-rdf-xml/, 2001.8
[5] SimonCox,Renato Ianela, DCMI DCSV: A syntax for writing a list of labelled values in a text string, http://dublincore.org/documents/2000/07/28/dcmi-dcsv/, 2000.7
[6] Nagamori Mitsuharu, et al. A Multilingual Metadata Schema Registry Based on RDF Schema, Proceedings of DC-2001, 2001.10
[7] Forum for Metadata Schema Implementers, http://www.schemas-forum.org/