Stuart Weibel
Online Computer Library Center
Dublin, Ohio
(訳: 杉本重雄, 図書館情報大学)
現在、インターネット上に提供されるコレクションやカタログが世界的に共有さ れる情報空間を形作り、いわばインターネットを情報資源の共有地(Internet Commons) と呼んでもよい状況が生まれている。しかし、民族的に複雑に入りくんだ土地を 訪れた旅行者がいくつもの見知らぬことばに戸惑うのと同じように、この共有地 を訪れた人は自然言語や計算機用言語によって表された情報資源や検索方法等に 関するとても理解しづらい記述に出くわすことになる。情報資源の記述を行って きた伝統的なコミュニティと並んで、首尾一貫した記述形式を持たないアドホッ クなコミュニティ、たとえば電子商取引の業者のようなコミュニティが多く生ま れ、そこでは要求に適した書き方が手探りで作り出されている。
さらに好ましくないことには、インターネット上で情報を探しながらいろいろな 情報資源にアクセスする利用者、いわばインターネット上を旅する旅行者(ヴァ ーチャルツーリスト)は必要な情報を探す手伝いをしてくれる通訳やガイドを簡 単に探すことができない。こうした情報資源のためのいろいろな記述の間での自 動翻訳の開発を進める努力がなされるとしても、記述モデルの種類がどんどん増 えるので翻訳はますます難しくなる。これまで経験したことのないような大きな 情報空間の広がりの中で、首尾一貫した情報資源記述を行い、そうして作り出さ れた記述を交換することができるようにするには、世界共通のセマンティクスと シンタックスを持つ情報資源の記述方法を確立することが必要である。こうした 背景の下、メタデータ−すなわち、データに関する記述のための構造化されたデ ータ−がWebの基盤開発における主要な問題と認められるようになった。
情報の共有地としてのインターネットにおいて、様々な情報資源の記述モデルが あることは分野間の境を越えて情報を探す上での障害となる。一方、記述モデル がたくさんあるということは分野やコミュニティによって記述に関する要求が多 様であることを意味している。詳細なレベルでの記述の場合、記述対象が異なる のでこうしたメタデータの記述モデルは異なっている。たとえば、文書の記述者 にとって「雲で覆われた範囲」を書く必要などほとんどないが、農地の衛星写真 の場合には非常に重要な記述項目となり得る。多様な情報資源を見渡すと、より 一般化されたレベルの記述の場合、ほとんどの情報資源に共通な、すなわち分野 に関わらない基本的な属性の記述からなるメタデータの基本要素(コアセット、Core Set) を見出すことができる。このように異なった記述モデルから共通要素として取り 出せるものは、見方を変えると、別々の記述モデルとして発展してきたがために 意味は同じで単に名前だけが異なっていると考えることができる。そのため、分 野に関わらずに共通の属性としてとらえることのできる基本的要素をまとめるこ とによって、分野にまたがった情報資源の検索をより効率よく行うことができる ようになると考えられる。たとえば、「著者(author)」と「作者(creator)」は 情報資源の発見という目的では同一の属性の記述とすることができる。
Dublin Coreは、インターネットのような巨大な情報空間から分野によらずに情 報資源を見つけ出すという要求にこたえるために開発されてきた。Dublin Core は電子的情報資源の記述のために、作者(Creator)、タイトル(Title)、出版者(Publisher) 、主題(Subject)、内容に関する記述(Description)、他の関与者(Other Contributors) 、日付(Date)、情報資源の型(Resource Type)、形式(Format)、情報資源の識別 子(Resource Identifier)、情報資源のソース(Source)、情報資源の記述言語(Language) 、他の関連する情報資源との関係(Relation)、地理的・空間的範囲(Coverage)、 権利管理(Rights Management) の15項目を定めている。こうした要素のほとんど は、図書館の目録カードに書いてあるもののように、一般的な共通理解を得られ るものである。Dublin Coreは、いわば情報の共有地としてのインターネット上 で不慣れな分野の情報を得ようとするヴァーチャルツーリストのために用意され た簡単な会話のための慣用表現集(Phrase Book)のようなものであるといってよ いであろう。マシンレベルのプロトコルが、異なったハードウェア間での相互運 用性(interoperability)を保証するために必要とされるのと同じように、情報処 理における最も重要なプラットフォーム、すなわち情報を理解し扱う利用者の間 で情報の意味的な相互利用を促進するために、データ内容に関するいくつもの標 準の意味的な定義の間での共通性を見つけ出すことが有益であると考えられる。
図1:DC-Simple, defined in Thai
こうしたいくつもの言語への翻訳は英語で表された標準形の単なる訳であると思 われるかもしれない。実際、多くの図書館における標準はそのように決められて きた。たとえば、Universal Standard Bibliographic Description (USBD)は多 くの言語に翻訳されている。また、言語には依存しない数値表現によって多くの 言語に対する普遍性を備えることを目的として作られているUniversal Decimal Classification (UDC)やDewey Decimal Classification (DDC)もまた数多くの言 語に翻訳されている。たとえば、DDCは30の言語に翻訳され、135カ国で利用され ている。しかしながら、こうしたシステムは、新しい知識が生み出されるのに合 わせて更新され続けなければならない。そして、現実問題として、多くの場合英 語で表された標準を変更し、各国語への翻訳はそこから時間的に遅れて作り出さ れることになる。
本論文では、Dublin Coreを多言語に適用するのにこれまでのようなモデルが不 要であることを議論する。いろいろな言語によって具現化をされたDublin Core をある地域で実現された単なる標準版からの単なる翻訳(すなわち、サブタイト ル付きのDublin Core)ととらえるのではなく、取り決めと改訂作業からなる標 準の策定プロセスにおける(英語版のものと)同等の参加者としてとらえる。以下 の節では、はじめに背景を示す。
しかしながら、目録のエキスパートにとっては、より詳細な記述構造を付加する ことやより詳細なレベルの意味的記述をすることが可能なようにDublin Coreが 十分な柔軟性を持つことも重要である。図書館の予算縮小、通貨の変動、熟練し た目録専門家の不足、そして世界規模での情報量の増大に際し、図書館で広く使 われ、かつより洗練された目録基準であるAACR2やMARCに対しても、Dublin Core はメタデータとして経済的な選択肢のひとつである。実際、Dublin CoreはWWW文 書のためのメタデータとして将来にわたって利用される適切な技術であるとの見 方もある。
初期の頃からDublin Coreの開発に参加している人たちのコミュニティは大きく 分けて二つのグループに別れる。ひとつはMinimalistと呼ばれる人たちのグルー プである。このグループの立場は、Dublin Core メタデータは単純であることが 望ましく、かつ記述条件をできるだけ与えないというものである。したがって、15 項目の要素の記述は基本的に構造を持たないテキストとし、外部で定義された記 述に依存することやより詳細な構造を要素内部に持ち込まないことを主張するも のである。もう一方のグループはStructuralistと呼ばれる人たちである。この グループは基本要素に付加的な情報や構造を与えることが適切かつ有用であると いう立場である。また、場合によってはDublin Coreを特定の分野に応用するに はそうした付加情報が必要であるとするものである。たとえば、作者(Creator) の要素に与えられた名前が著者ではなく作曲家であるということを限定したり、 主題(Subject)の要素がLibrary of CongressのSubject Headingに基づいて記述 されていることを指定したりすべきであると主張する立場である。実際には多く の人たちがこの両者の中間に位置しており、簡明さの重要性を認めており、複雑 な構造を持ち込むことによって得られる利益が明らかな場合にのみ簡明さを犠牲 にすることができると考えている。
また、埋め込み型とは別の方法として、Dublin Coreで記述したメタデータのレ コードを、記述対象の文書とは別に蓄積、維持することも可能である。これは図 書館や博物館で目録や索引を作るのと同じである。たとえば、利用者の年令に対 して適切な資料であるかどうかや利用に関する適合条件の評価付けといったサー ビスを行う組織によって提供される新しい種類のメタデータの場合はこうしたメ タデータだけで蓄積されることになるであろう。
第3の方法はDublin Coreをデータベースの不均一なコレクションへの窓として利 用することである。Dublin Core以外のいくつかのメタデータ基準で構成される 不均一なコレクションの場合、そうした他のメタデータ基準からDublin Coreへ の写像を実現することで、不均一なコレクションを統合的に検索することが可能 である。こうした写像を実現するため、「Crosswalk」と呼ぶDublin Coreと他の メタデータ基準との対応関係定義がなされてきている。たとえば、(図書館向け の)MARC[2]、(政府情報向けの)GILSとの間のCrosswalkが作られている。また 、Z39.50のprofileとの間のCrosswalkにより、Dublin Coreを用いてZ39.50サー バに対して検索質問を発することができるようになる[11]。こうした写像のコレ クションは英国のMichael Dayによって維持管理されている[3]。
Warwick Frameworkとして形成された概念はWWWのために進められていたメタデー タ開発にも大きな影響を及ぼした。WWWの標準化を進める組織であるWorld Wide Web コンソーシアム(W3C)の下で進められているメタデータの基本概念がResource Description Framework (RDF)として確立された[18]。このメタデータの構成方 式によると、たとえば図書館の目録、第3者機関による内容評価(Rating)、電子 商取引等、多様な種類の構造化された情報を表現することができる。これが実現 されると、いろいろな別個の専門分野の組織によって独立的に作られたいろいろ なメタデータの共存が可能になる。より重要なことは、RDFの実現によっていろ いろなメタデータ基準で書かれたメタデータのためのPlug-and-Play(導入するだ けですぐに利用できる)環境が提供されるようになり、利用者の必要性に適合し た記述的メタデータ(descriptive metadata)を利用することが容易になることで あると考えられる。
メタデータの相互利用性を実現するために記述形式(syntax)、意味(semantics) 、および構造(structure)という3本の柱がある。DC-Simpleの定義が安定するに 従い基本的な情報資源記述の意味の基礎が固められる。記述形式は記述のための 文法規則を形式的に与えるものであり、単純なメタデータに関しては定義済みで ある(HTML 4.0のMETAタグ)。また、任意の複雑な構造を持つものに関しても検討 が進められている(Resource Description Frameworkにおけるassertion block) 。第3の柱である構造にはこれから注目が集まることになるであろう。たとえば 、エレメント内に書かれた複数の値を区切る記号を何にするか、名字と名前を書 く順序をいかにするかといった問題のように、情報資源の記述を行ってきたコミ ュニティの文化的な問題ともいえる。数多くの問題に関して完全な合意を得るこ とは不可能であるかもしれない。しかしながら、全体としての意味的な枠組みを 与えることで、少なくとも検索者が目標に意味的な近傍にまでたどり着けること を支援することができるようになると期待している。
a posteriori languageの多くは単独で定義を進める一人の作者によって作り出 され、そしてそれに従う小さなグループの中でのみ使われていた。運動が盛んに なるにつれ、言語が作られたはじめの頃からの使用者の間では、新しい単語や構 文を採用すべきであるかに関する議論がなされた。しかしながら、そうしたもの の多くは意見の一致を見ることのできないものであった。そこでの議論ではその 言語を日常に利用しようとする人と言語の専門家との間の要求の違いによるもの であった。そうした言語のひとつであるVolapuk ("World Speak")での議論は、 いわばMinimalistとStructuralistとの間の衝突によるものであった。Volapukの 発明者は自然言語にあるような十分な意味的表現能力を入れようとしたが、一部 の使用者は国際的な補助言語として利用が広がる可能性を高めるために簡明さを 残すように希望した。エスペラントの活動においても、たとえば曲折アクセント(circumflex) の使用に関する問題などでの議論があり、いろいろな版のものを推進する派閥に 別れた。Umberto Ecoは「こうした問題は人工言語にとっては避けられない問題 である。すなわち、単語というものは利用が広がらない間においてのみ意味的な 純粋性が保たれる。ところが、いったん利用が広がると変節者のコミュニティの 所有物となる。そして(最善を求めることは良いものを求めることの敵であるの で)その結果はBabelization(多くのことばができて互いにコミュニケーション できなくなるという事態)を招くことになる」と結論づけている[6]。
国連がエスペラントの採用を検討したことはあるものの、これまでに人工言語が 政府からの援助の獲得に成功したことはない。エスペラントの頑固な支持者は、 エスペラントの利用が広がるのはエスペラントが補助言語として利用される場合 のみであると考え、マスメディアでの利用を推進すること、標準の維持と新しい 提案の吟味、そして言語の発展を制御していくための国際的な管理組織を作るこ とを進めている。Ecoは、これまでの過去の失敗によって将来における補助言語 に対する政治的な合意を得るための試みが行われないことを意味するのではない と指摘している。また、Ecoは、日常的に生まれる新しい概念をも表現する能力 までも持つほど厳密にはする必要はないが、補助言語が成功するには言語の定義 を上から(トップダウン的に)与えることが必要であると考察している。
上からのトップダウン的なコントロールと同じように下からのボトムアップ的な 自然な変化によって解決することも必要であろう。二人の言語工学の研究者Donald Laycock とPeter Muhlhauslerが解答への道筋を示唆している。彼等は、自然言語はどん なものにでも対応し、かつ開放的であるが、その一方人工的に作られた言語は閉 じたものであり、規則によって厳密に縛られ、言語学的な自然さがなく、変化に は向いていない、と指摘している。人工言語が成功するには、言語の利用者であ る人間が規則を変更したり、あるいは作ったりすること、システムを状況に合わ せたり、意味に関する新たな取り決めをしたりすることがあることに言語の設計 者が対処しなければならないと彼等は論じている。そして、こうした方向で人工 言語が進歩していく上で、言語工学者は言語の利用者コミュニティがいかに自然 発生的に混成語(Pidgin)を作り出していくかということを十分に検討しなければ ならないと結論づけている。
商売を進める際に混成語が用いられるようになるなどして、使用者にとって言語 の利用価値が上がるに従い、ことばとしては落ち着き、語彙は広がり、話し手の 母言語として十分な柔軟性を持つようになる。そうなるには、全ての話し手の言 語的な要求にこたえられるものでなくてはならない。そうして、前置詞が入り、 単語が増え、そして文脈に依存しない構文が用いられるようになる。子供が青年 期前の重要な時期に混成語を母言語として用いながら成長すると、本能的な言語 能力で文法的に複雑な表現を加え、両親の混成語から文法的に豊かで表現力に富 んだ混合語(Creole)へと変化してゆくとの研究がある。混合語は正真正銘の言語 であり微妙な表現の構文要素や一貫した語順を持つ。しかしながら、この複雑化 の過程は世代が進むことによるものだけではない。混合語化(Creolization)まで には至らなかったが言語としては落ち着いたものになりかつ拡張もなされた言語 の例として十分に研究されてきた混成語にTok Pisinと呼ばれるものがある。ま た、これは前世紀においてはそれは150万もの人たちにとっての共通語(lingua franca) のひとつであり、パプアニューギニア議会での主要な言語であった。
こうした過程はインターネットを情報資源の共有地とする情報資源記述コミュニ ティにおいて起こってきたことと同じであろう。Dublin Coreは1994年の第2回World Wide Webの国際会議での立ち話から始まった。この年は一般の人たちがインター ネットのことを知るようになった年でもある。いろいろな情報資源記述コミュニ ティが作り上げてきた記述方法を単純化しハイブリッド化するDublin Coreにお ける努力から、値の属性を指定しないMinimalistと呼ばれる基本エレメント集合 (あるいはMinimalistと呼ばれる人達によって指示される基本エレメント集合) が作り出された。前に示したように旅行者は一般的に片言でしか話せないため、 いわば混成語で話しているようなものである。そのため、ヴァーチャルツーリス トのメタファはこの過程をうまく言い表わしていると言えるであろう。
利用者はセマンティクスとシンタックスにより多くのニュアンスを込めようとす るので、minimalistによって示される自然なPidginizationに続いて現れるもの は、再び複雑な内容を表そうとする動きであり、Creolizationである。その結果 混成語より表現能力に富む混合語化したメタデータが現れることになる。Dublin Core におけるstructuralistの展望は複雑な情報を表現しようという意図に基づくも のである。すなわち、より詳しい意味を表す新たなサブエレメントを作り出すこ とによって特定分野のコミュニティにとってより都合の良いメタデータの記述が 得られることになる。このふたつのグループ、すなわちより高い相互利用性を目 指すminimalistと、より高い意味表現を目指すstructuralistの間のトレードオ フは、自然言語での混成語と混合語のトレードオフにあたるものであると言えよ う。
Dublin Coreの発展過程はエスペラントのような人工言語の発展とは大きく異な っている。一連のワークショップの主導した人たちは新しい技術の発明者として ではなく、情報資源記述という分野で働いてきた人たちの持つ知恵を引き出し、 経験を集約することでDublin Coreの定義プロセスを進める役割を担ってきた。 このプロセスは前例がないほど電子メールやウェッブ上においたドラフト、メー リングリストを活用することによって効率よく進められ、また安価な航空券によ って数多くの実践家とDublin Coreに関心を持つ人たちが集まって標準を決定す るプロセスに参加することができた。
しかしながら一方、現在のコミュニケーションの道具だけでは何百、何千もの参 加者による合意を得ることは難しい。現在でも、Dublin Coreの活発なメンバー でさえもメーリングリストといろいろなワーキンググループでの議論に並行して 参加することは難しいと考えている。グループの詳細に関する決定が多数の電子 メールの山の中に埋もれてしまっているようなことさえもある。
混成語(Pidgin)も含めて、自然言語は使用されている間に変化していく。これと 同じ事がメタデータについても言える。また、自然言語の利用が広がり標準的な 言語になっていくのは、日常的な使用、継続的な技術革新、マスメディアや教室 、辞書における認知の広がりが互いに影響を及ぼしあうことによる。もしPidgin メタデータが自然に進化していくことができないほど厳しい制約が与えられるの であれば、このメタデータを技術革新にさらしたり、意味に関する合意を得たり 、適切な実践例を正式に認知したりするための公開討論の場を設けることが必要 になるであろう。この場は次に述べるInterlinguaのようなものでなければなら ない。
wordnetを一つのシステムとして統合するため、EuroWordNetでは言語の対ごとに クラスタを結ぶことにしている。しかしながら、この構造は言語の数が増えると 結び付けられる言語対の数が多くなるので新たに言語を加えることは非常に難し くなり、それを維持管理していくことは悪夢のように思えることさえある。この プロジェクトでは英語のwordnetに他の個々の言語のwordnet(すなわちmonolingual )を結び付けることも考慮した。しかしながら、 monolingualなwordnetを他の 言語のwordnetに写像すると、辞句の構成上の違いや言語依存の意味が失われて しまうことがあることがわかった。たとえば、イタリア語のditoは指(finger)で あり、またつまさき(toe)でもある。言語に依存した微妙な意味を他の言語で表 すことは非常に難しい。
以上のようなことから、EuroWordNetプロジェクトでは、 monolingualなwordnet を言語非依存のInterlingua−すなわち、全ての言語に共通な概念のフラットで 構造を持たないスーパーセット−に結び付けることにした。単語はInterlingua の中に含まれる最も近い意味を持つ要素に対して、等価関係(equivalence)ある いは近等価関係(near-equivalence)を用いて結び付けられる。図2はライオン(lion) が哺乳動物であり、つめのある足(paw)を持ち、たてがみ(mane)を持つことを表 す。ライオン、足、たてがみに対するオランダ語、スペイン語、英語およびフラ ンス語の単語が、Interlinguaに定義された対応する概念への並行するリンクに よって同義語であることがわかる。
図2:A cpnceptual interlingua between wordnets
言語に依存する辞句に基づいて概念間の関係を定めようとしても言語によって概 念の位置付けが異なることがある。そのため、Interlinguaの中では概念間は意 味的なリンクで結ばれていない。言い換えると、Interlingua内で概念間のリン ク付けを行ったとしてもそうしたリンクが全ての言語に対して合理的な意味を持 つとはいえない。このように設計することで各言語のwordnetによって多言語に よる豊かさや広がりを持ち続け、かつ一方で、たとえばditoがfingers、toes、fingers-and-toes に結び付けられるというように言語間での単語間の意味の関係の曖昧さを表すこ ともできる。
図3:Dublin Core as an interlingua between description models [7]
世界のどこかで"Dublin Core"というラベルを使って用いられたメタデータのサ ブエレメントとを記述的に結びつけることで、Dublin Coreは値には依存しないInterlingua とすることができよう。こうした結びつきによって作られる空間を(そこに参加 する人によって秩序が作られる)Dublin Core Marketと呼ぶことができよう。し かし、InterlinguaとしてのエレメントをDublin Coreの規範(Dublin Core Canon) として認定することを望む人もいるであろう。John Kunzeは将来の基準Coreにつ いて、地域や組織を限定した拡張や試験的な拡張を公表するメカニズムとそれら を正当と認め基準に組み込むための審査と認定のプロセスに関して論じている[8] 。Coreの維持管理には提案された追加が既存のサブエレメントと重複したり、衝 突していないかをチェックする必要がある。EuroWordNetの場合と同じように、 大きく異なる分野の関連語はInterlinguaの中にならべて登録することができる であろう。自然言語の辞書によくあるように、そうした定義はそのエレメントに 与えられた代替の意味を表すと考えることができる。Interlinguaは認定された エレメントからなる安定した基本要素部分(コア)と、コアを取り巻く正式には用 いられていない発展段階にある要素によって構成されることになるであろう。
また、Dublin Core Market自体は実践のための究極的な調停役であると考えるこ とができる。この場合、Interlinguaは単に実践の例を示すための目録として働 くのみであろう。すなわち、自動的にデータを読み、機関の重複等を考慮しなが ら利用状況を勘定するメカニズムとして働くのみであろう。特定のサブエレメン トがよく用いられること、すなわち相互利用性におけるそうしたサブエレメント の価値は、それらがいかに広く利用されるかによって上がることもあれば下がる こともある。
しかし一方、それは標準的な形を持たない言語のようなものであろう。たとえばAmerican Heritage という辞書の利用性評価に関する委員会(Usage Panel)のようなものをDublin Core は必要とするであろう。この委員会は、この辞書の編集者が実際の利用例の記述 と望ましい形式に関する規定との間のバランスをとることを評価するもので、辞 書の173人の著者に加えて批評家や学者の助けを得て、順序、明確さ、正確さと いった基本的な言語学的美点に対して意味のある項目を評価する役割を持ってい る。
MarketとCanonの両方をカバーするシステムであれば、どのような形式であれ、 あるいは言語であれ新しいサブエレメントを提案し公表することでDublin Core の発展に寄与することができる。Dublin Coreのコミュニティが、DDCのように言 語に依存しない何らかの方法でエレメント名を定義しようとしない限り、EuroWordNet で採用されたように英語で書かれた概念の辞書的な定義のようなスタイルを踏襲 するのが好都合であるように思える。(たとえば、脊椎の指状の部分、新陳代謝 される物質。)
RDFの開発者と協力し、Dublin Coreコミュニティのメンバーはこうした機能を実 現するために必要な簡単なレジストリの設計に参加している。Renato Iannella とEric MillerによるとRDFのレジストリは図4に示す機構を提供するであろうと のことである。この図で、ドイツ語のDublin Coreは基準Dublin CoreからDC.title という機械可読形式の名前を継承するが、そのラベルや人間が読むためのエレメ ント記述にドイツ語のテキストを重ね合わせる。
図4:A registry model in RDF
この概念はシンプルではあるが能力は高い。それはメタデータのエレメントから 、定義と正当性の保証を与える参照モデルへのリンクをRDFが与えることになっ ているためである。Dublin Coreに基づくいろいろな実現例におけるサブエレメ ントがInterlinguaとして働く基準Dublin Coreへリンクを持つのみならず、基準 自身から機械可読形式を得ることもでき、それによってエラーが起きる危険性を 減らすことができる。この分散レジストリを言語間参照のために利用する多言語 検索ツールの開発にはいろいろな研究が必要となるであろう。
これを実際に利用するには実際的な観点からの問題が多く残されている。1997年12 月時点ではUnicodeはまだ世界中で利用可能であるとはいえず、ごく近い将来に どこででも表示可能になるといえない。フォントの問題や競合関係にある標準間 の問題があり、特に日本語に関してはこうした問題は大きい。たとえばブラウザ 上での表示のためにDC-simpleをビットイメージとして送るよりは、日本の図書 館情報大学で開発されたMHTMLを使うことで解決可能な問題であると思われる。 これはタイ語、日本語他の言語に関してヘッダ、フォントをテキストと一緒に送 り、Javaの利用できるブラウザ上で多言語のテキストを読めるようにするもので ある[16]。
[2] Priscilla L. Caplan and Rebecca S. Guenther. Metadata for Internet Resources: the Dublin Core metadata elements set and its mapping to USMARC. Cataloging and Classification Quarterly 22(3/4): 43-58, 1996.
[3] Michael Day. Metadata: Mapping between Formats. UKOLN (confirmed 30 September 1997). http://www.ukoln.ac.uk/metadata/interoperability.
[4] Lorcan Dempsey and Stuart L. Weibel. The Warwick Metadata Workshop: a framework for the deployment of resource description. July/August 1996, D-Lib Magazine, July/August 1996. http://www.dlib.org/dlib/july96/07weibel.html.
[5] Dublin Core Homepage. http://purl.org/metadata/dublin__core.
[6] Umberto Eco. The Search for the Perfect Language. Oxford: Blackwell, 1995, pp. 319, 346.
[7] Jon Knight and Martin Hamilton. Dublin Core Qualifiers, ROADS Project, Department of Computer Studies, Loughborough University, http://www.roads.lut.ac.uk/Metadata/DC-Qualifiers.html, 1997.
[8] John Kunze. A Unified Element Vocabulary for Metadata. http://www.ckm.ucsf.edu/personnel/jak/dist.html, 1996.
[9] Carl Lagoze, Clifford A. Lynch, Ron Daniel Jr. The Warwick Framework: a Container Architecture for Aggregating Sets of Metadata. TR96-1593, 21 June 1996. Acrobat version: http://www.nlc- bnc.ca/ifla/documents/libraries/cataloging/metadata/tr961593.pdf.
[10] Donald C. Laycock and Peter M"uhlh"ausler. Language Engineering: Special Languages. In: An Encyclopaedia of Language. London: Routledge, pp. 843-875, 1994, p. 871.
[11] Ralph LeVan. Dublin Core and Z39.50: Personal Reflections. http://cypress.dev.oclc.org:12345/"rrl/docs/dublincoreandz3950.html.
[12] Andre Martinet, 1991. Cited in Eco, p. 332.
[13] Geoffrey Nunberg. Usage in the American Heritage Dictionary: the Place of Criticism. In: The American Heritage Dictionary of the English Language, Third Edition. Boston: Houghton Mifflin Company, Pp. xxvi-xxx, 1992.
[14] Diann Rusch-Feja. Dublin Core Version 1.0 in German. http://www.mpib-berlin.mpg.de/DOK/metatagd.htm, 1996.
[15] Praditta Siripan. Dublin Core in Thai. National Science and Technology Development Agency, Bangkok, Thailand, 1997.
[16] Tetsuo Sakaguchi, Akira Maeda, Takehisa Fujita, Shigeo Sugimoto, Koichi Tabata. A browsing tool for multi-lingual documents for users without multi-lingual fonts. Proceedings of the 1st ACM International Conference on Digital Libraries (March 20-23, 1996), pp. 63-71.
[17] Piek Vossen, Pedro Diez-Orzas, Wim Peters. Multilingual design of EuroWordNet. http://www.let.uva.nl/"ewn/Vossen.ps, 1997.
[18] W3C Web Site: Resource Description Framework. http://www.w3.org/Metadata/RDF.