しかし、一方でこれらの集合知を用いた、デジタルアーカイブを構成していく上 で最も重要なことは、各資料に関するメタデータの更新をどのようなプロセスで 行っていくかという点である。Wikipediaなどの百科事典の場合は、様々な事項 に関して、一定程度の文章で叙述する形式を採用しているが、メタデータの場合 は作品名のほか、作者、成立年代、資料の種別など予め決められた項目に関して 、極めて簡潔で短い信頼性のある情報を記述する必要がある。そのため、集合知 を集めた上で、それらの情報の中から必要なものを選択し、編集し、掲載する過 程が必要である。これらに関しては、非公開の作業によって編集され、かつ公刊 後も利用者からの修正や付加情報を受け付けることを前提としていない刊本の目 録や図録とは異なる情報の編集・更新フローが必要である。そのため本研究では 、コミュニティを用いて集合知を集約した上で、それらの内容をメタデータに反 映させる具体的な運用フローを検討し、その内容について実証実験を行う。
文化資源統合アーカイブ全体に関しては拙論において既にその概要が解説されて いる(研谷 他[2006])[6]。また、本アーカイブで活用されている、オントロ ジの構造とその機能に関する内容に関しても拙論(研谷 他[2007])[7]におい て概説され、またコミュニティのユーザ側から見た機能とユーザによる評価概要 に関しても筆者による研究発表においてその内容が解説されている(研谷 [2007])[8]。 本研究ではさらに、コミュニティ機能を用いて、資料に関する集合知 を集め、実際のメタデータを変更する運用フローについてその概要と課題につい て考察する。
メタデータを更新する内部の体制としては「段階1」と「段階2」までを想定し 準備を行った。「段階1」は、内部の単数の管理人がメタデータの修正を行う権 限をもち、コミュニティにおける指摘に対応し、メタデータを修正するフローで ある。また、「段階2」では、専門的な知識を必要とする内容が発生するため、 各資料の内容に精通する内部の担当者を決め、管理者と担当者との協議において それらの情報内容の修正を行う運用フローである。これら、2つの運用フローを 適宜利用しながら、コミュニティにおけるユーザからの意見に対応することとし た。
一方後者に関しては主に歴史写真資料に関して、表1にあるような内容が指摘さ れた。これらの内容は専門的な内容に関する指摘であったため、一部「段階2」 に移行し、内部の研究者の協力を得て確認をとった。その結果、「No.9」「No.10」 に関しては、コミュニティによる指摘の信憑性が高いとされ、メタデータの 変更、もしくは併記などが望ましいことが確認された。一方で、「No.11」から 「No.15」に関しては、指摘が事実である可能性が高いものの、内部の担当者だ けではその可否を判定できないと判断した。そのため、これらの項目に関しては 、引き続き外部の専門家をあわせた検討が必要であり、「段階2」に加えて外部 の協力者を加えた検討調査を行う、新たな「段階3」を策定することが必要とな った。特に歴史写真などの資料に関しては、製作者を特定することが難しく、写 真だけではなく、様々な傍証資料を参照した上で、確認する必要がある。そのた め、これらの資料に関してはすでに内部だけではなく、外部のより多くの関係者 よる審査や調査作業が必要であり、これら「段階3」を設けることとした。但し 本実証実験の期間中でこれらのフローの構築を行うことは難しいため、これらの 「段階3」を設けることは今後の課題となった。
しかし、これらの人員を十分に配置することは人的リソースが限られているため 容易ではない。そのためコミュニティの情報を資料のメタデータに反映させる段 階に至るまでは、より多くの時間を要することとなる。そのため、コミュニティ などにおける様々なユーザ意見についてはそれらを、全面的に閲覧可能な情報と し、ユーザの責任においてそれらの情報の信憑性を判断し活用する一方で、より 多くの時間と調査をかけた上で、メタデータ上には正式に反映させるという時間 的、手続き的な段階を分けることが必要であると考えられる。
このような点からコミュニティにおいて集合知を集める機能を備えたデジタルア ーカイブのメタデータ更新フローは、図1のような形態が現状では最も現実的な 形式であると考えられる。図1で示したフローにおいては、コミュニティにおけ る情報はメタデータ内容とは一線を画し、ユーザの責任において、その内容を判 断、利用する情報と位置づけられる。そしてそれらの情報の中でより正確性が高 く、メタデータにも反映すべき情報があった場合は、内部の人間だけではなく外 部の専門家を調査員もしくは審査員として、メタデータ更新の検討に対して協力 を得ることが望ましい。そしてその後のフェーズにおいは、編集長にあたる内部 の担当者によって責任を明確にした上で、追加・更新などが決定される必要があ る。その場合も、誰のどのような意見によってどのような調査が行われ、どのよ うな文献資料、および各種一次資料によって該当メタデータの更新が行われたか を示すことが必要である。この点はオンラインの百科事典のように匿名の複数の ボランティアなどによる緩やかな審査よりも、より更新・編集に明確な根拠と責 任を負わせたフローとなっている。このように編集責任を明確にし、誰がどのよ うな理由によって、メタデータが変更・更新されたかを明確にすることによって 、各メタデータが学術論文や学術文献に引用されうる信用を獲得する情報になる と考えられる。
以上のようにコミュニティなどの活用をし、様々な知識情報を取得することと、 学術研究基盤としての信頼性を保った情報を格納する点の二つを両立しようとす る場合は、コミュニティにおいてはユーザによる自由な情報の書き込みを許容す る一方で、それらの情報を資料のメタデータに反映する段階で、外部の専門家を 含めた調査・審査委員の協力を仰ぎ、情報内容を調査し、編集責任と情報更新の 理由を明確にした上で、メタデータを編集して行くフローを確立することが必要 である。このことによってオンラインコミュニティを実装したデジタルアーカイ ブが学術研究に耐えうる研究基盤ツールとなることが可能となるが、このような 運用フローを構築することは様々な人的リソースを必要とすることとなり、その 構築には一定程度の時間を要する。そのため、これらの運用フローが定着し、実 際に間断なく運用されていくためには、集合知を用いながら、運営されるデジタ ルアーカイブの理念と内部運用フローをよりオープン化し、学術コミュニティや 一般社会における理解を十分に深化させていくことが必要である。
産業能率大学、国立民族学博物館、高萩市歴史民俗資料館、長久保赤水顕彰会 、港区立港郷土資料館、(有)渡辺出版、ニューカラー印刷(株)のご協力を頂 きました。さらにデジタルアーカイブの構築に際しては津田光弘氏、(株)堀内 カラーの協力を頂きました。関係の皆様に厚く御礼を申し上げます。
[1]Wikipedia:http://ja.wikipedia.org/wiki/(2007.10)
[2]National Maritime Museum :http://www.nmm.ac.uk/(2007.10)
[3]The Drexel Digital Museum Project http://digimuse.cis.drexel.edu/(2007.10)
[4] Kathi Martin, The Role of Standards in Creating Community, Proceedings of the 13th international World Wide Web conference,pp35-41,2004
[5]文化資源統合アーカイブ:http://cr-arch.chi.iii.u-tokyo.ac.jp/(2007.10)
[6]研谷紀夫,馬場章 他 "オントロジとコミュニティを用いた統合型デジタルア ーカイブの構築の場合" 情報処理学会シンポジウム じんもんこん2007論文集,情 報処理学会, pp57-62、2006
[7]研谷紀夫,馬場章 "文化資源オントロジの構築とその活用" 情報知識学会誌, 17巻 2号,pp129-134,2007
[8]研谷紀夫 "デジタルアーカイブにおけるオンラインコミュニティの活用とそ の課題" 情報文化学会講演予稿集15,pp115-118,2007