そこで本稿では,ネットワーク情報資源の効果的な情報システムの確立のための第 1歩として,ネットワーク情報資源の特性を,情報を管理する上でも提供,利用する上 でも重要な視点となる,「情報の単位(まとまり)」について,見ることにする。そし て,この情報の単位に関する世界的な動向の1つとしてURI,その中でも特にURNについ て紹介し,考察を加えることにする。
ネットワーク情報資源および図書館資料の性質を整理するにあたって,いくつかの 視点がありえるが,ここでは図書館情報学においても重要である,情報の「単位」[1] というものに注目してみたい。情報の単位とは,「その外部とは何らかの区別(境界) によって隔たれており,内部は何らかの一貫性や共通性を持っているようなまとまり」 を言う。この情報の単位はさらに作業的に,「物理的単位」と「内容的単位」とに分 けて考えてみることができる。
「物理的単位」とは,「その中味が何であるかにかかわりなく,外側から見てわか るような,何らかの形態・形式的な境界によって,外部と区切られているようなまと まり」である。例えば,図書館資料においては,「紙」(正確にはインクや綴じ糸など も含む)という物理的な形態によって,その外側とは区別された「冊子体」という存在 が物理的単位の重要な一つとして挙げられる。ネットワーク情報資源においては, 「ファイル」や「ディレクトリ」といった,コンピュータによって電子的にその外側 と区別されるような形態・形式でまとまっているものが物理的単位の例となる。
一方「内容的単位」とは,「文字,画像,音声などによって表象されるものが,外 界とは異なる,何らかの一貫性や共通性のもとに集合しているまとまり」を言う。図 書館資料においては,例としては,一定の「書名」のもとに,一定の「著者」によっ て書かれた「テキスト」という一貫性を持ったまとまりは,「著作(work)」と呼ばれ る内容的単位である。ネットワーク情報資源においては,あるテーマのもとにリンク を集めた「ホーム(Web)ページ」の内容のまとまりや,あるいは,図書館資料と同様の 「著作」というまとまりなどを内容的単位ということができる。
これは具体的には,次のようなことを意味する。すなわち,図書館資料は,一旦印 刷されて出版されてしまい,「冊子体」と「著作」との関係が固定化すれば,その関 係が変化することは比較的少ない。一方ネットワーク情報資源は,例えば「ファイル」 と「ホーム(Web)ページ」との関係は,ファイルに対し,削除,移動,変更,複写など の操作を与えることによって,簡単に変化してしまう。また実際にそうした操作は, 比較的頻繁に,かつ容易に行われる。あるいは,「ファイル」に新たな「ページ」へ の「リンク」が加えられるとか,他の「ファイル」とまとめて,一つの「ページ」に するなどの操作が行われる場合も,物理的単位と内容的単位の関係が変化する例とし て挙げることができる。
(A)一つは,ネットワーク情報資源に何らかの制約や制限を課し,その性質を図書館 資料の性質に近づける,という方針である。こうすれば,技術的な問題を含む他の課 題は解決しなければならないが,少なくとも単位という視点からは,図書館資料と同 様の方法によって,ネットワーク上に図書館サービスを展開することが可能となる。
(B)今一つは,ネットワーク情報資源の性質に対応した,新たなメカニズムを持った, 情報サービスを作りあげる,という方針である。図書館のノウハウを拡張,拡大,あ るいは新しいノウハウを案出して,図書館資料では想定されていなかった,ネットワ ーク情報資源の性質にも対応しようというのである。こうすれば,ネットワーク情報 資源は現状のまま,制約や制限を課すことなく,情報サービスを展開することが可能 となる。
ただし,(A)(B)の方策は背反するものではなく,最終的には,両者のバランスをと りながら具体的な方法を構築していくことになるだろうが,ここでは,議論を行うこ とが目的であるので,便宜上,両者を区別しておく。
さて現在,ネットワークの世界では,さまざまな情報組織化,蓄積,提供,検索の ための試みが行われており,広く普及して,一般に使われているものも少なくない。 例えばWWWの世界で利用されている検索エンジンは,その試みの一つであるといえるが, これはネットワーク情報資源(の生産)には制約や制限を加えず,情報の組織化,検索, (アクセスの)提供を実現しようとするものである点で,(B)の方針が強く表われている と解釈できる。またIETF(後述)によって議論,提案,整備が行われているURI(後述)を めぐる構想も,情報の組織化,提供の試みの1つである。WWWブラウザの普及などによ って,広く認識されているURL(URIを構成する一つ,後述)のみを見ると,情報(の生産 )には制限や制約を加えないという点で,URIもやはり(B)の方向性を志していると解釈 できそうである。しかし,URIをめぐる議論を検討し,とりわけ現在議論の盛んなURN をも含めてURIの全体像を見ると,実は(A)の方向性を目指すものとも解釈できる。こ のことについて,次章以降でURI,URNを検討した上で,改めて考えてみたい。
URIは,URL(Uniform Resource Locator), URN(Uniform Resource Name), URC(Unif orm Resource Characteristic)という三者から構成されている[5]。このうちURLは, ネットワーク上の情報の物理的な配置場所(アクセス先)を記述するものであり,今日 WWWブラウザなどでよく目にするものである。またURNは,「情報資源の識別同定を行 う」という目的のために考えられた,情報資源に付与される「名前」である。ネット ワーク上では日常的に,情報は世界規模で移動されたり,複製されたりするが,その ような状況で,特定の情報を識別したい(例えば,ある情報は既に自分が入手している 情報と同じものか否かを判断したい)というニーズに応えるためのものがこのURNであ る。また,さらにこのURNを用いて,実際の情報資源自体や,情報資源の所在情報(例 えばURL)や書誌的な情報(例えば次に説明するURC)にたどり着く「レゾリューション」 という機能もURNのサービスとして求められている。そしてURCは,情報資源のさまざ まな特性に関するメタ情報,例えば,ある情報資源の作者(著者),データ形式,アク セス制限,価格などを記述するものである。これらを図書館資料の比喩でたとえると, URLは情報の配置場所を示す配架記号にあたり,URNは情報(の内容的単位)の識別同定 に用いられるISBN[6],ISSNなどの各種の識別コードにあたり,URCはさまざまな書誌 的情報(データ)に相当する。
以下では,このようなURIの中でも,本稿の論点である情報単位の識別に特に関わる URNについて詳しく見ていく。
各ネームスペースには,そのネームスペース内全体を管理する「ネームスペース管 理者」が存在する。またネームスペース管理者の下には,実際に資源名を付与したり, 付与する権限を誰かに委任する「ネーミングオーソリティ」が存在する。なお,ネー ムスペースによっては,ネームスペース管理者とネーミングオーソリティが同一であ る場合などもあり,ネームスペース内の構成は自由度を持たせてある。
まとめると,世界規模で資源名を管理するために,「中央機関(ネームスペース登録 機関)において,資源名の管理や付与を行う集団(ネームスペース)を登録し」,「各集 団(ネームスペース)ごとに自身が扱う情報資源の名前を決定する」と階層的,段階的 な仕組みをURNは採っている。この仕組みをURNの表記方法に反映させることで,情報 資源に対する統一的な名前を付与できることになるが,このURNの一般的な表記方法は, 「URN:ネームスペースID(NID):ネームスペースごとの情報資源名(Namespace Specifi c String = NSS)」である。
・一般例 URN:NID:NSS
・表記例1 URN:ISBN:XXXXX URN:IANA:XXXXX
・表記例2 URN:inet:p.u-tokyo.ac.jp:XXXXX
URN:inet:e.u-tokyo.ac.jp:XXXXX
表記例1の場合,ISBNとIANAという2つのネームスペースで,それぞれ別の情報資源 に対して,XXXXXという同じ名前が偶然付与されたとしても,URN全体としてはネーム スペースIDの部分によって2つの情報の識別が可能である。また表記例2の場合は,同 じinetというネームスペース内で,各ネーミングオーソリティが,別々の情報資源に 対して,同じXXXXXという表記を用いても,ネーミングオーソリティ自身を表す部分 (p.u-tokyo.ac.jpとe.u-tokyo.ac.jp)で差異が存在するので,URNによって2つの情報 資源を識別できることになる。
ネームスペースのID(= NID。3.2.1の表記例1ではISBNやIANAなど)が登録してあるシ ステム(NID Registry)にURNを入力すると,そのシステムはURNから「ネームスペース ごとの情報資源名(= NSS)」の部分を抽出する。そしてさらに,このNSSにネーミング オーソリティ(Naming Authority = NA。3.2.1の表記例2ではp.u-tokyo.ac.jpなど)自 身を表す文字列があるかどうかを判断し,あればNIDとNAを,無ければNIDのみを,レ ゾリューションサービス登録システム(Resolution Authority Registry)に引き渡す。 このシステムにはレゾリューションを行う複数のレゾリューションサービス(のID)が 登録されており,その中から,引き渡されたNIDやNAの情報を扱うレゾリューションサ ービスが,何らかの条件によって選択される。そして選択されたレゾリューションサ ービスへ,最初に入力したURNが引き渡され,最終的には,そのサービスが提供する結 果(情報資源自体,情報資源の所在情報(URLなど),情報資源の書誌的情報(URCなど)) が得られる。
全体的にまとめれば,URNに関わる管理は,出版流通におけるISBNやインターネット におけるDNSに見られるような階層的な管理方法を採っており,各階層の機関が,自分 が付与する資源名を管理することで,URN全体として統一的な命名の仕組みを持ってい る,と言うことができる。また,各階層内の資源名の管理の仕方に関しては,自由度 が持たせてあるとも言える一方,未決定の部分や考察されていない部分があるとも言 える。現在は,URNの実現,普及に向けて,資源名のより具体的な付与,管理方法の議 論が待たれている。以下ではそのような議論のための論点を整理することにする。
しかし,実際の個別のURN付与作業においては,名前は1つの情報の「内容」的まと まりに対応して付与されるため,情報「内容」の識別作業を行わねばならない。まず 名前を付与すべき情報内容のまとまり,すなわち情報単位を認識せねばならないが, 情報が互いにリンクされるハイパーテキスト構造の情報資源に代表されるように,ネ ットワーク情報資源には情報の内容的単位の認定が困難な場合もかなり存在する。ま た内容的単位の識別が比較的容易である場合でも,同じ内容とも受け取られる複数の 情報資源の,形式が異なる場合(例えばPostscript形式のものとPlain Text形式のもの )や,言語が異なる場合(例えば英語と日本語),同じ名前を付与すべきかといった点な ども,個別の情報資源を見ながら考慮せねばならないだろう。
このように,1つの名前を1つの情報単位に対応させるといっても,情報内容の認定 に関わってくるため,情報の内容的まとまりについて従来考察してきた,図書館情報 学における情報組織化の議論を参考にし,またネットワーク情報資源の特性に即しな がら,URN付与作業を行っていく必要があるかもしれない。
しかし「4.1.1 固有性」の場合と同様に,運用の面では解決すべき問題がある。例 えば,ネーミングオーソリティ以下の下位レベルの資源名管理で,各管理者の責任の もとに名前が付与されるわけであるが,出版流通におけるISBNのように名前をきちん と管理することで利益が得られるような場合には,命名機構の下位レベルにあたる出 版者も正確な管理を行うと考えやすい一方,利害関係とは関係なく情報を提供,利用 しているようなホームページの管理者が,名前を管理し続けていくことは,動機の面 からも困難な場合が生じると考えられる。また,大学など管理者の構成員が比較的頻 繁に変わると思われる機関での,継続的な管理も難しい面がある。つまり,ISBNは出 版者という比較的存在の安定した機関が管理主体であったので,実用に耐える安定し た名前管理が可能であったが,ネットワークの世界では,そのような安定した管理主 体が存在しにくいのである。URNの「持続性」は,安定した管理主体の選択や維持とい った部分に大きく依存することになるだろう。
他にも,情報内容に関わる,名前と情報資源の組の維持方法の問題がある。例えば, ネットワーク情報資源においては,誤字,脱字が存在した場合はすぐに訂正したり, 少量でも新たな情報があれば,直ちに既存の情報に付加したり,といったことを比較 的容易に行うことができるが,このような情報内容の変更のどの段階で新たな名前を 付与するか,という問題である。僅か一文字訂正するたびに新たな名前を付与すれば, 無数のほぼ同様な情報に対して無数のURNが付与されてしまい,利用しにくい資源名と なってしまう可能性がある。このようなことは従来の出版流通の世界では,例えば, 図書の「版」レベルの内容変更があった場合は新たなISBNを付与するが,「刷」レベ ルの変更ではしない,といった大まかな線引きも可能であったが,頻繁に内容変更が 行われうるネットワーク情報資源では,資源名の管理はより複雑なものになるかもし れない。
出版流通におけるISBNは,図書に代表されるようなパッケージ型のメディアの情報 資源を中心的に記述すればよいため,名前を管理する国や出版者といった管理単位ご とに名前の記述法を工夫して変える必要はない。しかしネットワークでは,情報がさ まざまなプロトコルやサービス形態で提供されるため,それぞれに適した名前を付与 せねばならない。このような多様な情報提供形態に対応するために,URNはネームスペ ースごとに自由な記述方式を採ることを想定している。これは管理の側,命名する側 から見ると,非常に利用しやすい記述方式であるが,情報利用者の側から言えば,情 報サービスごとに資源名の記述方式が大きく異なる可能性もあり,資源名の記憶や転 写が難しいといった問題も現れるかもしれない。
一方,利用者の側からは,URNサービス利用時における検索過程(ログ)の情報など, プライバシーに関わる情報の保護がURNのシステムに必要な機能であろう。逆に情報提 供者の側では,顧客(自分が提供した情報の利用者,読者)情報の保護の機能が,商用 のレゾリューションサービス機関などでは特に必要かもしれない。
URN普及の鍵をにぎるのは,一つはコストの問題であろう。例えば従来の出版流通の システムをネットワーク上にのせ,それによって利益を得ようとするような集団には, URNによる情報管理は有効なので,少々コストがかかってもURNを導入しようという意 識があるかもしれない。しかし,現在あるURLによって機能しているシステムに満足し ている人々は,URNを管理する労力や時間やお金を使うということは考えにくい。また URNの管理を責任を伴わない善意に基づいて行う,という考え方では,世界規模でかつ 大量の情報に対して安定したサービスは行いにくい。現実的には,コストをかけてま でURNによる管理を行うか否かで,特定の情報資源をURNサービスの対象とするか否か を判断することになるかもしれない。できるだけURNを普及させようとするならば,当 然諸コストを低くする工夫が必要である。
一方,URNを広めるための人的な努力も必要である。URNを提供,利用する際には, この4章で述べているようなURNの持つべき機能についての知識が必要となるが,その 知識を広く伝達するような仕組みも必要である。現在日常的に利用されているシステ ム(メーリングリスト,ニュースなど)の利用のルールでさえ,新規の利用者に,きち んと伝達されているとは言いがたい。URNに必要な知識を整理し,正確に伝達する仕組 みを確立しなければ,何らかの障害が,特定の集団だけでなく,URNの性格上世界中に 広がる可能性もある。障害を引き起こさないまでも,URNを使いにくいものにしないた めにも,この要件はきちんと考慮すべきであろう。
また,URNが普及するためには,4.1.4のURNの持つ簡易性というものが必要であると 同時に,URNの記述やそのレゾリューションシステムを利用するための,使い勝手のよ いインターフェース(ブラウザ)の出現が重要であると言える。URL(に対する知識)がM osaicやNetscapeによって世界的に一気に普及したように,URNにおいてもさまざまな ネームスペースの情報資源を統一的かつ効率的に利用できるインターフェースの出現 が必要であろう。
筆者らは,ネットワーク情報資源の提供サービスの方向性として,従来の出版流通, 図書館が行なってきたサービスこそが適当と考えているわけではない。冒頭にも述べ たように,自由で多様な情報の提供,利用こそがネットワーク情報資源の特長である。 その多様なサービスの一つとして,URIによる情報サービスは存在しているのであるが, そのようなサービスへのニーズは明らかにあるし,また,そのような形態でサービス を考えるならば,従来図書館情報学において議論してきた情報組織化,書誌コントロ ール,といった領域の知見を,役立てることができると考えられるので,さまざまな 問題,要件が存在してはいるが,このURIの考え方は妥当な方向性の一つであると結論 づけられるだろう。
和中幹雄 資料の把握 <丸山昭二郎編『講座 図書館の理論と実際 3 目録法と書誌情 報』雄山閣,1993> p. 149-169.
がある。なお本稿においては,目的に従って議論を単純化するため,必ずしも「著作」 などの用語を厳密な定義のもとに使用していない。
[2]IETFについては
<URL:http://www.ietf.cnri.reston.va.us/home.html>
を参照のこと。
[3]URIに限らずIETFが提供するカレントな情報は
<URL:http://ds.internic.net/ds/dspg0intdoc.html>
などからアクセスできる。また,URI WG関連の情報は
<URL:http://www.ics.uci.edu/pub/ietf/uri/>
<URL:http://www.ietf.cnri.reston.va.us/html.charters/uri-charter.html>
にもまとめられているが,情報の更新が遅れている部分がある。他に,
野末俊比古,福田求,影浦峡“ネットワーク情報資源における書誌的記述の標準化: IETFによるURI構築への展開”『情報・ドキュメンテーション標準化ニューズレター』 No. 8, 1996.6.14, p. 2-6.
においてURI WGの議論がまとめられている。
[4]なおURI WGは当初の目的を達成したため,現在は閉止されており,次の段階として, URNに関するBOF(Birds Of Feather)が設けられ,ここをベースにして,新たに正式な URNのWGが組織されようとしている。
[5]これにURA(Uniform Resource Agent)を加えるという提案もあるが,具体的には未 確定な要素が多く,本稿では除外する。
[6]URNの比較の対象となるISBNについては,例えば
松平直壽『コードが変える出版流通 ISBNのすべて』日本エディタースクール出版部, 1995. 149p.
を参照のこと。
[7]Daigle, Leslie L.; Faltstrom, Patric; Iannella, Renato. A Framework for the Assignment and Resolution of Uniform Resource Names. Internet-Draft(draft-daigle-urnframework-00.txt). June 13, 1996.
[8]Daniel, Ron; Mealling, Michael. Resolution of Uniform Resource Identifiers Using the Domain Name System. Internet-Draft(draft-daniel-naptr-00.txt). June 13, 1996.
[9]Girod, Lewis; Sollins, Karen R. Requirements for URN Resolution Systems. Internet-Draft(draft-girod-urn-res-require-00.txt). June 13, 1996.
[10]Sollins, Karen; Larry, Masinter. Functional Requirements for Uniform Resource Names. Request for Comments 1737. December 1994.
[11]URI関連の最新の議論はメーリングリストにおいて行われている。 URIのメーリングリスト uri@bunyip.com のアーカイブは
<URL:http://www.acl.lanl.gov/URI/archive/archives.html>
URNのメーリングリスト urn-ietf@bunyip.com のアーカイブは
<URL:http://smash.gatech.edu/archives/urn/>
である。