Digital Libraries へのアプローチ − 米国で開催されたWorkshop, Conferenceに出席して 杉本重雄 図書館情報大学 〒305 茨城県つくば市春日1−2 tel: 0298-52-0511 fax: 0298-52-4326 email: sugimoto@ulis.ac.jp 概要 米国における国家情報基盤計画(NII: National Information Infrastructure)の中でDigital Libraryの重要性が 認められ,Digital Libraryに関する研究がいくつもの大学で進められている。筆者は,本年5月に ニュージャージー州NewarkにあるRutgers大学で開催されたワークショップ"1994 Workshop on Digital Libraries: Current Issues"と,同じく6月にテキサス州College StationにあるTexas A&M 大学で開催され た会議"Digital Libraries '94: The First Annual Conference on the Theories and Practice of Digital Libraries"に 参加した。本稿では,両会議の報告をし,米国を中心とした現在のDigital Library研究の動向について 考察する。 Approaches to Digital Libraries - report from Workshop and Conference on Digital Libraries in U.S.A. Shigeo Sugimoto University of Library and Information Science 1-2, Kasuga, Tsukuba, Ibaraki 305, Japan phone: +81-298-52-0511 fax: +81-298-52-4326 email: sugimoto@ulis.ac.jp abstract With the initiative to build National Information Infrastructure, it has become much more important to develop digital libraries. Research projects of digital libraries are being initiated at number of universities. The author attended "1994 Workshop on Digital Libraries: Current Issues" held at Rutgers University (Newark, NJ, May 1994), and "Digital Libraries'94: Conference on the Theories and Practice of Digital Libraries" held at Texas A&M University (College Station, TX, June 1994). This paper reports the workshop and the conference, and discusses the approaches to digital libraries in U.S.A. and other countries that were talked and discussed in these meetings. keywords Digital Library, Electronic Library, NII (National Information Infrastructure), Internet, Mosaic, Digital Library Projects 1. はじめに 筆者は機会を得て,本年5月に米国ニュージャージー州NewarkにあるRutgers大学で開催された ワークショップ"1994 Workshop on Digital Libraries: Current Issues"と,テキサス州College Stationにある Texas A&M 大学で開催された会議"Digital Libraries '94: The First Annual Conference on the Theories and Practise of Digital Libraries"に出席した。Digital Libraryは,米国の国家情報基盤計画(NII: National Information Infratructure)上で情報の蓄積と流通を進めるための重要課題としてとらえられ,NSF, NASA, ARPA, NIH等による研究助成が行われ,様々な分野で研究開発が推進されている。また,世界 的情報基盤(GII: Global Information Infrastructure)の観点からも,多様な文化と言語による情報の蓄積と 流通のためにDigital Libraryの果たす役割は大きい。 Digital Library[4][6]は,多様な形態,多様な内容かつ大容量のデータを,多数でかつ多様な利用者 に提供することが要求される。図書館には人類の持つ知識が蓄積されてきているのであるから,図書 館の役割をするシステムを構成しようというDigital Libraryの研究は,単なる新しい分散型の情報シス テムというべきものではなく,非常に広範囲な分野にわたるものである。そのため,計算機科学や図 書館情報学分野はもとより様々な主題分野にまたがるテーマである。また,知的財産権(Intellectual Property)の問題にも深く関連する。発表の多くは大学関係からなされており,これから始めるDigital Library Projectの話題,Digital Libraryに関するさまざまな要素技術,Digital Libraryの利用技術等,広い 範囲をカバーしていた。(以下,本稿ではRutgers大学におけるワークショップをDLW/CI,Texas A&M大学における会議をDL'94と記す。) Digital Libraryは,それ自身が教育,医療と並んでNIIにおける重要な分野であるとともに,教育, 医療とも深く関係する分野である。例えば,教育分野におけるK-12project(注1)では,ビデオ教材を 始め様々な情報を教育目的に提供するDigital Libraryが必要とされる。また,医療分野では様々な装置 を利用して取り込み,様々なメディアに記録した医療情報を共有する必要がある。こうした機能は Digital Libraryとしてとらえられるものである。また,Digital Libraryのprojectに関する発表には,教育 や医療分野の他にも,科学技術情報,環境科学,植物学,人文科学,社会科学等,それぞれの分野を ふまえたprojectが進められている。 両会議とも会議に関する案内はInternetを通じてなされた。Net News による会議の開催通知の他, MosaicのHome Pageをおいてadvanced programやabstract,宿泊や交通手段に関する情報等が提供され た。また,DL'94のProceedingsはMosaicを介して全文を入手することができる[9]。(残念ながら,図 表などは含まれていない。)これらの情報に関するMosaicのHome Page のURL(注2)を本論文のお わりに列挙した[M5][M8][M9]。 現在,Net NewsやMosaic(WWW, Gopher, WAIS, etc.)を利用した情報提供が非常に盛んである。両会 議でも情報提供の基盤としてMosaic(あるいはMosaicをベースとしたもの)を利用するという話題が 多くあった。実際,この原稿を執筆する際にもMosaicを利用して原文献を手にいれた。ある意味で は,すでにDigital Libraryの芽があちらこちらにでているようにも思われる(注3)。 以下本論文では,第2章において,1994年度からNSFで始められたDigital Libraryの研究に対す る研究助成に関する話題を中心としてDigital Libraryの研究に関する背景を示す。第3章では両会議の あらましを述べる。第4章ではRutgers大学のワークショップにおける招待講演と両会議における一般 講演の内容に関して述べ,第5章では発表内容を基に現在のDLの研究分野に関する考察を述べる。 2. Digital Libraryの研究に関する背景 Internetの発展に従い数多くの大学,小中高校,図書館などがネットワークに参加するようになっ た。また,多くの企業も同様にInternetに接続されている。ネットワークを利用した情報の流通と共有 をはかることが,教育,医療をはじめ様々な分野で重要であることは明かであり,NSF主催のワーク ショップを始め,将来の電子図書館をめざした会議が開かれてきた。Edward Foxによる編集のSource Book on Digital Libraries[4]には,Digital Libraryに関わる様々なActivityがまとめられている。 NSFはNASA,ARPAとともにDigital Library に関する研究を進めることにしており,19 94年度からDigital Libraryに関する研究の助成を始めている[8]。研究領域として,以下のものがあげ られている。 領域1 任意の形式のデータを取り込むシステムに関する新しい研究 例:OCR,音声認識,図形理解など 多様な形式の電子情報をカテゴリー分けし,組織化する方法に関する新しい研究 例:索引付け,内容理解,分類,目録,多言語索引,ハイパーメディア等 領域2 多様な情報に対する検索,フィルタリング,イメージを含む大規模データの抄録づくり等に関 する新しい研究 例: 検索理論とモデル,文書の形式構造,知的文書処理,自然言語処理・理解等 多様な情報の可視化(visualization)と閲覧技術に関する研究 例: 画像認識,イメージ分類,マルチスケールディスプレイ,データの可視化,ハイパーメ ディア上のナビゲーション等 領域3 Digital Libraryを構築していく上で必要なネットワークに対する要求要件を満たすネットワーク構 成方式とその標準に関する研究 例: ネットワークのセキュリティ,プロトコルデザイン,データ圧縮等 広域に分散したネットワーク上のデータベースの利用を単純化する方法に関する研究 例: エージェント,intelligent gatekeeper,連携して利用できる分散オブジェクト指向データ ベース・情報ベース,利用方法に関するモデル,協調作業のモデルなど その他の例として,知的財産権,プライバシとセキュリティ,科学の発展に結びつくDigital Libraryの 影響,Digital環境における出版,著作権に関する課金の問題などがある。 DLW/CI のMilton Halem (NASA)や Gio Wiederhold (ARPA) の招待講演においてもDLの研究に対する 助成の話題があった。筆者にとって興味深かったのは,大学等の研究機関だけでなく,NASAの持つ 大量のイメージデータを有効利用することに関して,小規模な企業に対しても助成を行うプログラム (SBIR: Small Business Innovative Research)を用意している点であった。これは,情報の流通と共有,技 術移転を進めやすくするためにNIIを利用するという情報スーパーハイウェイの応用目的という観点 から興味深いとともに,大学等の研究機関だけでは現れない多様な情報の利用方法を開拓するという 点で興味深かった。 Ed FoxはSource Book on Digital Libraries[4] のprefaceで,"Digital Libraryという語がElectronic Libraryと いう語よりもはやっている(more in vogue)"と書いている。Digital Libraryという語は,Electronic Library という語よりも新しい語である。日本語訳はどちらも「電子図書館」としてしまっても構わないのか も知れないが,このワークショップのタイトルが示すように,「ディジタル図書館」とするほうがよ り明確であるように思う。やや使い古された感のあるElectronic Libraryという語に対して,すべての 情報をディジタル化し,ネットワークを介してすべての情報にアクセスすることのできる図書館とい う意味でDigital Libraryが使われていると思われる。マルチメディアという概念もDigitalの中に含まれ てしまうので,「マルチメディア図書館」などという必要は当然ない。筆者自身は,Electronic Libraryという用語が「図書館の電子化」,すなわち「館の電子化」あるいは「館の中におかれたもの の電子化」を意味して使い始められたのに対して,Digital Libraryは,様々な情報源(図書,雑誌,灰 色文献,視聴覚資料など)をディジタル環境で利用できるようにし,ネットワークにつながってさえ おればどこからでも情報にアクセスでき,「館」という概念を必要としないものであると考えてい る。このほかVirtual Libraryという用語も使われることがある。これも,様々な情報をネットワークを 介して蓄積・提供する図書館であり,(実際にはどのように構成されようとも)利用者からみれば一 つのまとまりとして提供される図書館として,Digital Libraryと同様な意味で使われると考えている。 一方,世界中どこからでもアクセスできるのであるから,ネットワーク上に一つの大きなDigital Libraryさえあれば良いのか,あるいはDigital Libraryは一つだけしか存在し得ないのか,という疑問が 浮かんでくる。これに関しては,図書館は利用者に対して知的作業の支援を行うところであり,ま た,そのために情報を組織化・蓄積し,図書館員の専門家としての知識を蓄積しているところであ る。そのため,単にディジタル化した資料をため込むだけの場所であれば一つで十分かもしれない が,情報や知識を提供する場所としては様々な特色を持ったDigital Libraryがなければならないと考え られる。 3. Digital Libraryに関する両会議の構成 3.1 1994 Workshop on Digital Libraries: Current Issues Rutgers大学でのワークショップ(DLW/CI)は,本年5月19・20日の両日,約160名が参加 して行われた。(5/18にレセプションが行われた。)予定された発表は,招待講演が10件,一 般講演が23件であった。図1にプログラムを示す。参加者は大半がアメリカであったが,イギリ ス,イタリア,オーストラリア,カナダ,シンガポール,スペイン,ドイツ,ニュージーランド,フ ランス,および日本からの参加者があった。(日本からは,筆者を含めて2名。もう一人の参加者で あるIBM東京基礎研究所の武田浩一氏による簡単な会議参加報告報告が情報処理8月号になされて いる[11]。)会議はRutgers大学,Purdue大学,Bellcore,AT&Tが主催し,NISTとNSFが協賛した。 ワークショップとして計画されたので,当初の参加見込み人数はもっと少なかったようであり,予定 していた会場よりも広いところに変更して会議が開かれた。この会議ではProceedingsは配られず,発 表者自身が用意した資料が配布されたのみである。会議録としては,参加者から論文を募り,その中 から20編程度を選んでSpringer-Verlag から出版する予定である。また,IEEE Trans. on Knowledge and Data EngineeringにSpecial Sectionを予定しており,それに対する投稿も呼びかけている。次回は1 995年5月17−19日にワシントンDCで開かれる予定である。 (連絡先: Prof. Nabil R. Adam, Rutgers University, 180 University Ave., Newark, NJ 07102, U.S.A., adam@adam.rutgers.edu) 3.2 Digital Library '94 - First Annual Conference on Theories and Practice of Digital Libraries Texas A&M大学での会議(DL'94)は本年6月19−21日に行われた。(5/19は主催者であ るTexas A&M大学計算機科学科Hypermedia Research Laboratoryの見学会とレセプション,並びに Coaliation for Networked InformationのPaul E. Petersによる基調講演が行われ,一般講演は20・21日 に行われた。)予定された講演は29件であった。図2に会議のプログラムを示す。参加者は約13 0名あり,外国からはイギリス,シンガポール,カナダ,ニュージーランド,フランス,および日本 であった。(日本からの参加者は筆者を含めて6名。)会議はTexas A&M大学Hypermedia Research Laboratory,Washignton大学School of Medicine Library,Southwestern Bell Technology Resources, Inc.が主 催し,ACM (SIGLINK, SIGBIT, SIGCUE, SIGIR),American Society of Information Science,Association of Research Library 他が協賛した。次回は来年の6月にテキサス州のSan Antonioで開催される予定であ る。 (連絡先: Prof. John J. Legget, Prof. Richard K. Furuta, Hypermedia Research Laboratory, Department of Computer Science, Texas A&M University, College Station, TX 77843-3112, U.S.A., {legget, furuta}@bush.cs.tamu.edu) 4. Digital Librariesへのアプローチ - 両会議における発表内容から 本章では,はじめにRutgers大学でのワークショップにおける招待講演について示し,その後両会議 での一般講演の内容を簡単に説明する。招待講演はDigital Libraryに関連する様々な分野から講演者を 招待しており,一般講演が大学中心であったのに対し,大学の研究以外の話題が述べられ興味深いも のであった。 4.1 Rutgers大学における招待講演 DLW/CIでは10件の招待講演が予定されていたが,1件がキャンセルされた。以下に,各講演の ごく簡単な内容を示す。(はじめにも述べたように,このワークショップではProceedingsが配布され なかったため,以下の内容は筆者が理解しえた範囲のものである。) 1.NASA Program in Digital Libraries Milton Halem, Chief of Space Data and Computing Division, NASA ・NIIに関するNASAおよびNSF, ARPAの方針について NASA, NSF, ARPA は education, health care, digital library のサポートする。 NASA, NSF, ARPAはdigital libraries の技術開発を進める。 NASA はイメージデータを一般にも公開し,利用技術の開発を促進する。 NASA/NSF/ARPA による DL 研究に関する研究助成(grant) University NASA SBIR: NASA Small Business Innovative Research (grant) 2.NSF Program in Digital Libraries Ron Ashany, Program Director, NSF (キャンセル) 3.Digital Libraries: A View From the World of Libraries Willem Scholten, Chief Scientist, Future InfoSystems Inc. ・Columbia大学におけるJANUS project に関して ・法学図書館から始まり(1992秋稼動),1993春には大学全体のinitiativeとなった。 (JANUS projectはWAISを利用したシステムとして有名。DL'94で発表している。) ・ツールとしてのDigital Libraries に要求される性質 柔軟であること (flexible) 分野毎の仕事に適応できること (task adaptive) 使いやすいこと (easy to use) 強力であること (powerful) 閲覧性に優れること (browsing) 4.A Digital Library Connecting Envision, KMS, and Mosaic with Interfaces, Communications and Data Interchange Edward A. Fox, Virginia Institute of Technology ・大学の学部生の教育のためにつくられた(SGML-basedの)データベースを基に,検索とvisualization ツールを利用して構成したHypermediaとcollaborationのツールとその利用結果について。 5.Digital Libraries for K-12 Education Miriam Masullo, IBM T.J. Watson Research Center ・K-12のためのビデオ・オン・デマンドについて DVIをつかって教師に教材を提供する。 NebraskaとSingaporeの間でテストをしたこと。 6.Electronic Commerce on Internet Marty Tenenbaum, President of EIT ・San Francisco Bay Areaで進めているCommerceNetについて Mosaicをベースにして進めていること,セキュリティやDigital Cash (Electronic Cash)に関する ことなど。 7.The RightPages Service: AT&T's Image-Based Electronic Library Suzanne Gordon, AT&T Bell Laboratories ・医学・薬学・分子生物学関係の学術雑誌のイメージによる提供サービスRightPages[5]について 現在,UCSFでテスト中 (UCSF+AT&T+SpringerVerlag)であり,1995年の第1四半期から 商用サービスを始める。 8.Electronic Libraries and Electronic Journals Michael Lesk, Bellcore ・CD−ROMかオンラインか(CD-ROM vs. On-line), イメージかASCIIテキストか(Image vs. ASCII),有料か無料か(Charged vs. Free),といったDigital Libraryを構成する上で現れるいくつかの 相対する性質について述べた。例として,multi-windowでイメージとテキストを見られる環境,文 字端末, manual の3つのグループをつくってcitation, search, brows などのテストをし,manualのグ ループでは問題の解決をあきらめた例もあったが,他のグループは似た結果を得たことを示した。 ・電子図書・雑誌はテキストとイメージの両方を持つべきこと。 ・情報提供:現在伸率はCDの方が大きいが,これからはオンラインが伸びるだろうということ。 9.Advanced Research Needs for Digital Libraries Gio Wiederhold, ARPA ・ARPAでのNII関連研究のサポートに関する様々な話題について ・DLに関するCopy Rightの問題 ・ARPA, DoD からの DL に対する様々な興味 Portable Documentation for Maintenance of Aircraft, Ship Long-lived and usable Design Records for Redesign, Rapid Manufacturing Electronic Commerce: resource directories E-money for copy right, re-distribution Individualized Training Sharing of Material from Military Excersizer & Simulation ・Real DLに対する関心 Effective Use of HP (High Performance) Computation & Net HPCC と NII HP network HP Compuers Autmatic search/index Creating abstract Creating Mosaic pages Creating New Info. from Old Intelligent Assistant Selection Abstraction Merging Structuring Re-abstraction Manipulable representation 10.Optimizing Hybrid Wide Area Network in Support of Digital Libraries William Steele, Director, Business Development, GTE ・通信の観点からみたDigital Libraryに関連する様々なシステムの構成方式,要素技術,サービスに ついて 4.2 一般講演の内容 DLW/CIとDL'94の両会議の一般講演の内容に基づいてトピックを分類し,その内容をごく簡単に 紹介する。(注:下記の説明中の記号,例えばR1やT2はそれぞれDLW/CI,DL'94のプログラム中 (図1(前半,後半),図2(前半,後半))に示した番号に対応する。) (1) Digital Library構築プロジェクト 大学等で進めているDifital Libraryの構築プロジェクトに関して述べたもの。多くはこれから行うプ ロジェクトに関するものである。 R.Bayer他, Tech. Univ. Munchen, Germany(R2) ミュンヘン工科大学で進めているDigital Library Project。全文検索を利用して図書,灰色文献, 雑誌記事等を全文及びイメージで提供する。 L.E.Stackpole他,Naval Research Laboratory, USA(R3) 地理的に離れた研究所間でイメージをも含めて情報を共有しようとするDigital Library Project。 Tang Ben Ting, National Computer Board, Singapore(R4) シンガポールにおける情報化計画IT2000に関して。 E.Liddy他,Syracuse Univ., USA(R11, T3) シラキュース大学(ニューヨーク州)で開発を進めるK-12プロジェクトのためのDigital Library。 S.Zdonik, Brown Univ., USA(R19) 病院,出版社と共同して行うDigital Libraryに関して。できるだけ利用者自身で知的作業を行える 環境を構成することを目的とする。 B.Schatz他,Univ. Illinouis at Urbana-Champaign & NCSA, USA(T4) イリノイ大学Urbana-Champaign校で進める科学技術分野を対象としたDigital Libraryプロジェク ト。多様な観点からDigital Collectionの実現可能な組織化について研究する。 D.Stotts他,Univ. North Carolina, USA(T5) イメージアナリシスを含む法医学関連のDigital Library。 S.Gauch他, Univ. Kansas, USA(T8) カンザス大学で開発をめざすディジタルビデオライブラリシステムについて。動画,静止画, 音声と説明のテキストを蓄積し,教育に利用する。 W.P.Birmingham他, Univ. Michigan, USA(T9) ミシガン大学において地球・宇宙科学分野を対象として進めるDigital Libraryのプロジェクト。分 散環境において,多様な分野のCollectionと多様な利用者を対象とするため,agent による柔軟で 知的なシステム構成をめざす。 K.McKeown他, Columbia Univ., USA(T11) コロンビア大学のDigital Library Project。法学図書館で始めた全文データベースの成果をふまえ て全学規模のDigital Libraryを構成し,さらにニューヨーク市の図書館とも結んで利用性を高めよ うというもの。 B.Shneiderman他, Univ. Maryland, USA(T12) メリーランド大学で計画しているDigital Library。科学分野の教育における利用を目標とし,図書 館員の手をかりずにできるだけ利用者自身で調査できる知的な環境を提供する。 J.Griffith他, Univ. Tennessee, USA(T14) テネシー大学で進めているDigital Library Project。実験的な高速通信網(TERN)を利用してピッツ バーグ大学とも共同して進める。環境科学関連分野での文献によるDLをつくって評価する。 J.L.Schnase他, Washigton Univ., Missouri Botanical Garden, Texas A&M Univ., USA(T17) イメージによるデータ蓄積を必須とする植物学に関するDigital Library Project。北米大陸におけ る植物情報に関するプロジェクトFNAに関連して進める。 G.King他, Harvard Univ., USA(T20) ハーバード大学で進める社会科学関連のDigital Library project。利用者からのフィードバックも DLにとりこんでゆく。 (2)データベース技術,ドキュメント技術 K.G.Perez-Lopez他, George Mason Univ., USA(R20) 病院のためのDLの構成方式。 S. Hockey, Rutgers Univ., USA(R8) 人文科学分野の研究者が利用する人文科学分野の全文データベースの構築に関して。OCRが 利用できるようになってきたこと,SGMLを利用してデータベースを構築することなど。 D.McDermott他, Yale Univ., USA(R9) 全文とイメージ情報を持つ歴史資料のデータベースについて。 R.Furuta, Texas A&M Univ., USA(T21) DLを構成するためのドキュメントの論理構造(章,節,段落),特徴化構造(一様/多様,粒 度など)について述べた。 J.Brasil, AT&T, USA(R12) 違法なコピーを行いにくくするため,見た目にはわからないようにドキュメント中にコードを 埋め込む方法について。 (3)検索・利用技術 R.P.Futrelle他, Northeastern Univ., USA(R6, T13) 検索には自然言語処理が必要であるという観点から,Corpus Linguisticsを利用した検索と, Corpusを格納するためオブジェクト指向データベースが有効であるということに関して述べた。 R.M.Tong他, Booz, Allen, Hamilton, Inc., USA(T10) 分散環境でタイプの異なるデータベースを利用するためのシステムについて。 R.B.Allen, Bellcore, USA(T15) 階層的に構成したOPACとそのユーザインタフェースに関して。 R.Kling他, Univ. California at Irvine, USA(T22) DLの利用性に関してinterfaceとorganizationの観点から述べた。 C.Kacmar他, Florida State Univ. & OCLC, USA(23) 航空写真等のspatial image dataのための組織化と検索の方法に関して述べた。 (4) マルチメディア技術,認識技術 P.Aigran, IRIT, France(R1) Bibliotheque Nationale de Franceで計画している動画のDigital Libraryに関して。動画イメージの データベースの構築技術に関するキーポイント述べた。 H.Zhang他, National Univ. of Singapore, Singapore(R23) マルチメディアデータベースの検索とブラウジングの方法について。 U.Fayyad他, California Inst. of Tech., USA(R5) 衛星でとったイメージデータからデータベースを自動的に構成する方法について。 S.Srihari他, State Univ. of New York at Buffalo, USA(R7, T6) ドキュメントのディジタル化に必要な知的OCRに関して。 (5) 通信・情報アクセス技術 B.Bhargava他, Purdue Univ., USA(R16) ネットワークにおけるresponse timeとDLの利用性について。 S.Naqvi他, Bellcore, USA(R17) DLへのアクセス方法とDLの構成方式について。 S.Shen他, Old Dominion Univ., USA(T28) 情報資源の利用性を向上するためのInformation Repositoryの階層的な相互接続方式について。 (6) データ蓄積技術 I.Witten他, Univ. Calgary, Univ., Canada, Univ. Melbourne, Australia, Univ Canterbury, New Zealand(R15, T7) ハフマンコーディングを使ってテキストデータベースを圧縮する方法とその評価について。 T.Chiueh, State Univ. of New York at Stony Brook, USA(R21) 大規模なビデオデータベースを構成するためのMass Video Tape Storageに関して。 D.Rotem他, Col. William and Mary, USA(R22) ネットワークを介して共有するビデオデータのためのバッファ管理のについて。 (7) Digital Libraryとは, Digital LibraryとLibrarianの役割,知的作業支援 F.Miksa他, Univ. Texas at Austin, USA(T1) 「ディジタル図書館は図書館と呼ぶべきか(Why should a digital library be called a 'library'?)」につ いて考察を述べた。 C.McKnight他, Loughborough Univ. Tech, UK(T2) 電子出版環境におけるpublisherやlibrarianの役割を考察した。 H.M. Gladney他, IBM Almaden Res. Center他, USA(T16) Digital Libraryに関するワークショップ(1994.3)からの報告。DLの満たすべき性質などを述べた。 D.M.Levy他, Xerox PARC, USA(T24) DLに蓄積される情報の性質を考えることでDLの満たすべき性質を見直そうというもの。 K.Ehrlich他, Lotus, USA(T18) 知的作業を支援する環境としてDLをとらえ,協調作業における情報の引き出し,知識化等につ いて述べた。 C.C.Marshall他, Xerox PARC, USA(T19) 知的作業を支援する環境としてDLをとらえ,協調作業におけるコミュニティメモリを生み出す こと,育てること,保持すること等について述べた。 (8)ビジネスの観点 R.Krishnan他, Carnegie Mellon Univ., USA(R18) 企業情報に関する知的なデータベースシステムについて。 S.Ba他, Univ. Texas at Austin, USA(T25) ビジネスデータを基にdecision support systemを構成する方法について。 R.L.Grossman他, Univ. Illinous at Chicago, USA(T26) 合衆国予算を対象にして閲覧,質問,可視化等を行うように設計したDLのプロトタイプ。 M.Ribaudo他, City Univ. of New York, USA(T27) 情報流通のビジネス的基盤の観点からDLに関する考察を述べた。 5. Digital Libraryの研究分野に関する考察 第2章で示したNSFによる研究助成の対象領域からも理解できるようにDigital Libraryの研究分野は 非常に広範囲にわたっている。そのため,個々の要素技術,大きなDigital Library開発プロジェクト等 広い範囲の発表があった。本章では,できる限り「木を見て森を見ない」ことも,「森を見て木を見 ない」こともないように,印象的であったいくつかの項目に関して筆者の観点から述べたい。 [Digital Libraryとは] DL'94でのH.M.Gladney他による1994年3月のワークショップ(IEEE CAIA'94 Workshop on Intelligent Access to On-Line Digital Libraries)からのの報告(T16)によると,Digital Libraryを以下のように 定義している。 Digital Libraryは,従来の図書館が紙やその他の媒体を使って提供してきた,収集,目録作 成,情報の発見と流通というサービスを,再現,模擬,拡張するために必要な内容および ソフトウェアを,計算,データ蓄積,通信のための機械装置とともに適切に組み上げたも のである。完全なサービスを提供するDigital Libraryは,従来の図書館が提供してきた必須 のサービスを実現しなければならず,また,ディジタル化された情報蓄積,検索,並びに 通信のよく知られた長所を生かさなければならない。 構成的には,Digital Libraryはデータをディジタル化して収集・蓄積し,ネットワークを介して利用 可能にした機構(Collection or repository of digital materials)と言われる。したがって,多様な情報をディ ジタル化するためのマルチメディア技術と,大容量データを蓄積し,通信するための計算機ネット ワーク技術が基盤であることはまちがいない。しかしながら,ネットワークを介してマルチメディア 情報の検索ができれば良いというだけではなく,学習や研究の支援,すなわち利用者の知的作業の支 援を行い得ることも要求される。 [Digital Libraryの開発プロジェクト: Testbed] 多数の大学でDigital Libraryプロジェクトの提案がなされている。それらに共通していえることはテ ストベッドを作って,機能を評価しようという点である。テストベッドづくりに共通する点を上げると, 高速のネットワーク(ATM)の利用, ビデオを含むマルチメディア情報の蓄積と提供, OCRなど情報蓄積のためのツールの利用, SGML,HTML,HyTime等のマークアップ言語による文書構造の記述, 利用性を高めるユーザインタフェース(自然言語による対話も含む), 知的な検索の支援 (reference service), 多様な分野からの開発チームメンバーの参加 をあげることができる。大学だけでなく地域の図書館や学校との提携,出版社,計算機メーカほか関 連分野の企業の協力を得てシステムづくりを進めるところが多い。 著作権・知的財産権に関しては,適切に支払うという程度の説明しかない。大学でのプロジェクト の特徴として,特定の分野に限ることでTestbedの構築を行いやすくするとともに,出版社等と間の 知的財産権に関する問題も解決しやすくしていると思われる。知的財産権の問題は各大学だけで解決 できるような問題ではなく,国レベルでの解決を待っているように思える。 大学内での利用を前提とするばかりではなく,広い範囲の利用者による利用を前 提として考えているものが多い。たとえば,シラキュース大学のシステムはK-12の 利用者である,幼稚園,小中高校の先生や生徒を利用者とし,使いやすい自然言語 によるユーザインタフェースや知的な検索支援を提案している。また,NIIにとって 教育と並ぶ大きな柱である医療に関係する提案も多くあり,それらも医者や患者に とっての使いやすさを考慮している。 [文書の蓄積] Digital Libraryを構成するハードウェアやソフトウェアは短命であるが,Digital Libraryに蓄積される データは長命でなければならない。すなわち,プリンタやワープロに依存した形式でデータを蓄積す ることはできない。そのため,文書構造を記述するマークアップ言語として国際標準が定められてい るSGMLを利用するという提案が多い。また,ハイパーテキストとしては,World-Wide Web (Mosaic) で広く利用されているHTMLや時間依存のハイパーテキストを記述するためのHyTimeが用い られるようである。 DLW/CIにおけるS. Hockeyによる講演では,人文科学分野での研究のために利用するテキストの入 力にはOCRを利用し(精度が向上してきたので使えるようになってきたようである),SGMLで 構造を記述して蓄積し,Mosaicのようなアクセスツールを使って利用することを述べている。 DLW/CIにおけるR.Bayerの講演では,書誌情報,全文,ページイメージを提供するOMNIS/Myriad システムでの経験に基づいて,人手による目録づくりのコストに比べてOCRを利用して入力した全 文データベースの方がOCRが経済的であることが述べられた。 [マルチメディア情報の蓄積] Digital Libraryにとって,マルチメディア情報を蓄積し提供することは重要な課題である。情報の蓄 積の際には,検索のための内容情報の獲得が重要な問題であり,この観点からの発表がいくつかあっ た。DLW/CIにおいて,P. AigranはBibliotheque Nationale de Franceが進める大規模なaudio visual library の構築におけるdigital dataに関する設計において明らかになった3つのキーポイント(ディジタル化 の方式,時間依存メディアのユーザインタフェース,ネットワークとソフトウェア設計における実時 間メディアの影響)について述べている。また,DL'94におけるS.Gauch等による論文には,OCR等い くつかのメディアを利用して内容に基づく検索の可能なビデオデータを蓄積するDigital Video Libraryが 提案されている。 [(積極的な)情報の発信と受信] 学術情報センターによるプロジェクト[2]やCMUにおけるMercury projectなど大学・研究機関による もの[1],AT&TのRightPagesや ElsevierのTULIPといった商用のものなど,テキストとイメージを組み 合わせて雑誌記事のオンラインの全文サービスが行われている[3][10]。「論文をネットワークから取 り寄せる」ことが実際に可能であるということを明かにした意味で,これらの果たしている役割は大 きいと感じる。文献の複写依頼を出して,コピーを郵送あるいはFaxで送ってもらうという従来の Document Delivery[7]に比べ,速度,品質ともに格段に優れたものを提供可能性を持つので,従来の情 報の流れ方を変えてしまう可能性を持つと思われる。また,上記のようにまとまったサービスではな いが,Mosaicを利用して自分の論文や,研究機関自身の論文やテクニカルレポートなどをPostScript形 式,HTML形式のデータとして提供する研究者や研究機関がある。(例えば,DL'94のように, Mosaicを利用してProceedingsを手にいれることができる。)これらはScan-Inしたものではないので, Scan-In時のノイズ,コピーやFaxの際のノイズのない高品質なコピーを得ることができる。(サービ スを受けられないところは情報のこないところ。) Mosaicは,WWWをはじめとしてGopher, WAIS他のInternet上の分散情報サービスに対する統合的な 利用者インタフェースを提供するシステムということができる。ネットワークによる情報の流通に関 して,Mosaicの果たした役割は非常に大きい。Digital Libraryに関連する多くのシステムがMosaicある いはMosaicのような環境で利用すると言っている。だれもが情報を受信できること以上に,だれでも 情報を発信できるということによる情報の流れの変化は大きいと感じる。例えば,IT2000と呼ぶ国家 的な情報技術プロジェクトを進めるシンガポールはMosaicを使って様々な情報を提供している。ま た,アメリカの田舎町がMosaicを介してきれいなイラスト入りの町の情報を提供したりしている。K −12に関連していろいろな公共図書館や学校が情報を提供している。(情報を発信しないところは 情報のないところ。) [情報の所有] DLW/CIにおけるM. Leskによると,現在,CD-ROMによる情報提供の増加率がオンラインによる情 報提供に比べて大きいが,将来は必ずしもCD-ROMの増加率の方が大きいままであることはなく,オ ンライン情報の方が伸びると考えられるとのことである。「所有」が「いつでも好きなときに見る/ 読むことができる」,あるいは「使うことができる」ということを意味すると考えると,「どこかに おかれている情報を」ネットワークを介して好きなときに見る/読むことのできるDigital Libraryは, 「情報の所有」という概念を変えてしまう可能性がある。したがって,所蔵の意味も考え直さなけれ ばならない。 Digital Libraryの環境は著者と読者を直接結ぶことのできる環境を提供する可能性を持つ。 C.McKnightは,publisherが用意するSGMLに基づいて作成されたテキストをHTMLに変換し,Mosaic を利用して提供するという環境においてpublisher, library, userの間の関係を評価することでDigital Libraryの可能性と問題点を考察している(T2)。そこから,経済的な問題(例えば,図書館が「所蔵す る」のではなく「アクセスを提供する」とすれば,誰が情報に対する料金を負担するのか),利用性 の問題(例えば,情報は見つけ易いか,読み易いか)といった問題が残されていると述べている。 [Digital Libraryはlibraryか?] DL'94におけるMiksaとDottyの講演では,次の3つの観点からDigital LibraryはLibraryと呼ぶべき か?ということが考察された(T1)。 1. The Digital Library as a "Collection" 2. The Digital Library as a Collection of "Information Sources" 3. The Digital Library as a Collection of Information Sources "in a place" Digital Libraryは,「Digital化された」情報の集積であるという意味で,図書館の役割を持つ持つシス テムである。しかしながら,Digital Libraryは従来の図書館の持つ性質を必ずしも満たしていないとこ ろがあり,従来の図書館が持つ制約に必ずしも縛られない面もあると述べている。(彼らは結論を述 べずに,疑問だけを述べている。) Digital Libraryは知的作業の支援環境であるという観点から,個人だけではなくグループに対する知 的作業支援環境を提供するという観点からの講演があった(T18, T19)。グループによる協調的知的作 業環境,コミュニティーによって作り出される知識を蓄積し,利用できる環境としてDigital Libraryの 果たすべき役割を忘れてはならないことが主張されている。 ディジタル化した図書・資料の蓄積と,ネットワークを利用したサービスはDigital Libraryの核とな る機能であることはまちがいない。しかしながら,Digital Libraryには従来の図書館が提供してきた知 的なサービス,専門家としての図書館員が行ってきたサービスも要求される。Digital Libraryでは, 「館」という物理的な制約がはずされるので,より内容に踏み込んだサービスが要求されることは疑 えない。そのため,Digital Libraryのプロジェクトでは知的な利用者支援を行うといっているところが 多い。自然言語による対話や,専門分野や参考調査のための知識の組み込みを目標に含めているとこ ろもある。Digital LibraryおよびDigital Library Networkの上での知的利用者支援は,(必ずしも人間とは 限らないかもしれないけれども)専門家としての図書館員が負うべき仕事であろう。 6.おわりに − Digital Libraryに関する私見 最後に,Digital Libraryに対する私見を述べて本稿を終わりたい。この1年足らずの間に,筆者に とっての情報環境は大きく変化した感じがする。以前から電子メールやNet Newsは通信と情報収集の 手段として欠くことのできないものであった。Mosaicに代表されるInternet上でのソフトウェアを利用 するようになってからは,それらを利用した情報アクセスは,世界中のいろいろな機関や人が用意し た様々な内容にふれられる非常に楽しい経験であり,情報を得るためには欠くことのできない道具で あることを実感させられた。情報を発信していないところは「存在しないところ」に等しいし,ネッ トワークにつながらないところは「世界の果てよりも遠いところ」のように感じられる。一方で,巨 大なハイパーテキストを使っていると迷路の中に迷い込んでしまい,どこに何があるのかがすぐにわ からなくなってしまうという誰もが感じるfrustrationも強く感じた。きっと,これらは多くの人が共 通に感じていることであろう。また,知的作業支援環境をめざすDigital Libraryの大きな研究対象であ るとも思う。 筆者にとって,Rutgers大学でのワークショップは非常に刺激的であった。それにはいくつかの点が ある。NSF/NASA/ARPAの取り組み方,特にSmall Businessをも援助して情報の流通性,利用性,技術 移転を促進するという,データを持っている側がデータを使わせるのではなく,データを使っても らって有用な情報や知識を作り出してもらおうとする姿勢に感心した。また,アメリカだけでなく ヨーロッパでも情報技術(計算機技術ではなく)に関して着実に新しい仕事を進めていること,特 に,シンガポールが情報技術に対して非常に積極的であることが印象的であった。さらに, RightPagesのような商用サービスが軌道に乗り出すと,情報の流通形態が根っこから変わってしまう 可能性があることを実感できた。また,Texas A&M 大学での会議では,多くの大学からDigital Libraryプロジェクトの提案が発表され,それ自身興味深かったのと,多くのプロジェクトにおいて多 様な分野からメンバーがプロジェクトに参加していることが印象的であった。また,Digital Libraryに 要求されるDigital Libraryとは何かに関する話題,利用者の知的作業支援の機能に関する話題が興味深 かった。 自明のことではあるが,Digital Libraryは多様な技術が集約されたものである。要素技術自身に対し て要求される機能も高く,「これぞDigital Library」というものができあがるのはまだ遠い将来なのか も知れないが,いろいろなプロジェクトから生み出されるDigital Libraryによって着実にDigital Library は進歩していくのであろうと感じる。 謝辞 Rutgers大学やTexas A&M大学で会議があることを知ったのも,本稿を執筆するに当たって必要な情 報を得たのもネットワークを介してであった。マシンとネットワークの管理,Mosaic等の新しいソフ トウェアの導入等,日頃お世話になっている諸氏に感謝の意を表したい。 注: *1) Kindergarten through 12th grade: 幼稚園から第12学年、すなわち高校3年生までを対象とす る。 Kids to twelve, Kids through twelve, K to twelve 等と呼ばれているようである。 *2) URL Universal Resource Locator: Mosaic (WWW) において情報資源の型と所在場所を表す記述子 *3) 例えば、CERN に用意されたWorld-Wide Webのサーバリストやthe WWW Virtual Library, 米国 の議会図書館(Library of Congress)のHomePage, ニューヨーク州立大学Baffalo校のVirtual Tourist等は いろいろな情報を探し出すうえで重要な情報源であった。これらのURLについては本論文 の終りに著者がよくアクセスしたもののいくつかを示している。 参考文献 [1]安達 淳, 橋爪宏達, 欧米における電子図書館プロジェクト, 情報処理, Vol.33, No.10, pp.1154-1161, Oct., 1992 [2]安達 淳ほか, 学術文献を対象とした電子図書館システムの構成法, 情報処理学会研究会報告, 情報 学基礎, Vol.93, No.39, pp.51-58, May, 1993 [3]安達 淳, 電子図書館と学術雑誌, 情報の科学と技術, Vol.44, No.5, pp.247-253, May, 1994 [4]Fox, E.A. (ed), Source Book on Digital Libraries (version 1.0), Virginia Polytechnical Institute, Dec., 1993, p.410 [5]Hoffman, M.M., et al., The RightPages Service: An Image-Based Electronic Library, Journal of the American Society for Information Science, Vol.44, No.8, pp.446-452, Sept. 1993 [6]Lunin,L.F. and Fox, E.A. (eds), Perspectives on Digital Libraries, Journal of the American Society for Information Science, Vol.44, No.8, pp.440-491, Sept. 1993 [7]永田治樹, 大学図書館とエレクトロニック・ドキュメント・デリバリー, 情報の科学と技術, Vol.44, No.7, pp.352-361, July, 1994 [8]NSF, Research on Digital Libraries: Program Guideline, Sept., 1993 (NSF grantの資料, URL [M4]) [9]Schnase, J.L, et al. (eds), Proceedings of Digital Libraries'94: The First Annual Conference on the Theory and Practise of Digital Library, College Station, TX, June 1994, 221p (URL [M10])) [10]杉本 重雄, 田畑 孝一, 図書館のエレクトロニクス, 電子情報通信学会誌, Vol.77, No.1, pp.68-70, Jan., 1994 [11]武田浩一, 1994 Digital Libraries Workshop参加報告, 情報処理, Vol35, No.8, pp.773-774, Aug. 1994 URLリスト 以下は,本稿を執筆するに当たって参考になった情報を得たドキュメント,並びに両会議に関連す るドキュメントのURLである。 [M1] CERNのHomePage http://info.cern.ch/hypertext/WWW/TheProject.html [M2] CERNのVirtual Library http://info.cern.ch/hypertext/DataSources/bySubject/Overview.html [M3] Library of CongressのHomePage http://marvel.loc.gov/homepage/lchp.html [M4] NSFのResearch Digital Library Program Guideline (DL'94のHomePageから参照されていたもの) ftp://bush.cs.tamu.edu/dl94/nsf93141 [M5] DLW/CI(Rutgers Univ.)のHomePage http://superbook.bellcore.com/DBRG/DL94/ [M6] State Univ. of New York at BuffaloにあるVirtual TouristのHomePage http://wings.buffalo.edu/world/ [M7] SingaporeのHomePage http://king.ncb.gov.sg/ [M8] Ed FoxによるSourceBook gopher://fox.cs.vt.edu/11/DL [M9] DL'94(Texas A&M Univ.)のHomePage ftp://bush.cs.tamu.edu/dl94/README.html [M10] DL'94(Texas A&M Univ.) の Proceedings http://atg1.wustl.edu:80/DL94/
to Contents
compiled by itaru@ulis.ac.jp