会議では予定されていた19件の一般講演のうち、18件の発表が行われた。 また、1時間半のエキスパートフォーラムが3回行われ、 それぞれのテーマにそって活発な議論や意見交換が行われた。 その他、proceedingsには、講演を行わないfull paperが2編、 short paper(4ページ以内)が7編含まれている。
以下本稿では、19件の内容の要約を行い、 いくつかの観点から考察を行う。 また、1994年6月に行われたDigital Libraries '94の内容と併せ、 総合的観点からの考察を行う。
なお、Proceedingsの電子版は http://csdl.tamu.edu/DL95/ にて 入手可能である。 冊子体の入手方法の情報も得られる。
Loughboroughにおける過去15年間のDL研究
過去15年間にLoughborough大学で行われた様々なDL研究プロジェクト について説明している。 BLENDプロジェクトに始まり、QUARTET(QUARTETの一部として始まった ADONISについても含む)、ELVYNプロジェクト、そして 現在行われているTraining Electronic Journal プロジェクトについて述べている。 これらのプロジェクトで得られた教訓は、TULIPやCOREといった現在行われている プロジェクトに生かされている。
(2) Early Prototypes of the Repository for Patterned Injury Data
「痕の残った負傷」データの保存機構の初期試作
Repository for Patterned Injury Data(RPID)は、 「痕の残った負傷」の医療処置に関するデータを収め、 それに対する協同作業を支援する法医学のためのDLである。 このシステムは 音声やビデオや(ディジタル化された)手書き文書などの新しい マルチメディアデータのみならず、 テキストやイメージといった今まで扱ってきたデータをも含んでいる。 ネットワークをベースに開発されており、 リアルタイムの診察や相談、データベースの調査などに利用できるようになっている。
NHSE--仮想分散DL--の管理
NHSEとは、ハイパフォーマンスコンピューティングに関するソフトウェア、文献、 データの分散型コレクションである。 分野別に分散蓄積されたコレクションの上に構築された仮想的なHPCCソフトウェア リポジトリに対して、WWWによる統一されたインタフェースを提供している。 ソフトウェアの提出に当っては、品質や不変性を保証するため、雑誌のレビュ ーに似たレビュープロセス、公開キー暗号システムによる認証手続き、 ソフトウェアに付けられた識別子(fingerprint)による完全性(integrity)の 検査が行なわれる。 今のところ、目録は提供者とNHSEのライブラリアンによって手作業で作成されている。 この目録を用いてフリーテキストサーチやシソーラスを用いた検索ができる。
インターネットでの政府情報の供給: THOMASの経験
THOMASシステムは、インターネットで米国議会の立法に関する情報を提供 するために設計された。 THOMASの予備経験では、質問(queries)が短くなりがちであることがわかった。 よって、質問処理や質問拡張、語形(形態)処理などの技術を採り入れて 改善する必要がある。 筆者らは、システムの使われ方や質問に関する統計、 利用者のフィードバックをどう反映 させ、質問処理をどのように変化させたかについて述べている。 また、THOMASや他の似たシステムを改善するための、質問拡張や 語形(形態)処理に関する研究の状況についても述べている。
(5) A New Zealand Digital Library for Computer Science Research
ニュージーランドの計算機科学研究のためのDL
ニュージーランドは地理的に孤立しているせいで、 インターネットへのアクセスにはコストがかかりレスポンスも遅い。 筆者らは、全世界の各地でインターネットにより公開されている 計算機科学分野の技術資料の全文検索インデックスを作成し、 それを国内に置いて利用に供するというプロジェクトを行った。 インデックス作成はほとんど自動化されている。 国内にはインデックスと検索エンジンのみがあり、 必要最小限の資料本体を転送することで ネットワークトラフィックとコストを抑えることができる。 資料本体を提供している機関は特別な作業をしなくてよい。 なお、インデックス作成には mg というPDSを使った。 75万件の文献に対してインデックスを作成したところ、 (waisのような)ランクつき出力をするのに3秒から5秒程度かかった。
(6) A Hypertextual Interface for a Searcher's Thesaurus
サーチャーのシソーラスのためのハイパテキストを利用したインタフェース
筆者らが開発した、 シソーラスを見やすくするためのハイパテキストインタフェースを紹介している。 利用者が主題語を入力すると、 関連語は主題語を中心とする円の中に表示され、 上位語・下位語は主題語を含んだツリー状に表示される。 表示されているどの語をクリックしても、その語を中心とした表示に切替えられる。 また、検索インタフェースの検索語入力欄に語をドラッグして持っていくこと が出来る。
DLからのハイパメディアの自動抽出
DLの利用者が目録で検索したマルチメディア文書・資料を DLから取り出し、「バンドル」と呼ぶハイパテキストアプリケーションを 自動的に生成して提示するという実験について説明している。 目録へのアクセスは、 多様な質問ツールを備えた質問エンジンへのビジュアルインタフェースを 介して行う。 ハイパテキストの自動生成には、図書館の目録固有の構造を利用している。
(8) Enhancing Usability of Network-based Library Information System---Experimental Studies on User Interfaces of OPAC and Collaboration Tool for Library Services
ネットワークに基づく図書館情報システムの利用性の拡大 -- OPACのユーザインタフェースと図書館サービスのための共同作業ツールの実験的研究
筆者らはネットワークを利用した2つのシステムを開発し、 図書館情報システムの User-friendlinessに関する実験的研究を行った。 SOPACは、書架の様子をグラフィカルに表示するOPACである。 各図書のイメージは、それらの図書の大きさに基づいて表示される。 もう一つのシステムは協同作業支援システムである。 ネットワークで接続された2台のワークステーション上で テレビ電話、共有ディスプレイ、ホワイトボードなどを開発し、 GUIベースのOPACの使用法を遠隔で教えるという実験を行った。
ディジタル資料の目録法
インターネット上の大量のディジタル資料はほとんど組織化されていない。 また、それらは 内容が変化することがあり、時には存在そのものがなくなってしまうことがある。 筆者は、現在図書館で行われている目録法を「資料の順序付けの一形式」ととらえ、 それをインターネット上のディジタル資料に適用する方法を模索している。 「ディジタル資料の目録」を作るためには、 現在の図書館の目録との相違、管理主体に求められる能力、 必要な要素技術、準拠すべき目録法など、考えるべきことがたくさんある。 また、計算機科学や図書館学のみならず、その他のたくさんの分野からの 知識を動員する必要があるだろう。 それにもまして、まず、「資料のコレクションを管理するためには 目録が必要である」という、図書館関係者にとって常識であることが 図書館学以外の分野に意外と知られていないという現状を 変えなければならない。
(10) Collection Maintenance in the Digital Library
DLにおけるコレクションの保守
資料の保守管理はDLにとってきわめて重要なものになるであろう。 DLは「インフォーマルでかつ内容が変化する資料を含んでいる」ので、 その保守管理には今までの図書館にはなかった 技術的問題と制度的問題がある。 筆者は、様々なタイプのDLを調査し、コレクション(資料を集めたもの)の保守管理に 関して以下の結果を得た。 すなわち、 インフォーマルで内容の変化する資料(例えば、WWWやNetNews)を含む コレクションの保守管理には、新しい技術的解決法 (例えば、WWWに対してMOMspiderやWeb:Lookoutを適用する)が必要である。
(11) Automatic Creation and Maintenance of an Organizational Spatial Metadata and Document Digital Library
組織の空間的メタデータとドキュメントのDLの自動生成と管理
米国フロリダ州政府機関の組織の活動をサポートするためのDLシステムについて 述べている。 このシステムは、 中央政府や州政府の行政文書やメタデータ(データのデータ、すなわち データのフォーマットなどに関するデータ)の収集・管理から、 一般市民からのインターネットを介した利用のサポートに至るまで、 あらゆるサービスを提供する。 特に、地理的情報(地図など)の組織化に関しては、 地理的(空間的)な特徴(緯度、経度、国の境界など)を利用した 組織化を行い、利用者に対してもそれらの特徴から地理的情報に アクセスできるようなわかりやすいグラフィカルユーザインタフェースを 提供している。
(12) Use of the ISite Z39.50 software to search and retrieve spatially-referenced data
空間的に参照されるデータのIsite Z39.50ソフトウェアを使った探索と検索
地図の持つ地理的特徴から地図を検索可能とするためには、 一般的な文書の属性に加え地図の持つ地理的特徴(緯度、経度など)を属性として 検索システムに収める必要がある。 最新のZ39.50(ANSIの定めた情報検索のための通信プロトコル)では、 サーバはクライアントに対し「検索キーとして使える属性」を 知らせることができる。 これを利用して、筆者は、米国連邦地理情報委員会(FGDC)によって定められた Contents Standards for Digital Geospatial Metadataを freeなZ39.50サーバであるISiteによって扱えるようにし、 有効な地図検索システムを開発した。
InterPay: DLにおける複数の支払い機構の管理
ネットワークを通じて料金を徴収する仕組みは今までにいくつか考案され、 様々な支払いの仕組みや課金モデルが存在する。 これらは異なる特徴を持っており、ある一つの方法のみで 一般的利用に十分であるということはない。 それゆえ、利用者とサービス提供者は様々なプロトコルを扱わなければならない。 InterPayは、種々の支払い方針や課金方針、その詳細などを オブジェクト指向モデルを採り入れて適宜隠蔽し、 利用しやすい課金・支払い環境を提供する。
DLの伝達技術: ベンダとしての経験
電子図書館開発の過程においては、開発技術者と利用者(発注者)との間に、 できあがる電子図書館に対する期待のずれが顕著に見られる場合が多い。 これは、組織や各自の技量、仕事の流れや環境に対する暗黙の理解 などの違いによって生じる。 この問題は、技術的な問題ではないので、解決が非常に難しい。 ディジタル図書館作りを成功させることは、それに関わっている全ての グループの協同によってのみ成し遂げられる。 この論文は、電子図書館プロジェクトの協同構築の方法を提案している。
(15) User Needs Assessment and Evaluation for the UC Berkeley Electronic Environmental Library Project: a Preliminary Report
UC Berkeley 電子環境図書館プロジェクトのための利用者ニーズの評価
UC Berkeley 電子環境図書館は、 環境計画の研究のための様々な形態の情報を収めた分散システムである。 このプロジェクトには、利用者ニーズの評価という課題が含まれている。 この課題は、利用者を中心に考えたシステム設計および評価によって 利用のしやすさを最大限にすることと、それをDL一般に適用できるか否かを 発見することを目標としている。 利用者ニーズの評価は、「環境」「全体的な研究達成度」 「個別の研究達成度」「情報行動」「DLの利用」の5つの観点から行っている。 なお、このプロジェクトはまだ始まったばかりである。
(16) Using Online Information Resources: Reaching for the *.*'s
オンライン情報資源の利用
様々なDLが実現されているが、学術利用を対象としたものが多い。 しかし、DLを含む情報テクノロジーは(学術利用でない)一般利用者にとっても 利用可能なものである。 一般利用者層によるオンライン情報資源の利用法の理解という問題に 取り組むことが、今後よりよいDLを実現するために必要である。 筆者は、オンライン情報資源の利用法に関する研究論文を選び、 レビューを行っている。 そして、オンライン情報資源の「組織を越えた(interorganizational)利用性」 という側面が、オンライン情報資源の利用性を考える上でもっとも重要な 要素であることを見出している。 オンライン情報資源の利用性を考える際に、今までのように ユーザインタフェースや検索方式のことばかり論じているのではなく、 このようなことも考える必要があると述べている。
ディジタル研究図書館: タスクとコミットメント
ディジタル研究図書館(DRL)は、長期間にわたり 利用可能な、電子的情報のコレクションである。 DRLを設立する者は、利用者の要求を満たすために、電子的資料の保管の仕組みを作り、 それを使うためのツールを実現し、 さらに、長期間にわたる組織的財政的社会制度的コミットメントを持つ必要がある。 図書館学と計算機科学両方の能力と理解は、 電子的環境に人間の行動の記録を保存するという タスク・コミットメントを達成するために不可欠なものである。
(18) Digital Libraries and Sustainable Development?
DLと「持続しうる開発」
社会科学の分野においては、「持続しうる開発(sustainable development)」に関して、 社会科学者と経済学者が様々な側面から見た 「将来の展望」を議論している。 議論は、「世界的な産業化が持続する」か「人間性の維持のため 産業化はdown scalingする」かのどちらかになるであろう、という点に 絞られつつある。 DLの分野においても、これと同様のことを考える必要があるであろう。 筆者は、「持続しうる開発」のフレームワークの中で、 どのようにDLを開発すべきかについて述べている。
(19) Digital Libraries: Issues and Architectures
DLの問題点とアーキテクチャ
DLの研究分野は、様々な研究領域からのサブフィールドの 融合であると見ることができる。 そして、新しく複雑な研究問題を含んでおり、それらに対する 明解な解説はなされていない。 せいぜい、ある特定のDLに関する問題を、 他の領域の問題のバリエーションとして位置付ける程度のことしか行われていない。 筆者らは、この問題を解決するために、DLの要素の分類法を考案している。 DLの構成要素は、Data、Metadata、Processの3つの項目からなる軸と Translation of Physical Library Element、New Digital Library Elementの 2つの項目からなる軸から構成される2次元空間に分類される。 また、筆者らは、一般的なDLシステムのアーキテクチャについても述べている。
DLやDLの集合を一つの「コミュニティ」と考え、 社会科学分野で見出されている問題点がDLにも見出されることを指摘し、 社会科学分野で使われている方法論や問題解決法を適用し 解決を図ることについて述べたものが見られた。 また、DLに対する社会の関わりの必要性を述べたものも見られた。
(18)においては、DLの開発を産業の発展となぞらえ、 社会科学分野における産業の発展についての考え方と 同様の考え方でDLの将来について考えることをDL研究者に促し、 問題の提起を行っている。 (16)においては、経済と社会の発展のための情報と情報技術は、 社会や政治や組織が総合的計画を持って関わっていくことでその重要度が増す、 ひらたく言えば、(社会や経済の発展のための情報や情報技術を持っている)DLには、 社会の関わりが必要であるということが述べられている。
いずれも、DLの「社会や社会科学分野への積極的な関わり」 「社会や社会科学分野からの積極的な関わり」を説いており、 ともすれば技術論一辺倒になりがちなDL研究に対し警鐘を鳴らしている。
図書館と社会との間の最も重要な接点のひとつは「利用者」である。 利用者のニーズを評価し、それをDLの改善や今後のDLの設計および開発に 役立てていこうとする発表があった(15)。 また、DL開発後に実際にDL管理に携わる者(図書館員のようなもの)を 「利用者」としてとらえ、 設計段階から「利用者」の要求を十分にとり入れるべきだというものもあった(14)。 利用者の要求を聞きシステム改善に役立てることは 情報システムの運営で必ずといってよいほど行われていることである。 DLシステムにおいても利用者の声を聞くことは当然必要なことであり、 このような研究が行われつつあることは、 実利用に供するDLシステムがさらに利用性の向上を図ろうとしている ことをうかがわせる。 (15)における評価の手法および評価の観点は 研究者を対象とした他のDLにおいても利用可能なものと考えられ、 参考になる。
DLの実現を、どのような技術を用いて行うかという 点について、個々の実現例の紹介ではなく一般論として述べたものがあった(19)。 様々なDLが実現されている中で、それらの問題点を考察し、 DLシステム実現の「テンプレート」の一つを示したものと言える。
タイトルを見るとDL実現の紹介であると思われる講演・論文が、 実は実現に利用した要素技術およびその適用方法の解説であったという ものが多く見られた。 (4)では質問処理、(5)ではDLの実現形態とインデクシングの方式、 (3)ではDLの実現形態とデータの保守手法、 (15)では利用者ニーズの評価とフィードバックの方法、 (11)と(12)では地図情報の特徴に合わせた保守とアクセスの方法について、 報告および議論がなされている。 いずれも、システム全体の解説より上記の要素技術の解説に重点がおかれている。 実現されたDLの全体像を紹介するのみならず 要素技術の適用方法を詳説することは、 今後のDLシステム開発の助けになるであろうと思われる。
WWWで「私のお気に入りのページのリスト」といったようなリンクのリストを 作ったり、Mosaicのホットリスト機能を活用している者なら誰でも 「ネット上の情報はその内容が知らないうちに変化したり、 存在そのものがなくなってしまうことがある」ということがよくわかる。 会議では、このような情報をDLにどのように収め、管理するかについて 述べたものがあった。 (9)はそのような情報の目録を今までの図書館の目録と同様に保守する (変化した情報のエントリはその変化を反映するように変更し、 なくなった情報のエントリは削除し、常に「蔵書の生き写し」状態を保つ) にはどうしたらよいかという点について述べている。 解決法を述べてはいないが、解決法を導き出すために 考えるべき問題点を明らかにしている。 また(10)は、様々なDLの調査に基づき、WWWについていくつかの方法を 提案している。
WWWを実現のために用いたDLシステムは、今回の発表を見るだけでもかなり多い。 それらは、今までの図書館のように「情報そのもの」を持っているだけでなく 「情報の所在」を持っているものが多い。 自ずと上記のような問題が発生する。 今後もDLの研究領域で議論の的となることが想像される。
metadataとは「データのデータ」のことで、 ここでは「データの構造を定義するデータ」 「データの分類のためのデータ(分類表)」などを意味する。 特定分野のDLにおいて、metadataを情報の蓄積や検索に積極的に 利用している例が見られた(11)(12)。 また、DLの問題点を体系的に考える際に、metadataに注目している ものが見られた(19)。 metadataについて考えることはデータ形式の標準化へのステップのひとつであり、 今後も議論が続くものと思われる。
94年のconference chairpersonであるRichard Furutaと 95年のDavid M. Levyは共に 「DLは、計算機科学、図書館学、社会科学を含む 様々な領域からの知識と専門的技術から成り立っている」と述べている。 そして、様々な領域からの発表がバランスよく収められるよう 努力したということを述べている。 事実、2回の会議の発表には、 ハードウェアからソフトウェアに至る計算機科学系の話題(ネットワーク、 データベース、マルチメディアなど)、 DLにおける目録法やlibrarianの役割といった図書館学系の話題、 知的財産の扱いや政府情報・企業情報の提供といった 社会科学系の話題、 電子出版や一般人のDLの利用といった「社会との関わり」についての話題、 様々なの分野(医学、環境学、地球科学など)の情報の 特性に合わせた蓄積についての話題、 そしてそれらを含んだ個々のDL構築プロジェクトの話題、といったように、 多彩な内容が含まれている。
また、Furutaは、 研究領域を越えた研究グループを作り、 それぞれがお互いの領域を理解して研究を進めるといった open mindの持続が必要であると述べている。 Levyは、互いの領域のボキャブラリや問題解決の方法論や 将来の展望などを認識し獲得することが大切だと述べている。 DLに携わる人それぞれが、自分の持つ技量をDLに生かすことを考え、 また他の領域の知識や技術を多く身につけ 総合的な視点からDL設計・実現・利用を考えていくことが望まれている。
両会議は、現在の図書館が資料を長期間にわたって保守管理しているのと同様、 DLにおいてもディジタル資料を長期間にわたり責任を持って 管理すること大切がであるとしているようである。 95年には、長期にわたるDLの運営や責任について述べている論文があった。 また、ディジタル資料の蓄積に関する話題やDL構築プロジェクトの話題の中には、 データの無矛盾性を常に保つための工夫や 人手の介在を最小限にする自動索引付けの仕組み、 知らないうちに変化してしまうネットワーク上の情報の扱い方など、 長期間の保守管理を暗黙の背景としていると思われる技術的話題が見られた。
とは言っても、 Furutaによれば、現時点では誰も本当のDLが何であるかを知らず、 定義や限界も知らず、唯一わかっていることは、 それぞれがDL開発に対し長期間の責任ある関わりを持つことである、とのことである。 Furutaは「成果が現れるまでには2、30年かかるだろう」とさえ述べている。
Digital Libraries '96は、そのフルネームを First ACM International Conference on Digital Librariesに変え (今後ACMの主催で行われる)、 来年3月に米国メリーランド州ベセスダで、 同じ場所で行われるHypertext '96の直後に行われる。 また、Digital Libraries '97は、 SIGIR '97(情報検索に関するACM SIGIRの主催する会議)と連続して 開催されるそうである。 参加者は、連続する2つの会議に出席することを期待されているようである。 これは「DLは様々な分野の融合である」ということを意識しての設定であろう。 今後も興味深い発表が期待される。
最後に、論文(17)のPeter S. Grahamの言葉を引用して、 本稿を締めくくりたい。
"The tasks call not so much on new knowledge nor on new techniques, but upon informed commitment; that is, upon will. For computing experts seeking a goal worthy of their skills, here is their challenge. For librarians wondering what is to come of their profession in the electronic age, here is their challenge. For institutions intending to continue their mission of expanding the permanent acquisition of human knowledge, here is their responsibility."
「(DLを設立し運営するという)タスクには新しい知識も新しい技術もそんなに 必要ではないが、 博識なるコミットメントが要求される。 これはすなわち、堅い決意が必要ということである。 自分たちの能力に値する目標を探している計算機の達人たちにとっては、 ここが挑戦のしどころである。 電子化時代にどんな仕事が来るのかと不思議に思っている 図書館員たちにとっては、ここが挑戦のしどころである。 人間の知識をいつまでも集め続けることを発展させるという任務を 続けるつもりでいる機関にとっては、ここに彼らの責任がある。」
http://www.dl.ulis.ac.jp/DLjournal/No_1/sugimoto/sugimoto.html
[2] Proceedings of Digital Libraries '95: The Second Annual Conference on the Theory and Practice of Digital Libraries. Austin, Texas, USA, 1995.
http://csdl.tamu.edu/DL95/
[3] Proceedings of Digital Libraries '94: The First Annual Conference on the Theory and Practice of Digital Libraries. College Station, Texas, USA, 1994.
http://atg1.WUSTL.edu/DL94/
From the Conference Chair
David M. Levy
From the Program Chair
Richard Furuta
Full Papers
William T. Crocca and William L. Anderson (Xerox Corporation)
Steve B. Cousins, Steven P. Ketchpel, Andreas Paepcke, Hector Garcia-Molina, Scott W. Hassan, and Martin Roescheisen(Stanford Univ.)
W. Bruce Croft, Robert Cook(Univ. of Massachusetts), and Dean Wilder(Library of Congress)
Ian H. Witten, Sally Jo Cunningham, Mahendra Vallabh(Univ. of Waikato), and Timothy C. Bell(Univ. of Canterbury)
David M. Levy(Xerox PARC)
Mark S. Ackerman and Roy T. Fielding(Univ. of California, Irvine)
Peter S. Graham(Rutgers Univ. Libraries)
Shirley Browne, Jack Dongarra(Univ. of Tennessee), Ken Kennedy(Rice Univ.), and Tom Rowan(Oak Ridge National Lab.)
Cliff McKnight(Loughborough Univ. of Tech.)
Nancy A. Van House(Univ. of California, Berkeley)
Eric H. Johnson and Pauline A. Cochrane(Univ. of Illinois at Urbana-Champaign)
Hugh Davis and Jessie Hey(The Univ. of Southampton)
Charles Kacmar, Dean Jue(Florida State Univ.), David Stage(GMDNCC), and Christie Koontz(Florida State Univ.)
Douglas D. Nebert(U.S. Geological Survey) and James Fullton(CNIDR)
Shigeo Sugimoto, Seiki Gotou, Yanchun Zhao, Tetsuo Sakaguchi, and Koichi Tabata(Univ. of Library and Information Science)
Prasun Dewan, Kevin Jeffay, John Smith, David Stotts(Univ. of North Carolina), and William Oliver(Walter Reed Army Hospital)
Amanda Spink(Univ. of North Texas)
Roberta Lamb(Univ. of California, Irvine)
Peter J. Nuernberg, Richard Furuta, John J. Leggett, Catherine C. Marshall, and Frank M. Shipman III(Texas A&M Univ.)
Narayanan Shivakumar and Hector Garcia-Molina(Stanford Univ.)
Kazunori Muraki and Kenji Satoh(NEC Corp.)
Short Papers
Eytan Adar and Jeremy Hylton(M.I.T. Lab. for Computer Science)
Robert Pettengill and Guillermo Arango(Schlumberger Austin Research)
Verne E. McFarland(U.S. Environmental Protection Agency) and Steven Wyman(EPA Public Information Center)
Casey Palowitch and Darin Stewart(Univ. of Pittsburgh Library System)
Kathleen M. Flynn(The MITRE Corp.)
Aravindan Veerasamy and Shamkant Navathe(Georgia Inst. of Tech.)
Yuehong Yuan, Stephen Roehrig, and Marvin Sirbu(Carnegie Mellon Univ.)
Author Index
Keyword Index