The Electronic Text Center at the University of Virginia Library
バージニア大学図書館における電子テキストセンター

David Seaman
Director, Electronic Text Center
Alderman Library
University of Virginia
Charlottesville, VA 22903, U.S.A.
Tel.: 804-924-3230 Fax: 804-924-1431
E-mail: etext@virginia.edu
URL: http://etext.lib.virginia.edu

Kendon Stubbs
Associate University Librarian
Alderman Library
University of Virginia
Charlottesville, VA 22903, U.S.A.
804-924-3026 Fax: 804-924-1431
E-mail: kstubbs@virginia.edu

(訳:杉本重雄・図書館情報大学)

概要

電子テキストセンターは図書館における人文科学分野向けの計算機を利用したサー ビスであり、次の2点がその中心的な役割である。

5年間の活動を通して、オンライン利用可能ないろいろな言語のSGMLテキストを 多く集積してきた。また、数多くの講習会を通じてトレーニングを受けた 多くの学生と教官が、我々のサービスを教育と研究の場で利用する高度な 利用者となっている。

キーワード

電子テキストセンター、電子テキスト、SGML、HTML、ディジタルイメージ、 全文データベース、ディジタル図書館、オンライン・ライブラリ、 人文科学における計算機の利用、インターネットのトレーニング、教育と技術

はじめに

5年近く業務を行なってきたバージニア大学図書館・電子テキストセンターはオンラ イン・コレクションの蓄積を進めるとともに大学内外での電子テキストの利用の促 進に努めている。 本電子テキストセンターは、Oxford English Dictionary、English Poetry Database、Patrologia Latinaといった1990年代始めに出版された人文科学分野に関 連する商用の電子テキストの最初の波に対応するため図書館によって設立されたも のである。 1992年にバージニア大学図書館では、利用者からの要望の高まりに先立ち、 人文科学における計算機の利用の促進と発展を担うセンターのために場所と機器、 ならびにスタッフを導入することを決めた。 このセンターの仕事は、電子テキストの作成と分析のための機器を利用可能にする こと、そうした機器や技術のトレーニングを行なうこと、バージニアの人文科学に おけるSGMLの利用の発展を担う活動の中心として働くこと、インターネットを介し ては提供されていない電子テキストの利用のための場所を提供することである。

所蔵電子テキスト

現在、インターネットを介して利用できる数千の電子テキストとイメージを所蔵し ている。 以下に示すように、その内には商用のものが含まれ、それらはバージニア大学ある いはVIVA(Virtual Library of Virginia、訳者注)の39のサイトでのみ利用するこ とができる。 UNIXのサーバにロードし、インターネットを介して利用者に提供するため、我々は こうした大きな商用の電子テキストファイルをCD-ROMではなくSGMLのデータファイ ルとして蓄積してきた。

The Oxford English Dictionary (25 volumes) 
English Poetry Database (4,500 works) 
English Verse Drama Database (1,500 titles) 
English Prose Drama Database (1,500 titles) 
American  Poetry Database (4,500 works) 
African-American Poetry Database (2,500 poems)

以下のものの利用はバージニア大学内のみに限られている。

The Patrologia Latina (221 volumes)
The Old English Corpus (3,000 items)
British philosophy: 1600-1900
American Civil War newspapers

(訳者注:バージニア州の高等教育機関における情報資源の効率的な利用のために州 内の学術図書館で構成するコンソーシアム)

このほか文学、歴史、哲学、および宗教関係の資料が数多くあり、またいろいろな 言語で書かれている。その中には18・19世紀に出版された英語の文学書と歴史書 (挿し絵のあるものも多く含まれる)、フランス語、ドイツ語、ラテン語、日本語 および中世英語のものがある。後に示したものの大半はインターネット利用者に開 放されている。現在、電子テキストセンターのWebサーバには世界中から一月当たり 100万件のアクセスがある。これを1日当たりに換算すると、4000の異なるマシンか ら、15,000ページの資料が33,000回アクセスされたことになる。

我々の電子テキストは全てSGML(Standard Generalized Markup Language)を用いて 記述されており、World Wide Webを介した利用のためにそれらは自動的にHTMLに変 換される。我々が作成ないしマークアップした電子テキストはText Encoding Initiative(TEI)のガイドラインに従い、センターのスタッフによってタグ付けされ ている。また、新しく電子テキストを作成するためにバージニア大学および他大学 の学生や教員と協力する機会が増えてきている。Japanese Text Initiativeは新た な電子テキストを作成するために協力した好例であろう。これはバージニア大学 のKendon Stubbsとピッツバーグ大学の野口幸生が共同で作成したもので、SGMLで記 述され、インターネット上で検索が可能な日本文学資料のコレクションであり、 現在も増えつつある。

英語の電子テキストはバージニア大学図書館のスペシャルコレクションから選ばれ たもので、多数のJeffersonの手紙、Mark Twain関係の資料、19世紀のアフリカ系ア メリカ人に関する歴史資料が含まれている。教員も学生も電子テキストセンターを 使うにつれて、目的に合わせて我々の資料を整形したり補足したりしたテキストを 作るようになり、オンライン情報の消費者から生産者に変わってきている。19世紀アメ リカの小説家に関する教材であるStephen Railton教授のMark Twain in his Timesは本学教員によって電子的な資料が利用された好例である。

オフライン利用のための電子テキスト

我々の所蔵資料の多くはWWWを介して利用可能であるが、法律的もしくは技術的な理 由でオンライン利用可能にできないものもある。それらは、Global Jewish Database、Thesaurus Linguae Graecae(古代ギリシャの作品8000点)、Perseus (ギリシャ語テキストとイメージからできたハイパーテキスト)、CETEDOC(ラテン 語の神学資料)、Admyte (中世スペイン語)、Robert MusilとImmanuel KantおよびThomas Aquinasの作品、19世 紀アメリカの詩集である。

アクセス

電子テキストの多くがオンライン利用可能であるので、我々は単一の検索ソフト ウェア(OpenText社製)でコレクションの検索を行い、NetscapeのようなWWWブラウ ザを共通でかつ親しみやすいユーザインタフェースとして利用している。我々は、 利用者による検索とブラウジングのために、SGMLからHTMLへの変換等のためのCGIス クリプトを開発してきた。これらによってもたらされる利用者のメリットは明らか である。すなわち、一つのデータベースの使い方さえ知れば、任意の所蔵資料の検 索ができるようになり、CD-ROMの場合のようにディスク毎に使い方が異なるといっ たフラストレーションを感じることがなくなる。

利用者

本センターの主要な目的はバージニアにおける人文科学分野の電子的資料の幅広い ユーザ・コミュニティを築くことである。この目的のため、我々は定期的な講習会 を開いている。そこでは資料のスキャニング、HTML、電子テキストやイメージの利 用方法や生成方法に関する様々な話題について講習している。この5年間、作文の講 義を受講している学部1年生から、アングロサクソン文学、アメリカ学、ラビ回答書、 中世フランス語、その他様々な教育研究プロジェクトに携わっている大学院生に 至るまで個別の利用者に対する仕事を毎日行ってきた。また、バージニア 大学のInstitute of Advanced Technology in the Humanities(訳者注:人文科学 において利用できる先端技術の研究開発を行っている)の人達を支援してこれたこ とを喜びとしている。

大学出版局、学術出版社、学術雑誌の制作者、ならびに拡大しつつあるディジタル 図書館との連携を強めるよう努力している。我々は、The Visual Anthropology ReviewとEsays in Historyというバージニア大学で編集・制作されている2つの学術 雑誌を支援し、我々のサーバ上にオンライン出版のための場所を提供している。ま た、我々は、Univeristy Press of Virginiaから出版されたTimothy D. Pyattによ るGuide to African-American Documentary Resources in North Carolina (Charlottesville, 1996)とMichael PlunkettによるAfro-American Sources in Virginiaの検索可能な電子テキストを作成した。現在、雑誌Studies in Bibliographyの50年分のSGMLへの変換を終了しつつある。これはインターネット上 での提供を目指したもので、バージニア大学の書誌学会(Bibliograhical Society)が進めている大きな出版プログラムの一部として行われたものである。

さらに、The American Heritage Virtual Archive Project (EAD)とThe Electronic Archive of Early American Fictionという二つの 大きなプロジェクトを助成を受けて進めている。後者は本会議におけるもう一つの論文で述べて いる。前者はNational Endowment for the Humanities(NEH)から バージニア、Duke、Stanford、カリフォルニア大学バークレー校(UCB)に対して与え られたものでEAD(Encoded Archival Description)タグを用いて大量のアーカイブ検 索支援用資料をSGML化するものである。

本電子テキストセンターは同様な試みを始めようとする機関にとってのモデルとな ることが多くなってきている。これまでに数多くの図書館員や研究者が本センター を訪れ、それらにはHarvard、Duke、Indiana、Johns Hopkins、Iowa、Yale、 Columbia、Chicago、Kentucky、UCB、Virginia Tech.、Richmond、UNC Chapel Hill(ノースカロライナ大学)、UT Austin(テキサス大学)、Emoryの各大学と National Humanities Center、ヨーロッパから英国図書館、Oxford、Cambridge、 Nottingham、Glasgow、Leiden、Bielfeld、Groningen、日本の国立国会図書館、大 阪外国語大学、図書館情報大学、オーストラリアのSydney、Macquarie、それに Curtin大学が含まれている。こうした交流は電子テキストとイメージに関するサー ビスを各地に広げることを推し進めることになるので、我々にとって重要な活動で ある。

今後の5年間は、人文科学研究者にとってVRML(Virtual Reality Modeling Language)やインターネット全体を対象とする検索ツールがさらに利用しやすくなる ことで、これまでの5年間と同様に非常に大きな変化を目にすることになるであろう と考えている。我々のユーザ・コミュニティの要望もニーズも徐々に洗練されたも のなりつつあり、出版社が作り出す電子テキストとイメージの量は飛躍的に大きく なりつつある。激しい技術革新の中でも長期に渡って生き残るようにデータは SGMLのような標準化された形式で蓄積されねばならず、また長期に渡ってオンライ ンサービスを存続させるには図書館と図書館が持つ技術が中心的役割を果たさなけ ればならない。我々のサービスにおけるこうした基本的認識は利用者や出版社が進 歩しても変化することはない。

参考文献

The Modern English Collection http://etext.lib.virginia.edu/modeng/modeng0.browse.html

British Poetry 1780-1910 http://etext.lib.virginia.edu/britpo.html

Mark Twain in his Times http://etext.virginia.edu/railton/

Japanese Text Initiative http://etext.lib.virginia.edu/japanese/

Electronic texts from Special Collections http://etext.lib.virginia.edu/speccol.html

Timothy D. Pyatt. Guide to African-American Documentary Resources in North Carolina. Charlottesville, 1996. http://www.upress.virginia.edu/epub/pyatt/

Michael Plunkett. Afro-American Sources in Virginia. A Guide to Manuscripts. Charlottesville, 1995. http://www.upress.virginia.edu/plunkett/

Essays in History http://etext.lib.virginia.edu/journals/eh/

The Visual Anthropology Review http://etext.lib.virginia.edu/VAR/

SGML Resources http://etext.lib.virginia.edu/sgml.html

VIVA, the Virtual Library of Virginia http://www.viva.lib.va.us/

The Bibliographical Society of the University of Virginia http://etext.lib.virginia.edu/bsuva/

The Electronic Archive of Early American Fiction http://etext.lib.virginia.edu/eaf/

The American Heritage Virtual Archive Project (EAD) http://etext.lib.virginia.edu/ead/