1) 図書館情報大学大学院修士課程
〒 305 つくば市春日 1-2 E-mail: kawate@ulis.ac.jp
2) 図書館情報大学
〒 305 つくば市春日 1-2 E-mail: ishikawa@ulis.ac.jp
1) MA Student of the University of Library and Information Science
Address: 1-2 Kasuga, Tsukuba, 305 Japan
E-mail : kawate@ulis.ac.jp
2) Prof. Dr. of the University of Library and Information Science
Address: 1-2 Kasuga, Tsukuba, 305 Japan
E-mail : ishikawa@ulis.ac.jp
In this paper, we present this system functions, and discuss difficult problems including terminology which must be solved in order to use this system in actual.
テキスト・デ−タ DB を対象とする検索に、一般的には検索語(キ−ワ−ド、 以下 KW と記す) による検索指示が行われている。そこで上記の目的のような、異なる文字種 KW による検索を可能に するには、検索インタ−フェイス機能として、例えば既に石川において研究している英日・日英 KW 翻訳システム[1]のような日中・中日 KW 翻訳システムの実装が必要になる。しかし、KW 翻訳システ ムの実装には、現時点おいて技術的課題から精度の面において実利用には未だ問題がある。これに対 して MARC-DB は書誌デ−タ DB であり、デ−タ項目として分類標数があることから、双方の MARC 内に設定されたの分類標数を利用することを考え、当システムの開発を図った。分類標数による検索 の利点として下記の点がある。
1) 資料の主題が標数で表現されているので、KW のように言語種を意識することなく検索が可能
2) 主題の体系的・系統的検索が可能であり、また関連主題の階層的検索が可能
このことから、ユーザが入力した KW を分類標数に変換・生成し MARC-DB を検索するシステムを 開発した。具体的には、検索語として利用者が指示する日中それぞれの KW を基に、先ず日本十進分 類表(NDC)あるいは中国図書・図書館分類表(CLC)内の分類名辞(図1)を検索し、双方分類標数 生成規則に従い分類標数を自動生成し、その分類標数を基に China-MARC-DB あるいは Japan-MARC-DB の検索を行うシステムである。ここで対象とする MARC-DB である Japan-MARC と China-MARC は 、どちらも UNIMARC に準拠している。
一方、図書館における国外の収集資料の蔵書管理は、一般的に各国別の蔵書構成の基に行われてい る。但し、国内利用者の為に、配架分類は当該図書館利用の分類法に従い行われているのが通常であ る。このことから日本図書に対し北京図書館おいては、CLC に基づく配架分類標数の作成に、 Jpan-MARC-DB 内の NDC 分類標数を参考に作成している。そこで、CLC に基づく配架分類標数の作成に、当 システム内の配架分類標数を自動生成する機能が利用可能となっている。
以下、次章において開発システム機能の概要を示し、3章において当システムの実利用の為に開発 を必要とする課題について述べる。
1. 日中の KW よりシソーラス展開済み NDC もしくは CLC 分類標数を検索・抽出する機能
2. 検索した分類標数と同一概念をあらわす分類標数を対照表を用いて変換する機能
3. 分類標数生成規則に基づいて配架分類標数を自動生成する機能
4. 生成された分類標数を用いて MARC-DB を検索する機能
5. 表示のため検索された MARC データ中の文字コードである JIS コードと GB コードを変換する 機能
以下で、上の5つの機能について述べる。
(Step 1) 検索指示日本語 KW を基にシソーラス展開済みの NDC 分類名辞を前方一致により検索す る
(Step 2) 検索された名辞に対応する NDC 分類標数を抽出する
(Step 3) 利用者が選択した NDC 分類標数を基に対照表を検索し、CLC 分類標数を認識する
検索される NDC 分類標数は1つとは限らない。そこで、利用者は Step 2 の検索結果に対し一意の NDC 分類標数を選択する。また、NDC 分類標数と CLC 分類標数は必ずしも 1 対 1 に対応するとは 限らない。したがって、Step 3 で認識された CLC 分類標数が複数である可能性がある。
(Step 1) 検索指示中国語 KW を基に CLC 分類名辞展開シソーラスを前方一致により検索する
(Step 2) 検索された名辞に対応する分類標数を抽出する
(Step 3) 利用者が選択した CLC 分類標数を基に対照表を検索し、 NDC 分類標数を認識する
検索される CLC 分類標数は 1 つとは限らない。そこで、利用者は Step 2 の検索結果に対し一意 の CLC 分類標数を選択する。また、CLC 分類標数と NDC 分類標数は必ずしも 1 対 1 に対応すると は限らない。したがって、Step 3 で認識された NDC 分類標数が複数である可能性がある。
すなわち、 {主題標数}+{補助標数} で構成する。
例として「情報科学辞典」という NDC 分類標数を生成してみる。主題をあらわす KW は「情報科 学」で、形態をあわらす KW は「辞典」である。NDC においては「情報科学」 には"007"という主題 標数が与えられており、「辞典」には補助標数の 1 つである形式区分標数"033" が与えられている 。両者の分類標数を生成規則に従って生成すると、007.033"となる (主題標数と補助標数の間にピリ オドを打つ)。
CLC の標数は、英数字と数種類の記号で構成されている。「情報学辞典」という CLC 分類標数を 生成してみる。「情報科学」に相当する「情報学」には"G350" という主題標数が与えられており、 「辞典」 には補助標数の 1 つである総記再区分標数"-61" が与えられている。両者の分類標数を生 成規則に従い生成すると"G350-61" となる(図5)。
このように、分類標数の構造はおよび分類標数の組合せ規則は、分類表のよって異なる。したがっ て、分類標数を生成するためにはそれぞれの分類表の分類標数生成規則に従わなければならない。こ のため、分類標数の生成には分類標数生成規則に関する専門的な知識が必要となる。
そこで、ユーザが分類標数の生成規則に専門的な知識を持たなくても分類標数を生成できるよう、 それぞれの生成規則に必要な注記情報を抽出し、分類標数を自動的に生成する機能化を試みた。
そこで、ユーザが入力した KW に基づいて生成された分類標数と MARC に付与されている分類標数 との比較によって検索を行う(図6)。
以上のシステム機能により、日本語 KW で China-MARC を、中国語 KW で Japan-MARC を検索でき るシステムを実現した。
1)NDC/CLC 分類標数の相互参照デ−タの完成
資料管理を目的とする分類表に、国際十進分類表 (UDC) があるが、図書館の蔵書管理には、各国 固有の文化等を基に各国において作成されている分類表が実際には利用されている。この結果、分類 体系は各分類表において微妙に異なっている。日中の図書館においても NDC と CLC が利用されてお り、双方の分類体系が異なることから、日中 KW による分類標数の相互検索の為に、双方個々の分類 標数に対する相互参照デ−タの作成が必要になる。
2) 分類名辞のシソ−ラス展開
分類標数に対する分類名辞は、個々の分類標数の概念範疇を呈示する役割を持ち、通常、代表的な KW あるいはキ−フレイズ(句)、もしくは語例により呈示されている。現行の分類表 (図1)は、人 間(分類標数作成者)が使用することを前提に作成されており、その数は十分でなく、指示 KW に対 し過不足の状態にある。そこで、今回作成した NDC 分類名辞展開シソーラス(図7)は、NDC の機械可 読データである NDC・MRDF8[4]の分類表本表中の分類名辞を中心に、分類名辞と完全一致した JICST シソーラスの見だし語(図8)、および分類表付属の相関索引(図9)をもとに、シソーラス展開を行な った。このように、検索率を補償する為には、全ての分類名辞に対して、少なくとも十分な同義語展 開が必要になるのと同時に、図書館における同義語更新を可能とするシステム機能の提供が必要にな る。
3) 分類標数自動生成機能の完全化
配架分類標数は、資料の配架上、基本的には資料の主題標数と形態標数の組み合わせによって構成 することになっている。当組み合わせ(分類標数生成)規則は、主題特性および形態特性に基づき、 各分類表内の分類標数に、必要に応じ個々に注記として記述されている。分類標数の生成には、当注 記を理解し生成する必要があり、システム化には当機能の完全化が必要になる。
4) 分類標数生成規則の更新機能化
分類標数生成規則は、上記のように分類表別に制定されているが、それは標準的なものであり、通 常、各図書館の特性の基に、各図書館固有の運用規則にて修正し、利用している。そこで、当システ ム提供の標準的な分類標数生成規則に対して、各図書館において分類標数生成規則を修正できるシス テム機能の提供が必要になる。
[2] T. Ishikawa. The Man-Machine Interface Aspect of an Automatic Classification Numbering System in a Computerized Library System. J. Information Procesing, Vol. 3, pp. 119-205, 1988.
[3] T. Ishikawa, T. Nakamura, and Y. Nakamura. UDC Number Automatic Combination System (UDC-AUTCS). Proceedings of the 3rd International ISKO Coference, pp. 328-333, 1994.
[4] 日本図書館協会編. NDC・MRDF8. 日本図書館協会, 1989.
[5] 安岡孝一, 一谷素子 . GB 漢字 ←→ JIS 漢字相互変換ツールの開発. 開発研究論文集 / 全国 共同利用大型計算機センター, Vol. 16, pp. 67-74, 1994.
[6] http://www.ifcss.org/ftp-pub/software/x-win/cxterm/.