この指摘に基づき、本稿では、日本語書誌目録用に必要となる 仕様項目を概説し、JAPAN/MARC に適用して作成している関連仕様と 試作したシステムの機能概要を述べる。
Therefore based on this, this paper explains brief of items of a additional specification needed for Japanese bibliographic and also explains a draft specification for Z39.50 JAPAN/MARC and brief of facilities of a prototype system.
Z39.50 は、欧米で構築されている電子図書館の機能の中で、 主に USmarc, UNImarc 等の MARC レコードの検索とその結果情報の 返戻を実現するために採用が進んでいる。 一方、Z39.50 を日本語書誌目録レコードに適用する場合、 UNImarc に準拠して開発された国内で代表的な MARC 形式である JAPAN/MARC[2] (以降 JPmarc) が候補に上げられる。 Z39.50 が備えている国際的な相互接続性を維持しつつ、 JPmarc レコードを検索してその結果を返戻する場合、 日本語書誌目録を考慮したアクセスポイントや検索式の構造、 返戻時の要素仕様などが別途必要になることが指摘されている。[3] この指摘に基づき、Z39.50 で JPmarc レコードを運用するための 関連仕様を作成し、これら仕様を評価することを目的に、 サーバならびにクライアントシステムを試作した。
本稿では、日本語書誌目録用に必要となる仕様項目を概説し、 JPmarc に適用した仕様と試作したシステムの機能概要を 述べる。
2. Z39.50 の国内利用に向けて
Z39.50 は、異機種ネットワーク間の相互接続性に 優れた情報検索と返戻の機能を実装する際、 有望な仕様として国際的に認知されている。 これには、ネットワークに接続された複数の図書館を 同一の利便性でアクセスできること、 OPAC と連携した図書館間の相互貸借を実現することが 主要な目的と捉えられている。
これらを踏まえてまず最初に、日本語書誌目録として公式に 流通している JPmarc 形式のレコードを Z39.50 に載せるために 必要となる関連仕様を作成、評価する環境として、 JPmarc レコードをネイティブに扱える Z39.50 サーバ、 クライアントシステムを試作している。 併せて、JPmarc をZ39.50 に載せるための関連仕様を作成している。
しかし、これだけでは、クライアントとサーバ間で検索式の 扱いを正確に交渉することができない場合がある。 特に、アジア圏の言語では空白文字による分かち書きという 表記様式が一般的でないこと、日本語における片仮名、平仮名、 ローマ字、漢字などの同一内容の異表記の可能性、これによる 典拠コントロールの繁雑さという問題が存在する。 これらを検索時のアクセスポイントを表現する Bib-1 などの属性集合で如何に指定するのか、 また、検索結果の返戻時に指定する要素仕様を どのように対応あるいは拡張するべきか、 解決しなければならない課題は多い。
主に欧米において Z39.50 の規格開発に携わる人達に、 問題意識に上る必然性のないこれらの課題の解決を 期待することは難しい。 一方で、Z39.50 の国際的な利用が進もうとしている現在、 各国の言語特性を Z39.50 に反映させるよう、 各言語圏から必要な仕様を提案していくことが求められている。 これらの仕様をスキーマとして Z39.50 の規格に登録することで、 電子図書館の検索と返戻機能の面で、 言語圏を考慮した国際的な連携が実現できると期待される。
この他にも、国内にはベンダー固有の MARC レコードが広く 流通しているという現状がある。 しかし、JPmarc は国内で公式に流通している MARC であり、 JPmarc 形式のレコードが公的機関から求められているため、 現在も作成されている。 このような状況を踏まえて、日本語書誌目録を Z39.50 で扱う 最初の候補を JPmarc とした。
なお、以下に上げていない仕様項目の中で、特に JPmarc フィールド のインデックス仕様がある。これについては、現時点では未だ明確な 推奨仕様を提示していない。フィールドデータの 1 バイトあるいは 2 バイトモードの差異、加えて数字とそれ以外という区別等に応じて、 幾つか異なるインデックス方式が存在すると考えられる。 特に 2 バイトコードで表現される日本語文字列については、 推奨される分かち書き方式を提示することが望ましいと思われる。 USmarc 等の場合、推奨されるインデックス仕様までをスキーマで 定義していないこともあり、JPmarc については現段階では未提示とし、 今後の課題としたい。
フィールド項目 値 JPmarc 対応フィールド識別子 レコードコントロール番号 12 001 ISBN 7 010 $A 全国書誌番号 48 020 $B レコード登録日付 1011 100 $A (先頭 8 桁) 著者名 1003 251-259 $F 291-299 $F 751-759 $A $X $B 791-799 $A $X $B 書名 4 251-259 $A $B 291-299 $A $B 280 $A $D 551-559 $A $X $B 580 $A $X $B 591-599 $A $X $B 双書名 5 280 $A $D 580 $A $X $B 出版地 59 270 $A 出版者 1018 270 $B 出版年月 31 270 $D 一般注記 1130 350 $A 原書名 35 354 $A 内容注記 1131 377 $A 件名 21 650 $A $X $B 658 $A $X $B 個人件名 1009 650 $A $X $B 一般件名 1124 658 $A $X $B NDC分類記号 1116 677 $A NDL分類記号 1117 685 $A $X NDL請求記号 1118 905 $A
構造 値 分かち 2 片仮名字形 200 ローマ字形 201 漢字形 202
トランケーション 値 日本語正規表現 103
JPmarc フィールド識別子 フィールド名 001 レコード識別番号 010 ISBN 020 全国書誌番号 100 一般的処理データ 251 書名と著者に関する事項 270 出版に関する事項
JPmarc では日本語文字コードに JIS X 0208 (旧 JIS C 6226-1978)、 また、これら文字コードの制御文字コードに JIS X 0207 を使用している。 Z39.50 で日本語文字コードのようなマルチバイトを扱う際、 データレベルでは問題無く扱うことができる。 しかし、このままでは、 サーバ-クライアント間で相互に文字集合と言語を 交渉して認識することができない。 これを補う仕様として開発された「文字集合と言語の交渉規約 #2 」 の内、文字集合の符号化方式として、JIS 文字集合を忠実に扱える ISO 2022 のエスケープシーケンスに基づいた方式を採用している。
また、ネットワークの側面から想定される Z39.50 クライアントの 利用上の課題として、プライベートネットワーク上の Z39.50 クライアントから インターネット上の Z39.50 サーバに接続することが上げられる。 これには NAT (Network Address Translator) 機能を有する ルーティングサービスが必要となる。 海外の Z39.50 クライアントには、このための対応として SOCKS 連携機能を付加した製品が昨年からリリースされるようになり、 試作システムでもこれに対応した。
図1. JPmarc 対応 Z39.50 試作システムの関連
図2. JPmarc 対応 Z39.50 試作システムのプロトコル層
図3. JPmarc 対応 Z39.50 サーバシステム構成の概念
図4. JPmarc 対応 Z39.50 クライアントシステム構成の概念
図5. JPmarc 対応 Z39.50 サーバに接続
図6. 日本語書誌目録用の検索フィールド項目の集合を設定
図7. 検索式の入力ならびに検索実行
図8. JPmarc フィールドの索引語を表示
図9. JPmarc ネイティブレコードの概要表示
図10. JPmarc ネイティブレコードの詳細表示
図11. JPmarc レコードの概要表示(SUTRS)
図12. JPmarc レコードの詳細表示(SUTRS)
図13. JPmarc レコードの概要表示(GRS-1)
図14. JPmarc レコードの詳細表示(GRS-1)
図15. JPmarc ネイティブレコードの詳細表示(フィールド名)
JIS 規格化も行われた現在、USmarc, UNImarc のように日本語書誌目録 についても今後 Z39.50 による流通が進むことが予想される。 このために必要となる関連仕様を、まずは JPmarc レコードを想定して 作成してきた。これらの仕様は、国内における Z39.50 の利用に際して 参考あるいは参照されることで、より適切な仕様に改良されることが 必要であり、Z39.50 管理団体に申請する日本語書誌目録用のスキーマの 参考になれれば幸いである。
最後に、試作システムの評価用に JPmarc レコードを提供して頂いた 図書館流通センターの菅原さん、また様々にご意見頂いた Z39.50 の国内メーリングリストの皆さんに感謝します。
[2] JAPAN/MARC マニュアル - 図書編 - 第 1 版, 国立国会図書館, 1992.
[3] 石田, Z39.50 と日本語書誌目録の連携に関する考察, 情報処理学会データベースシステム/情報学基礎合同研究会報告, Vol.99,No.39,pp.81-88, 1999.
[4] Character Set and Language Negotiation (2) http://lcweb.loc.gov/z3950/agency/defns/charsets.html
[5] GILS(Global Information Locator Service/ Government Information Locator Service), U.S. Geological Survey. http://www.usgs.gov/gils/
[6] Index Data, http:://www.indexdata.dk/.
[7] 日本語形態素解析システム『茶筌』version 1.5 使用説明書, 奈良先端科学技術大学院大学 松本研究室, 1997.