以上の基本方針のもとにプロトタイプシステム開発の基本条件を以下のように定めた.
情報提供機能は,データベースに格納された情報を検索する情報検索機能,利用者の端末における読書を支援する電子読書支援機能,データベースに登録された情報を利用者に自動発信する情報発信機能から構成される.
情報構築/収集機能機能は,既存の図書・雑誌(アナログ情報)のディジタル化機能,Web情報(ホームページ情報)収集機能から構成される.
運用業務支援機能は,著作権管理機能,課金管理機能,利用者管理機能,コンテンツ情報管理機能から構成される.図1にプロトタイプシステムの機能概要を示す.
図1.プロトタイプシステムの機能概要
プロトタイプシステムでは,利用者の検索要求を受け付けて,データベースを検索して検索結果を利用者に提示する情報検索機能,検索結果(一次情報)を効果的に参照する電子読書支援機能,さらにデータベースに情報が登録されると自動的に情報を利用者に提示する情報発信機能から構成される.図2に情報提供機能の概要を示す.
図2 情報提供機能の概要
(1)統合検索機能
検索機能は,図書・雑誌,Web情報(ホームページ情報),映像情報を同一の利用者インタフェースで検索する統合検索機能を実現する.この統合検索機能は,基本検索機能,拡張検索機能,検索支援機能から構成される. なお,統合検索で検索した結果に対して,より対応するメディア毎に詳細な検索を可能とするために,図書・雑誌詳細検索機能,映像情報検索機能を利用できるようになっている.ここでは,(4)で映像情報検索について述べる.
●基本検索機能と拡張検索機能
統合検索機能には,キーワード検索(ワイルドカード対応),メニュー形式の入力による検索,論理式(AND,OR,and NOT)による検索,分類表(NDC)を利用した基本検索機能の他に,SGML文書の論理構造に対応した論理構造検索,文書の階層性を意識した階層構造検索,ある文書を指定してそれと類似した文書の類似情報検索,自然言語風の入力による検索機能,の拡張検索機能がある.
●検索支援機能
検索条件としてキーワードが入力された場合に,そのキーワードを同義語に展開して検索する機能や翻訳(日英&英日)して検索する検索支援機能も含まれる.
(2)検索結果表示機能
検索結果の表示機能には,検索結果の集合の中から利用者とって不要な情報を削除して表示するフィルタリング機能,検索結果として表示された情報から,求める情報の選択を効果的に行うための支援機能,検索結果を再利用するための検索履歴情報を管理する機能から構成される.
●フィルタリング機能
フィルタリング機能は,検索結果の集合の中から利用者プロファイルの中のフィルタリング条件に従って不要な情報を自動的に除く機能である.フィルタリング機能は,前述した不要な情報を除く機能と,フィルタリングした結果に対する利用者の評価結果をフィルタリング条件に反映するフィードバック機能から構成される.
なお,初期のフィルタリング条件は,プロトタイプシステムがシステムの提供するデータをもとに自動的に設定する.利用者は,この初期フィルタリング条件をカスタマイズして利用する.
●情報選択支援機能
情報選択支援機能は,検索結果として表示された書誌情報(表紙情報がデータとして存在すれば,それも含めて)をタイトル名,著者名,出版社名,出版年等などで並び変えて再表示する機能,検索した結果の各情報に検索条件に対する適合率(ランク付)を付けて表示する機能,検索結果の情報がフルテキスト情報の場合,ヒットした情報の要約を作成して表示する機能や実際にヒットした文字列を含む文,または段落を表示する機能,から構成される.
●検索履歴管理機能
検索履歴管理機能は,利用者ごとに検索条件と検索結果を検索履歴として格納管理する機能である.この検索履歴は,参照,編集することが可能であり,また,検索結果集合を対象に検索条件を変えて再度検索することが可能である.
(3)他機関検索機能
他機関検索機能は,他情報源(他の図書館など)を横断的に検索する機能である.この横断検索機能は,他の情報源に対する検索条件と検索結果を蓄積・分析して,利用者に検索先を推薦する機能や複数の検索先から得られた検索結果をマージして表示する機能から構成される.
(4)映像情報検索
映像情報に対する書誌情報や後述する映像インディキシングで付加するテキスト情報は,統合検索で検索できる.ここで述べる映像情報検索機能は,映像情報を対象にして詳細な映像情報を検索する機能である.この機能は,映像情報を入力(MPEG7に変換)して検索に必要となる情報を半自動的に取得したり,映像情報に検索に必要となる情報を付加する映像インディキシング機能,映像インデッキシング機能で半自動的に抽出・付加された情報をもとに検索し,参照する機能から構成される.
●映像インディキシング機能
映像情報インディキシング機能は,映像情報の物理情報(カット変化点,エフェクト区間,カメラアクション)を自動的に抽出する機能,映像情報に論理情報(撮影テーマ等)を付加する機能,自動的に抽出された静止画像内のオブジェクトにオブジェクト情報(オブジェクト説明情報,オブジェクト位置等)を付加する機能から構成される.
●検索・参照機能
映像情報検索機能は,書誌情報検索(映像情報に関する書誌情報),映像情報インディキシング機能で抽出・付加した情報を対象にしたキーワード検索,論理式による検索機能,静止画像を提示してそれに類似した静止画像(映像情報インディキシングで抽出した映像毎の静止画像列)を検索する類似画像検索機能から構成される.検索した結果の映像情報は,端末で参照することができる.
(1)SGML文書のHTML文書自動変換する機能
プロトタイプシステムでは,基本的には,図書や雑誌の情報は,SGML文書で,格納管理する.この機能は,汎用ブラウザでも端末に表示できるようにSGML文書をHTML文書に自動的に変換する機能である.
(2)ブックメタファ表示機能
ブックメタファ機能は,HTML文書を「本」のイメージで文書情報を端末に表示する機能である.このブックメタファ機能は,以下の機能から構成される.
図3にブックメタファ機能による表示イメージを示す.
図3 ブックメタファによる表示イメージ
(3)読書支援機能
読書支援機能は,以下の機能から構成される.
この機能は,情報の自動発信機能,発信した情報に対する利用者の評価結果を利用者プロファイルに反映させるフィードバック機能,自動的に情報を発信する条件を利用者プロファイルに設定する環境設定機能から構成される.
図4 既存図書・雑誌(アナログ情報)のディジタル化機能の概要
(1)ディジタル化基本機能
既存図書のディジタル化基本機能は,OCRから入力された情報の文字認識する機能と認識結果をSGML文書形式に変換する機能から構成される.
●文字認識機能
印刷された図書や雑誌などの紙の媒体を入力して媒体上の文字を認識する機能である. 文字認識は,媒体上レイアウトの解析を行い,図表領域とテキストの領域を自動的に分離した後に行われる.文字認識機能には,カラーの印刷物に対する文字認識機能や旧字体の文字の認識機能も含まれる.誤認識された文字情報の修正作業を支援する機能もある.
●SGML文書変換
文字認識された情報をSGML文書に変換する機能である.この機能では,前もって準備されたDTD群の中から既存図書に対応する,あるいは類似するDTDを自動的に選択して,SGMLのタグを設定する.
(2)個別情報作成・編集機能
個別情報作成・編集機能は,(1)で述べたディジタル化基本機能を利用して,既存図書・雑誌の論理単位(表紙,目次,本文,その他)毎に各情報を作成・編集する機能である.この機能は,各々の情報の作成・編集機能と各情報間にリンクを設定する機能から構成される.
●論理情報単位のディジタル化情報の作成・編集機能
書誌情報作成・更新機能は,SGMLのタグを設定された情報から書誌情報を自動的に作成する機能と書誌情報として不足する項目を設定する機能である.
目次情報作成・更新機能は,既存図書の目次部分の情報を自動的に文字認識し,目次情報に階層構造検索用のタグを設定する機能である.
本文情報作成・更新機能は,既存図書の本文部分の情報を自動的に文字認識し,その認識された文字情報と,イメージデータとして格納されている図表部分と対応するDTDをもとにしてSGML文書に変換する機能である.
表紙情報は,カラーイメージスキャナーから入力し,入力された情報から,検索結果として書誌情報と一緒に表示される縮小画像(縮小表示してもタイトルが認識し易い形式)も自動的に生成する機能である.
帯,奥付情報作成・更新機能は,既存図書に関する帯,奥付情報を自動的に文字認識を行う機能である.
●リンク設定機能
リンク設定機能は,表紙,目次,本文,「帯,奥付」情報の作成・更新時に対応する情報間のリンク付けを行う機能である.このリンク情報を利用して端末に表示されている情報の論理単位での移動が可能となる.図5に情報間(書誌情報,目次情報,本文情報,表紙情報,帯や奥付)のリンク関係設定後のイメージを示す.
図5 情報間のリンク関係設定
図6 ホームページ収集機能の概要
(1)収集環境設収定機能
収集環境設定・更新機能は,ホームページ情報の収集条件を設定したり既存の収集環境を更新したりする機能である.
収集環境として設定する情報には,収集する範囲に関する情報(収集をはじめる初期URL,収集するホームページ情報のリンク幅と深さ,ドメイン内かドメイン外も含むか,プロキシーサーバのアドレス),ホームページ情報の収集に費やす時間的な制限情報(最大アクセス時間,サイト当たりの最大アクセス回数,最大通信待ち時間),その他(リンク先不明のURL対応方法,本体収集か検索情報とURLのみかの指定等)がある.
(2)ホームページ情報収集機能
ホームページ情報収集機能は,収集環境に従ってホームページ情報を収集する機能である.この収集機能には,収集対象となっているホームページ情報に対して収集確認のメールを発信する機能がある.また,ホームページ情報の本体を収集する場合には,そのホームページ情報のバージョン管理が行われる.
(3)ホームページ情報検索環境設定機能
ホームページ情報検索環境設定機能は,収集したホームページ情報を検索可能な形態にする機能である.この機能は,収集したホームページ情報の中から公開するのに適していない情報を削除する機能,収集された情報に,NDC分類情報を付加する機能,追加の必要のあるホームページ情報を追加する機能や収集した関連する情報間のリンク情報を設定する支援機能,収集したホームページ情報に書誌情報(Dubilin Coreの15項目)を設定する機能から構成される.
プロトタイプシステムの著作権管理は,著作権を持つディジタル情報を利用者に送付するケースを,通常,図書館で行なわれている「貸出し」という概念ではなく,「提供」という概念で考えている.すなわち,情報(ディジタルコンテンツ)の有償/無償に関わらず利用者の要求に応じて利用者端末に情報を送付し,利用者には,返却の義務は無いものと考える.
有償にしても無償にしてもの著作権保護の仕組みとそれと関連するセキュリティ機能が必要であり,著作権管理では,以下を考慮して著作権管理機能を実現する.
・適正な利用者に対する情報(コンテンツ)の提供機能
→暗号化された利用者情報,コンテンツ情報チェック
・不正な利用者に対する情報(コンテンツ)の横流しの防止と不正利用の検出機能
→暗号化して送付,提供する情報にコンテンツ情報(利用者情報,利用条件,「電子すかし」,閲覧手段の制御情報)の付加,「電子すかし」による不正利用検出
・不正な第三者による情報の改ざんの防止機能
→暗号化して送付.
(2)著作権管理機能
著作権管理は,利用者による検索要求から,利用者が参照するまでの各プロセスでの対応が必要となる.図7に著作権管理機能の概要を示す.
図7 著作権管理機能の概要
●コンテンツ情報チェック機能
コンテンツ情報チェック機能は,利用者が情報(ディジタルコンテンツ)の「提供」を要求すると,指定された情報のコンテンツ情報(有償/無償,有償の場合は,料金,利用条件,利用可能期間,電子透かしの有無等)が表示し,利用者の確認を待つ機能である.
このコンテンツ情報は,著作権者がコンテンツ単位(書誌情報単位)に後述するコンテンツ情報管理機能を利用して作成する.
●利用者認証機能
利用者認証機能は,コンテンツ情報のチェックの終了後に,利用者認証を行なう機能である.利用者認証は,利用者管理情報を利用して行う.利用者管理情報には,利用者ID,パスワード,氏名,年齢,電話番号,E-Mailアドレス,学校/勤務先,決済手段等の情報が設定されている.この利用者管理情報は,後述する利用者管理機能で登録/更新する.
●提供機能
提供機能は,利用者認証後に提供依頼を受けた情報(コンテンツ)に,コンテンツ情報と提供情報(提供ID,利用者ID,コンテンツID,提供日時)を付加して全体を暗号化して,利用者に送付する機能である.
また,コンテンツ情報にの中に「電子的すかし」の埋め込みが設定されている情報(コンテンツ)に対しては,「電子透かし」を埋め込んで送付する.
●復号化,参照,閲覧制御機能
利用者は,暗号化されて提供された情報を復号化して,提供された情報を自らの端末で参照する.閲覧制御機能は,提供された情報にコンテンツ情報として,利用条件(複製,編集,印刷の許諾に関する条件)が設定れれている場合には,利用者がこの利用条件に違反する操作を行なった場合,例えば,印刷は禁止の条件が設定されていれば,印刷処理は,無視される等の利用者の閲覧を制御する機能である.
また,利用者は,提供された情報に関する著作権者の情報(著作権者の連絡先等)も参照することができ,必要に応じて著作権者とコミュニケートすることができる.
プロトタイプシステムの課金管理の方針を以下に示す.
●課金対象/対象オペレーション
課金は,「書誌を単位として,課金の対象となるオペレーションは,参照・提供(ダウンロード)とする.ただし,課金の対象となる情報の目次と奥付だけをアクセスする場合には,課金対象外にすることも可能とする.
館内から利用する場合には,無償とする.館内からの利用には,同一LAN環境内の端末からのアクセス,あるいは,指定された端末からのアクセスが含まれる.館内利用の場合で,課金対象の情報の提供(ダウンロード)は不可とする.
●課金方法
参照をする場合の料金に対する課金方法は,定額制,従量制の何れかとする.料金は,各々に対応してコンテンツ情報に格納する.
なお,ここでいう定額制とは,書誌に対応する情報全体の料金が定額であることを意味し,従量制とは,書誌に対応する情報に対して,利用者が参照した量に対応して課金することを意味する.
定額制の場合,情報提供者の定める期間内では何回アクセスしても一回の課金処理とする.この期間は,コンテンツ情報に格納する.
利用者ごとに累積された課金情報を管理して,今回の料金を利用者に提示して,支払可能か否かの確認が行なえるようにする.
●支払方法
クレジットカードのみをサポートする.
●割引
料金割引にも対応する.この場合には,期間,割引率を指定できる.また,無償の期間も設定でき,無償で参照,提供できる利用者を指定できるようにする.
(2)課金管理機能
課金管理機能は,前述した機能を実現する.図8に課金管理機能の概要を示す.
図8 課金管理機能の概要
●コンテンツ情報チェック,利用資格チェック機能
コンテンツ情報チェック機能は,利用者の求める情報に関するコンテンツ情報(有償/無償,有償の場合の金額,利用可能なオペレーション等)を利用者に提示して利用者の回答を待つ機能である.また,利用資格チェック機能は,有償利用者か否か,有償利用者の場合には,無償期間内か否かのチェックや利用している端末の情報(館内利用か否か)のチェックを行なう機能である.
利用者の求める情報が有償で無償期間外,利用者が有償利用者であれば,課金処理が実施される.ただし,有償情報が定額制で,今回,利用者が要求する情報と同一の情報に対して,課金されていている場合,課金された時から一定期間(コンテンツ情報)内であれば,無償の扱いとなる.
●クレジットカード番号認証機能
クレジットカード番号認証機能は,利用者情報に暗号化されて格納されているクレジットカードの番号の確認を行なう機能である.
●累積課金確認機能
累積課金確認機能は,累積された課金情報を利用者に提示して,今回の金額を加味して,処理を継続するか否かを利用者に確認する機能である.
●課金,割引対応機能
課金,割引対応機能は,実際の課金処理を行なう機能である.課金対象の情報(コンテンツ)に割引情報が設定されている場合には,その割引率に対応した処理を実施する.課金情報は,課金累積データベースに記録される.
ただし,有償情報が従量制であり,その情報に対して,目次と奥付が無償と指定(コンテンツ情報)されていて,且つ実際に目次と本文だけの参照であった場合には,課金は行なわない.
今回のプロトタイプの課金管理機能では,実際の課金処理(決済)は行なわない.
(1)利用者管理機能
利用者情報には,利用者ID,パスワード,氏名,年齢,生年月日,住所,電話番号,メールアドレス,学校/勤務先,クレジットカード番号等があり,利用者管理機能は,これらの情報の登録,修正,削除機能とプロトタイプシステムの利用に時の利用者認証機能から構成される.なお,利用者管理情報は,暗号化されて管理される.
(2)コンテンツ情報管理
コンテンツ情報には,コンテンツに対応する書誌ID,利用条件((複製,印刷,編集に関する許諾情報),「電子すかし」を設定するか否かの情報,利用可能期間,著作権者情報(著作権者の名前,アドレス等),課金に関する情報(課金の対象となるオペレーション,オペレーションに対応した料金,定額制/従量制の区別,目次と奥付の有償/無償の区別,割引率と割引期間,定額制の有効期間,無償利用者ID等)がある.コンテンツ情報管理機能は,これらの情報の登録,修正,削除機能から構成される.
図9.プロトタイプシステムのシステム構成
当事業で研究開発されプロトタイプシステムに組み込まれた個別技術(図9の「あみがけ」部分)とプロトタイプシステムの対応機能を以下に示す.
プロトタイプシステムの機能仕様を決定するにあたり,通産省殿,国立国会図書館殿,情報処理事業振興協会殿(IPA),日本情報処理開発協会殿(JIPDEC)から貴重な意見を頂いた.感謝の意を表したい.
[追記]
当事業で研究開発している基本アーキテクチャと個別技術についての詳細は,以下を参照されたい.