仮想書架における背表紙画像生成の自動化

宮川拓也
九州大学工学部電気情報工学科
〒812-8581 福岡県福岡市東区箱崎6-10-1
Tel: 092-642-3864, Fax: 092-642-3865

大森洋一
九州大学大学院システム情報科学研究院
〒812-8581 福岡県福岡市東区箱崎6-10-1
Tel: 092-642-3865, Fax: 092-642-3865

池田大輔
九州大学附属図書館
〒812-8581 福岡県福岡市東区箱崎6-10-1
Tel: 092-642-4422, Fax: 092-642-2330

概要

WWW上の仮想書架は、図書の背表紙画像を一列に並べ、あたかも書棚のように見せることである。仮想書架による表示は、実際の図書の状況に依存しないので、キーワードによる検索結果などから、分散配置された関連のある文献を一覧可能である。また、自動書庫などによる閉架図書をあたかも開架されているように表示したり、開架図書の書棚中の配置をみつけやすくするというように、利便性が向上する。しかし、仮想書架を実現するためには、大量の背表紙画像をどのように収集・更新するかが問題となる。本稿では、大量の画像入力および更新を効率的に行なうシステムを作成した。

キーワード

仮想表示, 背表紙画像, 自動化

Automation of back cover image generation in virtual bookshelf

Takuya MIYAGAWA
Department of Electrical Engineering and Computer Science, Kyushu University
6-10-1 Hakozaki, Higashi-ku, Fukuoka, 812-8581 JAPAN
Phone: +81-92-642-3864, Fax: +81-92-642-3865

Yoichi OMORI
Graduate School of Information Science and Electrical Engineering, Kyushu University
6-10-1 Hakozaki, Higashi-ku, Fukuoka, 812-8581 JAPAN
Phone: +81-92-642-3865, Fax: +81-92-642-3865

Daisuke IKEDA
Kyushu University Library
6-10-1 Hakozaki, Higashi-ku, Fukuoka, 812-8581 JAPAN
Phone: +81-92-642-4422, Fax: +81-92-642-2330

Abstract

Virtual bookshelf on WWW is the technology that horizontally aligns back cover images as a bookshelf. Virtual bookshelf is independent from the real circumstance of books, thus distributed books whose relations are found by keywords can be looked through. It is also useful to show books at closed access as if they are open access, or to indicate the searched book though it is on an open shelf. To realize virtual bookshelf, however, the problem how to collect and update a large amount of back cover images arises. In this paper, the system which inputs and updates a lot of images efficiently was created.

Keywords

virtual view, back cover image, automation

1. はじめに

　高速ネットワーク環境および映像技術の普遍化に伴い、文章のみならずマルチメディア文書のディジタル形式における収集、蓄積、配布を行なうディジタル図書館の実現が進められている。

　なかでも、ディジタル図書館化の第一歩として図書カードを電子化した On-line Public Access Catalogue (OPAC) は多くの図書館でオンライン公開され、収蔵文書の流通に大きな役割を果たしている。さらに強力な検索機能もディジタル図書館ならでは特徴として期待されており、OPAC 以外にも収蔵図書データベースのオンライン化、World Wide Web (WWW) インターフェースなど使いやすさの改良、検索精度の向上などが、先行して進められている。しかし、従来のオンライン検索は、図書カードと同様に書誌情報がテキストで表示されるものが主流であり、開架式に配架された図書を検索する場合と比較して、書誌の対象読者層といった専門性、シリーズ発行の関連性などが掴みにくい。特定の本を探すのではなく書棚を歩き回り、本を手にとりながら借りる本を選ぶという利用の仕方をする人も多いが、そのような、図書館を巡回して楽しむという利用法ができないのである。

　本研究で提案する WWW による仮想書架は、書棚のように図書の背表紙画像を一列に並べ、 Web ブラウザを通して表示するものである。仮想書架の利用により、検索結果の見栄えを改善するだけでなく、情報空間の対話的な探索を可能とし、利便性の向上が期待できる。

　しかし、この仮想書架を実現するには、大量の背表紙画像の収集をどのようにおこなうかが課題となる。九州大学附属図書館を例にとると 300 万冊以上の蔵書があり、背表紙画像の取り込み方法を考えなければならない。また、本は利用されることにより状態が変わるので、画像の更新を効率的に行なう方法も検討する必要がある。

2. 仮想書架

2.1 関連研究

　現在オンライン書店の一部では、検索結果に対し販売図書の表紙画像を表示するといった工夫がなされており、本の装丁が重要な情報を含むことを示している。さらに、本棚.org[1]やブクログ[2]というサイトでは、 Web 上に自分の本棚を作ることができる。そこにおいても表紙の画像表示を行なっており、本の装丁の重要さを知ることができる。

　またこれまで、マルチメディアを利用して仮想空間における書架を構築する様々な研究が行なわれてきた。先行研究としては、 Virtual Reality (VR) 技術とディジタルコンテンツ表示機能により、いながらにして現実の図書館をメタファとする文書利用環境を実現しようとするものがある。佐藤による研究[3]では、 Computer Graphics (CG) による動画像を利用した仮想図書館を構築している。建築の幾何学的な配置や利用者の移動する軌跡などは予め生成されたデータを利用し、表紙画像データを貼り付けることで書棚を表現している。神谷らによる研究[4]は、電子図書館のためのインタフェースとして、 3 次元 CG を用いた仮想空間内のウォークスルーと利用者のガイドの役割を果たす CG 生成による司書を用いたシステムである。

　しかし、現在の一般的な計算機においては、 CG による仮想空間処理は負荷が過重であり、特に高精細ディスプレイなど文字情報を含む高品質な表示を行なう実行環境の普及は遅れている。紙媒体には解像度や階調性といった表現能力に優れ、人手により持ち運べて流し読みや返り読みが容易というとりまわしの良さがあり、現状では文書のディジタル形式での利用は限定されている。また、既存の収蔵品や検索システムを無視するわけにはいかず、互換性も課題である。

　本研究における仮想書架は、「Web 上に本の背表紙画像を並べて、書棚のように表示すること」である。図書館の物理的な配置にこだわらない、一覧性に優れた本棚表示に特化したシステムである。

　本棚表示という点では、梶山らによる研究[5]で、書籍検索と自分の目的の本がありそうな本棚を調べるという図書館の散策、この2つを統合することを目的とした GUI（Graphical User Interface）の開発が行なわれた。このシステムでも本を本棚に並べて表示する方法をとっていることから、本棚表示が実際の図書館で本を探すような馴染み深い表示方法であることが分かる。しかし、このシステムで本棚に並べられる背表紙はプログラムで生成したものである。本研究における仮想書架では、本物の背表紙画像を表示するという特徴がある。本物の画像から得られる情報はたいへん多いのではないかと考える。

　また仮想的な書架の構築という点では、新書マップの「書棚で見るテーマ一覧[6]」が、本物の背表紙画像を使った本棚のインタフェースを用いている。このように、背表紙画像から得られる情報が便利であると考えられていることが分かる。この新書マップでは、検索したキーワードから分類して表示される書籍の組み合わせは固定されており、 Web ページは静的に生成される。しかし、本研究における仮想書架は、背表紙画像を条件に応じて動的に並べ替えることができ、動的な書架を生成することを特徴とする。そのため、様々なシステムのインタフェースとしてこの仮想書架を用いることができる。例えば、閉架書架である自動書庫と連携できることについては前回発表を行なった[7]。

2.2 仮想書架を用いた蔵書検索システムの作成とアンケート調査

　前回の実験[7]では、仮想書架を用いて関連書誌表示システムを試作しアンケート調査を行なった。今回は、仮想書架を用いた蔵書検索システムを作成した。これは、図書館の本を探す方法として OPAC を用いることがあるが、その検索結果に画像を用いることにより、利用者にテキストのみでは伝わりにくい情報を提供できるのではないかと考えたからである。検索結果画面を図 1 に示す。

図1

前回、画像が見にくいという意見があったので、画像の上にマウスポインタを置くと書誌情報から生成した代替背表紙に切り替わるように改良した。また、前回のシステムでは書誌情報から必要な項目を抜き出して作成したデータベースを用いていたが、今回は図書館で使われている実際の書誌情報データベースを再現して使っている。なお、書誌データは 39,665 件、背表紙画像は 1,499 個である。背表紙画像がない場合は、代替背表紙を生成して表示する。

　このシステムを運用し、仮想書架の有効性を再び確認するため、アンケート調査をおこなった。実施期間は 2005年12月19日～2006年2月14日である。対象者は、九州大学附属図書館のホームページでアンケート調査について告知し、応じてくれた利用者である。有効回答数は 77 件であった。主な結果を抜粋する。

問1 画像表示とテキスト表示では、どちらの表示が見やすかったですか？（図 2）

図2

　「画像」と答えた人が 7 割、「テキスト」と答えた人が 2 割、「変わらない」と回答した人が 1 割という結果になった。以下、それぞれの回答に関する意見を挙げる。

1.「画像」と答えた人の意見

書籍の大きさなども直感的に認識することができるため。
イメージが湧きやすい。実際に本棚で探すときに役立ちそう。
本の雰囲気（読みやすい本か、ややこしい本か。古い本か、新しい本か。など）を背表紙のフォントや雰囲気で判断している節があるため。

2.「テキスト」と答えた人の意見

フォントなどが統一されているから。
画像の場合、どうしても一画面に現れる情報量が少なくなるため。
テキストの方が、一度に得られる情報量が多い気がする。画像だと、視線があっちこっちに行ってしまう。

3.「変わらない」と答えた人の意見

どちらも短い書誌情報なので大きな差異は感じなかった。

問2 蔵書検索において検索結果を背表紙画像で表示できるなら、利用したいですか？（図 3）

図3

　75 %の人が利用したいと回答した。以下、それぞれの回答に関する意見を挙げる。

1.「利用したい」と答えた人の意見

書棚を眺めるという把握の仕方に慣れているから。また背表紙というのは思った以上に情報を持っていると感じているから。
本の厚みで選んだりすることも多いので背表紙画像で表示できるなら利用したい。
おもしろい。検索が楽しくなりそう。

2.「利用したくない」と答えた人の意見

背表紙だけの画像は意味がないと思う。
画像は見にくいし、テキスト表示に比べて、表示される情報が少ないきがした。

3.「どちらでもいい」と答えた人の意見

併用するのがベストではないか。ある程度検索数が絞られてきた場合に、画像を利用するということである。すべてが画像表示になると疲れるような気がする。
画像は確かに見やすくはあるが、ページ内の文字検索が使えないなど機能が制限される点もあるから。

　ここでは他の質問の結果は省略するが、以上 2 つのアンケート収集結果からも、多くの人は背表紙画像表示ができると便利であると考えていることが分かり、仮想書架の有効性を確認することができた。前回のアンケート結果と比較すると、画像表示とテキスト表示のどちらが見やすいかという質問に対する結果は、ほぼ前回と同じ結果になった。しかし、蔵書検索の検索結果で仮想書架を利用したいかという質問に関しては、前回は 62% の人が利用したいと答えていたが、今回は 75% と増えていることがわかる。前回のアンケートと今回の共通の意見としては、画像が見づらいという意見や、画像の収集をどうするのかという意見が見られた。以下で、この点に関して考慮する。

3. 背表紙画像生成の自動化

3.1 自動化の目的

　仮想書架の利点について前述したが、2.2 節のアンケート調査の結果からも背表紙画像の表示には利点があることが確かめられた。しかし、その背表紙画像をどのように収集するかが問題となる。画像収集に関して、背表紙の撮影、写真からの背表紙部分の切り取り、書誌 ID と画像との関連付け、データベースへの登録などを考えると、図書館職員に手間をかけないような画像データ入力の方法を考えなければならない。また、本は利用者に借りられるので、本の状態は変化する。画像から本の状態を確認できるという仮想書架の特徴を考えると、一度きりの撮影ではなく、画像の更新を行なっていかなければならない。そのため、画像の更新も効率的に行なえる方法を検討する必要がある。さらにアンケート調査の意見の中には、画像の品質が悪いために見にくいといった指摘があった。こうした問題を考慮して、背表紙画像の生成を自動化するシステムを作成した。

3.2 作成した背表紙画像生成システムについて

・システムの仕様

　最初に、背表紙画像を生成するために必要な作業を説明する。

(1)背表紙を撮影する。

(2)撮影した写真から背表紙部分を切り取る。

(3)切り取った画像のサイズ調整を行なう。

(4)ファイル名を書誌 ID にして保存する。

(5)生成した背表紙画像をサーバにアップロードする。

(6)データベースに登録する。

　以上の作業が必要となる。この作業を 1 冊ずつ行なうとなると時間がかかる。ある程度自動化する必要がある。

　そこで、図 4 に示すシステムを提案する。図 4 に沿って流れを説明する。なお、カメラはパソコンと接続されており、パソコンから遠隔操作できるようになっている。撮影は 1 冊ずつ行なう。

図4

(1)本を撮影台の上に寝かせて置き（左側を本の上部とする）、パソコンを操作してカメラのシャッターを切る。画像データは自動的にパソコンに送信される。

(2)Web ブラウザから背表紙画像登録サイト上で本の書誌 ID を入力し、画像データをWeb サーバにアップロードする。

(3)Web サーバ上でプログラムが動作し、画像データから背表紙画像を切り出し、背表紙画像を表示して、登録してよいか確認をとる。

(4)登録ボタンを選択すると、Web サーバは背表紙画像を保存し、データベースに登録する。

　以上の順序で、背表紙画像を生成し登録する。

　このシステムは、図書館の返却カウンターで撮影を行なうことを想定している。返却された本を撮影して背表紙画像を増やしていくという考えである。こうすることにより、自然と画像の更新が行なわれる。九州大学附属図書館中央図書館の場合、返却された本は直ちに書架に戻されるわけではなく、一度カウンターの中の棚に置かれる。このときに撮影を行なうことが出来る。また、背表紙を切り取る作業やデータベースへの登録は Web サーバが行なうので、パソコンに新たなソフトを導入することなく、Web ブラウザ上で登録を行なえるという利点がある。

・写真からの背表紙画像の抽出方法

　写真からの背表紙画像の抽出は、背景の色を決めておき、色の変化を見て背表紙と背景の境目を判断し切り抜くという方法をとった。図 5 に沿って説明する。なお、写真の左上の角を原点とし、右方向にX座標、下方向にY座標をとる。単位はピクセル（pix）とする。

図5

(1)まず、写真中央のX座標（図 5 の場合は x=640）について、ピクセルごとに y=0 から下に移動し色の成分を見ていく。色の成分は RGB（Red、Green、Blue）である。

(2)隣り合うピクセル同士の色の成分の差をとってゆき、RGB のうちどれか一つの差がある値より大きくなればそこが背表紙と背景との境界であると判定する。この図の場合、本の上側の境界は y=448 であることが判明する。

(3)今度は、写真中央の x=640 を、y=960 から上に移動しながら隣り合うピクセルの色の成分を比較していく。

(4)本の下側の境界は y=514 であることが判明する。

(5)今度は、先ほど判明した本の上側の境界と下側の境界の間のY座標（y=497）について、x=0 から右に色の成分を見ていく。

(6)本の左端の境界が x=325 であると判定される。

(7)同様に、y=497 について今度は x=1280 から隣り合うピクセルの色の成分の差を見ていき、右側の境界は x=971 であることが判明する。

(8)判定した 4 つの境界の座標を利用して、背表紙部分を切り出す。

・撮影台の仕様

　背表紙画像を抽出するときに隣り合うピクセル同士の色の変化を見ていくため、背景は全体が均一な色となるように撮影しなければならない。そこで、撮影台を作成した（図 6）。

図6

　ダンボールを用いて作成したが、白い紙を貼ることにより光が反射して本が明るく映るようにしている。背景には、濃い水色を選んだ。背表紙画像の抽出では色の変化を見ているため、背景の色はどの色でもかまわない。ただし、背表紙と違う色を選ばなければならない。もし背表紙画像も濃い水色である場合は、背景の水色の紙を折りたたむことにより、背景を白色に変えて撮影できるようにしている。

　撮影台の真ん中より下の部分は白色である。本との境界になるところに黒色の線を引いているため、背表紙の色がどんな色であっても本の下側の境界は判別できるようになっている。

・写真の撮影条件

　2.2 節のアンケート結果で画像が見にくいという意見があったが、これは撮影時の光の反射が原因であった。特にタイトルが金や銀の場合、光が反射して読むことができなかった。カメラのフラッシュは使えないので、ライトを少なめにして撮影してみたが、一般のデジタルカメラでは光の量が足りず背表紙に焦点を合わせることができないことも多々あった。

　そこでデジタル一眼レフカメラを用いることにした。使用したカメラは Canon の EOS Kiss Digital（EF-S 18-55U）である。これによって撮影台とライトを離すことができ、光の反射を防いできれいな画像を撮影できるようになった。

3.3 システムの運用

　前述した仕様に基づいてシステムを構築した。まず、Web サーバとデータベースサーバは 2.2 節で試作した蔵書検索システムで用いたものと同じである。プログラム言語は PHP を用いている。カメラと接続するパソコンには、カメラを遠隔操作するソフト「RemoteCapture（Canon）」をインストールする。

　背表紙画像生成画面を図 7 に示す。ページ上部には書誌情報データベースから取得した本のタイトルと著者名が表示され、正しい書誌 ID を入力しているか確認することができる。また、きれいに背表紙画像を生成することができなかった時のために、微調節を行なえるようにしている。

図7

　次に、手作業の場合と本システムを用いた場合の背表紙画像生成にかかる時間を計った。 10 冊の背表紙画像を手作業で作成・登録すると、平均して 20 分ほどかかった。一方、本システムを用いた場合は、約11分であった。それぞれの方法を詳しく考えると、手作業で背表紙画像の生成と登録を行なう場合は、一度に複数の本の背表紙を撮影できる。そのため、撮影には時間がかからないが、本章の初めに述べた作業が必要となり時間がかかる。本システムを用いた場合、撮影は 1 冊ずつ行なうため撮影に時間がかかる。しかし、1 冊撮影するのにかかる時間はそれほど長くない。また画像処理の作業が必要ないため、背表紙画像生成・登録に時間がかからず、手作業の場合に比べて約半分に時間を短縮することができた。

4. 今後の課題

　本研究では、背表紙画像の管理を自動化する方法を考え、背表紙画像自動生成システムを作成した。本システムは主に背表紙画像を切り取るところと、データベースに登録するところを自動化した。それによって、大幅に時間を短縮することができた。しかし、さらなる時間の短縮のためには、他の部分も自動化しなければならない。

　まず本システムでは、書誌 ID の入力を手作業で行なっている。ここを自動化できれば時間と手間を省くことができる。考えられる方法としては、九州大学附属図書館では、本にバーコードを貼り、それを用いて本の貸出や返却処理を行なっている。それで、撮影の際にそのバーコードを読み取って書誌 ID を入力するならば、時間を短縮できる。返却処理のときにバーコードを読み取るが、その時にそのまま背表紙を撮影するならさらに時間を短縮できるであろう。また、九州大学附属図書館筑紫分館では RFID（Radio Frequency IDentification）タグによる書誌の管理や貸出などの処理を行なっている。RFID タグとは、書替えできない ID 情報を電子的に保持し、電磁誘導により読み出し可能とした比較的小型の無線 IC であり、非接触読み取りが可能なことからバーコードの代替技術として期待されている。この RFID タグを用いるならば、撮影台に RFID タグ読取装置を設置しておき、本を撮影台に載せた時に本の RFID タグを読み取り書誌 ID が自動で入力される、という方法で自動化することができる。

　他には、背表紙を撮影する時、現時点ではパソコン画面からカメラのシャッターを押さなければならない。これは、撮影台に重量センサーなどをつけて、本を載せると数秒後に自動的に撮影されるという方法で自動化することができると考える。前述した RFID タグと連動させるなら、本を撮影台に載せるだけで撮影・パソコンへの転送と書誌 ID 取得が行なわれるようになる。さらに、パソコンに送信された写真が背表紙を切り取るサーバに自動的にアップロードされるなら、後は生成された背表紙画像の登録確認のボタンを押すのみとなる。

　別の点は、本システムでは撮影は 1 冊ずつしか行なえないという点である。背表紙画像認識の方法上そのようになっているが、一度に複数の本を撮影しそれぞれの背表紙を識別できるならば、時間短縮を図ることができる。

5. おわりに

　本稿では、まず仮想書架を用いた蔵書検索システムを試作、運用して行なったアンケート調査の結果から、仮想書架の有効性を確認することができた。次に、大量の背表紙画像データをどのように収集するかという問題に対して、背表紙画像を自動で生成するシステムを作成し、背表紙画像生成に伴う時間を短縮できた。また、画像の更新を効率的に行なう方法を考案した。さらに、アンケート調査で指摘された画像の品質についても本システムにより改善された。これによって仮想書架の実現に近づくことができたと考える。

　仮想書架を用いて様々なサービスを提供することができるが、アンケートで「仮想書架を用いたどんなサービスがあったらいいと思いますか？」という質問をおこなったところ、ユニークな意見がたくさん寄せられたので、主なものを以下に記す。

My本棚機能。
青空文庫など、実際の作品までたどりつける電子図書館との合体サービス。
検索なしに、実際の書架と同じ配架で、図書館の書架間を歩く雰囲気を味わいたい。
試し読みが出来る。人気の本のランキング一覧表示（みんながどういう本を借りているのか気になる）。
仮想書架をインターネットで本を買うときにも利用できたら、本屋さんで実際に本棚の間を見て回るように本を選ぶことができていいと思う。
図書館員は分類を決めるとき悩む。「それまでの蓄積」から内容と請求番号上の分類がずれてしまうことも。仮想書架上では現実の分類と、可能性の分類のどちらにも表示されるとよいのではないか。

　これらのサービスを提供するには、一つの図書館だけでなく様々な図書館が協力して取り組んでいく必要がある。協力して画像収集を行ない、誰でもその画像を利用したシステムを作成できるようにするなら、様々なサービスが生み出されるかもしれない。

　また、今回おこなったアンケート調査による意見の中に、表紙の画像や目次、本の内容を見たいという意見も多かった。ディジタル図書館の実現にあたっては、著作権の問題も解決していかなければならない。

参考文献

[1] 本棚.org, http://hondana.org/

[2] ブクログ, http://booklog.jp/

[3] 佐藤衛, "CG映像による電子図書館「孫悟空」", 情報処理学会情報学基盤研究会報告, Vol.1991, No. 2, pp. 9-16, Nov. 1991.

[4] 神谷俊之, 呂山, 原雅樹, 宮井均, "3次元ウォークスルーとCG司書を用いた電子図書館インタフェースの開発", 情報処理学会情報メディア研究会報告, Vol. 1995, No. 1, pp. 25-32, Nov. 1995.

[5] 梶山朋子, 小川貴英, 大野義夫, "書誌検索システムにおけるGUIの研究", 第45回冬のプログラミングシンポジウム予稿集, pp. 71-76, Jan. 2004.

[6] 新書マップ, "書棚で見るテーマ一覧",http://bookshelf.shinshomap.info/

[7] 宮川拓也, 山口恭平, 大森洋一, 池田大輔, "Web上における仮想書架の試作と評価", 第28回ディジタル図書館ワークショップ, pp. 27-39, Aug. 2005.