一次資料として使用可能な精度保証付き高再現性デジタル画像の作成と提示

片岡　裕、柴田　みゆき
大谷大学
606-0913京都府北区小山上総町大谷大学
075-411-8067（研究室直通・FAX兼用）
kataoka@res.otani.ac.jp, neko@res.otani.ac.jp

概要

　貴重資料やテキストの内容だけでなく書体などの情報が重要な資料は、一般にマイクロフィルムや写真印刷物、または、デジタル画像データとして配布されてきた。しかし、マイクロフィルムは、カラー・モノクロームに関わらず、保存・配布が困難であり、拡大投影装置の限界もあって十分な再現性を得られない。同様に、写真印刷は、色分解と印刷の過程で、極めて大きな誤差が混入して分解能が低下し、さらに色相と明度に対する再現性も低く温度による季節変動も大きい。カラー・デジタル画像データが、原資料に対して十分な精度と量子化誤差を持つことが可能であれば、他の媒体よりはるかに高い再現性を持つと同時に、保存・配布・参照が極めて容易となる。このような高再現性を保証した画像データであれば、画像処理の適応によって、保存状態の検証やOCRによる電子テキスト化など、さらに情報を抽出できることになる。

　従って、デジタル図書館では、精度保証付きデジタル資料が根幹をなすことになるが、デジタル化での評価項目が多く簡便な計測法や機器評価法が確立しておらず、そのようなデジタル資料が極めて少ない現状である。そのため、原資料の情報量を評価し、精度保証付き高再現性デジタルデータの作成から表示までの全過程を詳細に研究し、高精度を保ちながら簡便に作成から表示までを行う方法を、機材の評価・選択法を含めて行った。原資料として、完本に近いセットが世界に2部のみである北京版チベット大蔵経（Tibetan Tripitaka Beijing Red Edition）を用いた。本大蔵経の選択理由は、歴史的価値及び内容的価値が高いばかりでなく、退色が進行して文字と汚れの判別が困難であり、もはやモノクロームのマイクロフィルム撮影は不可能で、高精度スキャナより大きく直接スキャンもできず、40000ページを超える極めて困難な資料であることによる。

　高精度高再現性デジタル画像データの作成と表示のためには、

1)　資料分析による、要求される精度及び誤差の決定

2)　必要とされるデジタルデータのRGB各ビット数、及びファイルフォーマットの検討

3)　写真撮影におけるカメラ・レンズ・フィルム・ストロボの能力、撮影環境の評価

4)　スキャナの精度・量子化誤差・スキャニングソフトウエアによるアーティファクトの測定

5)　生デジタル画像データの誤差の少ない色・明度階調補正

6)　グラフィックス・ボードの再現性

7)　CRTモニターの再現性と寿命、色・明度諧調設定の容易性

の検討が必要である。機器の工作精度の向上や構造によって生じる誤差で、著しく得られる精度が異なるため、常識にとらわれずに全過程を実測する必要がある。本研究は、上述の全項目を詳細に分析し、精度を劣化させる原因を求め、量子化誤差に対しても最小限となる機材選択の評価法を求めた。使用機器に関しては、種々の機器由来の誤差を追及した結果、誤差の範囲が判明し、入手が簡単であるが最も誤差の少ない機材を選択できることが示せた。さらに、画像処理に必要なRGBの各bit数を、実際の補正の結果から得た。

　研究結果は、意外であった。一例を述べると、35mmカラーリバーサル外式フィルムが、粒子径と乳剤厚が最小で粒子密度が最大であり色相と階調の再現性も最高であることが判明した。精密撮影に使用される大判フィルムでは、フィルムの乳剤層が厚いため、精密スキャナの焦点が合わず、かえって良い結果を得られない。このような実測の結果、技術の進歩により、一般に信じられてきた結果とは異なる結果を得ることとなった。

　本研究の結果、ルーチン化可能な簡便な精度保証付き高再現性デジタル画像データ作成法が得られ、図書館をデータの供給源とすることが可能となり、さらに印刷用CRTより安価で長寿命・高再現性のCRTの使用により、データ参照の距離的束縛を大幅に解消することとなった。これによって本格的なデジタル図書館の構築が可能となったといえる。

キーワード

デジタル図書館, デジタル博物館, 高再現性, 高分解能静止画像, 高分解能

Providing Certified High Fidelity Digital Images as Primary Samples

Yutaka Kataoka, Miyuki Shibata
Otani University
Koyama Kamihusa-Cho, Kita-Ku, Kyoto City, Kyoto Japan
Phone: +81 75-411-8067
E-mail: kataoka@res.otani.ac.jp, neko@res.otani.ac.jp

Abstract

Primary samples like historic texts and drawings in libraries/museums have been distributed by low fidelity secondary forms as microfilms or printed copies. Recently, digital image forms started to use for distribution and exhibition, but a few digital data provide with high fidelity certifications. Thus, digital libraries/museums cannot remove barricades of time and distance between researchers and the primary samples yet. So, we see only first page of a historic book even we can visit a library, or we should watch printed matters. By photo-printings, a color of one point is distributed on multiple dots of on the papers, it is impossible to get fine resolution that researchers with to get. And colors of inks are changed depending on temperature. If CRT can display specific colors on the CRT all the time, digital image data can have much better fidelity than other distribution formats.

The difficulties to provide high fidelity samples used as primary sample have not been researched by complex measurement units and expensive equipments for that.　 But progress of equipments surrounding computers permits us to provide easy methods to provide high fidelity digital data. Once high fidelity digital data with required resolution and dynamic range could be provided, the data can be used for multiple purposes like OCR and so on after distribution of the data. Thus, providing easy methods for making high fidelity digital data is essential and basic role of digital libraries/museums.

To establish Hi-fidelity digital data, each process from taking photo to viewing the results on CRT has researched. And key points to provide high fidelity digital image could be specified. As the results, easy methods to measure fidelity and quality could be provided. Here, in this paper, following key points are reviewed;

・measuring original data to extract required information from it.

・specifying resolution and dynamic range to held information required.

・evaluating camera, lens, film, flush light and photo taking environment

・evaluating errors of scanners and artifacts from scanning software

・correcting color and contrast of raw digital data

・selecting a graphic board with image quality

・selecting a CRT with image quality and easy setting of color/contrast

Since the quality of the results highly depends on dramatically the equipments, each one was certified. Finally, easy methods to measure basic evaluation points were provided. Thus, we could provide high fidelity digital image data quite easily as routine work. And CRTs and PCs can be chosen for required fidelity without past large expensive CRTs and PCs. By total evaluation by our research, we can provide real contents to digital library/museum.

Keywords

digital library, digital museum, fidelity, high resolution image, resolution, CRT, scanner, color correction

1. はじめに－デジタル資料と一次資料

　デジタル図書館やデジタル博物館の最大の利点は、閲覧時間や入館時間に拘束されずに遠隔地から書籍や収蔵品を参照できることと言って過言ではない。換言すれば、参照が限定されている一次資料をデジタル資料とすることで、一次資料を共有可能とすることが大きな利点ということになる。すなわち、デジタル資料が、一次資料と同じ情報を含んでいなければ、デジタル図書館や博物館としての価値が激減するということである。デジタル資料が十分な情報を含まず一次資料の代替となりえなければ、既存の図書館や博物館のカタログ情報を増やすだけにすぎない。デジタル資料が一次資料の代替となることで既存の図書館や博物館の価値が低下するという発想は、既存の図書館や博物館とデジタル図書館やデジタル博物館の概念的差異の認識不足であり、それではデジタル図書館やデジタル博物館を作る意味がない。また、デジタル資料の情報量を数量的に評価せず、デジタル資料の価値を低くみなすことは、デジタル処理による資料分析の意義を理解していないことである。たとえば、高分解能高精度で資料をデジタル化し、特定の色のみを抽出して増幅すると、肉眼や顕微鏡では判断ができないカビのコロニーの検出が可能で、保存状態まで判断できる。

　当然、参照目的によって、情報量を変えてデジタル化することになるが、それは、情報交換用文字コードによる電子テキスト化のレベルから、デジタル画像まで幅広い段階がある。文献資料では、近年の電子写植のようにはじめから限定された文字のみ使用された文書であれば、電子テキスト化は簡単であるが、印刷数の制限で参照が困難な古書籍や貴重書などでは、そのままデジタル画像化した資料とする。そしてそれが、一次資料の参照が不可能なとき、実質的に最も情報を保存した資料となってしまう。事実、情報量の保証のないマイクロフィルム化資料が、一次資料の代わりに多用されている。また、必ずしも情報交換用文字コードが作成されているとは限らないし、作成されていたとしても、 DevanagariやThaiのように不完全な場合も多い。漢字では、意図的に一文字の構成図形の位置を変え、それに意味を持たせた文書が、江戸時代には多数印刷されている。勿論、書き込みなどが重要である場合や、文字書体そのものが歴史的情報を持つために重要である場合がある。このような一次資料では、含まれる情報量と精度、再現性を保証したデジタル画像資料が必須である。そして、まさにこのような資料の情報を保証したデジタル化による共有化が、研究の促進という極めて根本的な図書館の課題となって当然である。

　なお、一次資料に匹敵する情報を持ち一次資料の代替となるデジタル画像データが、著作権の侵害という理由で分配もしくは参照が、遠隔地において困難なる可能性が極めて高い。この場合、デジタル図書館やデジタル博物館の意義を再考する必要があると同時にデジタル資料の参照と利用における制限に関し、国際的に法的に取り組む必要がある。いずれにせよ、今後、デジタル図書館やデジタル博物館は、デジタル資料の作成の機能を持たなければ、成り立たないといえる。

　上述の著作権と利用制限の問題は十分に解決してはいないが、実際に一次資料の代替となりえるデジタル資料は、ほとんど作成されていない。繰り返すが、一次資料からどのような情報を必要とするかによって、デジタル資料が包含すべき情報量が変わる。古書籍の内容を読む必要がないカタログのような場合、表記されている文字が確実に可読である必要はない。しかし、記述された内容が重要である場合、少なくとも文字の可読性は保証されなければならない。このように目的に合致したデジタル資料を作成する必要があるが、一次資料の持つ情報量の測定以前に、高再現性デジタル画像データの作成自体の研究があまり進展していない。これは、一次資料からデジタル画像データに変換する過程での誤差に影響するファクターが多いこと、デジタル化の個々の過程での精度の測定法が簡単ではなかったこと、作成されたデジタル画像データの高再現性表示が困難であったことによる。従って、精度と情報量を保証した高再現性デジタル画像データの作成の試み以上に、高再現性データの簡便な作成方法という基礎的研究も極めて少なかった。このように、デジタル化を行うにあたり、最初の段階から困難が伴い、機器類が進歩したにも関わらず、実際に情報量と誤差が検討されることは極めて稀で、感覚的判断に頼ってきた印刷技術での過程と手法をそのまま取り入れていることが多く、精度と再現性ではなくて、見かけの「美しさ」という曖昧な判断基準を元にデジタル化されてしまうことになる。

　このような状態であったため、デジタル化の前に必要な一次資料中の情報の分析と再現すべき情報の検討から始まり、デジタル化、デジタル資料の再現（表示）までの過程を調査し、明確に判断可能な基準が必須である。次に、誰もが簡便に目的に合致した情報を持つ高再現性デジタルデータを作成可能とするために、簡便な精度測定法とデータの作成手法の開発が必須である。この一連の過程の研究と手法の開発がなければ、機器の選択にも無駄が生じると同時に、情報量の明記のない誤差の多いデジタル資料を配布することになる。その結果、作成者に誤差量と精度を確認できない場合、多くのミスを生じることになり、実際にそのようなミスが生じている。だからといって、理系文系を問わず、高精度デジタル化の機器は高価であり、各自が誤差と精度を検証してデジタル資料を作成していては、本質的に必要な研究が遅滞してしまう。従って、一次資料の代替となりうるデジタル資料の作成能力が、今後のデジタル図書館とデジタル博物館に強く求められる。

　既存の資料配布と共有の一般的方法である、マイクロフィルムや写真印刷などの精度も再検討も必要である。これらの手段も、フィルムには粒子があり、写真印刷も色分解による点をもとにしたデジタル資料である。当然、これらは誤差を含んでいるが、安易に依存しすぎており、ミスを誘発している。一次資料を変換して配布および共有する場合、それぞれの手法で長所短所があり、原理的問題点を知っておく必要がある。

2. 精度保証付き高再現性デジタル画像データ作成研究

　本研究は、上述の問題を解決し、デジタル図書館やデジタル博物館を現実ならしめるための基礎研究である。本研究は、貴重資料の共有化による研究の促進に対する効果に着目し、特に参照が困難な資料を効率良く簡便に精度を示した高再現性デジタル画像資料とすること、および、デジタル画像資料を可能な限り再現性を高くして表示することを目的としている。従って、各プロセスでの精度指標や測定法などを明示し、同時に簡便な手法を得ることで、ルーチン化を目指している。

　本研究の特徴は、一次資料として、大谷大学に所蔵されている北京版チベット大蔵経 (Tibetan Tripitaka Beijing Red Edition)を選択していることにある。本資料を選択することで、種々の検討が可能となる。選択された北京版チベット大蔵経は、1950年代中葉にモノクロームフィルムから写真印刷されており[1]、この影印本と通称される写真印刷版と比較することが可能である。本資料は、大きくカンギュルとテンギュルの2部にわかれ、カンギュルが1410年に、テンギュルが1724年に改版され[2、3]、保存状態が良くなく、汚れが激しい部分がある。植物性と考えられている赤色色素で印刷されており、現在も退色が進行中である。従って、資料としては、肉眼でも可読性に優れているわけではなく、汚れと退色のため、モノクロームフィルムやモノクローム印刷では、全く可読ではなくなる領域がある。本資料の大蔵経は、他の大蔵経の原本と言ってよく、内容が重要であるため、不可読部分がある影印本では、研究上支障を来す。さらに、本資料は、世界に2部がほぼ完本で、極めて貴重なため、実物の閲覧は、極めて限定されている。このような性質を持つ資料であるため、過去の影印本を超える可読性を保証しなければ、デジタル資料としての価値がない。本資料の特徴は、横幅約80cmと巨大であり、単純にスキャナでスキャンしてデジタル画像化できないことにある。巨大なスキャナも生産されているが、本資料を図書館から持ち出すことは保存上禁止されており、そのようなスキャナのある場所へ移動できないし、そのようなスキャナを持ちこむこともできない環境である。従って、写真に撮影してからスキャンすることになるが、全ページ数が約44000ページもあり、6cm幅の中判フィルムやそれ以上の大判フィルムを使用することは、金銭的問題と撮影に要する時間の問題から不可能で、35mmフィルムを使用しなければならない。しかし、木版で印刷されている文字は、最小線幅が0.4mm前後であり、約5mmの字高の小さい文字と、さらに小さい引用符としての点線を含むため、極めて撮影が困難である。しかしながら、北京版チベット大蔵経の印刷レベルは極めて高く、印刷時には全く不可読部がないものであり、この品質の高さは広く知られているため、作成されたデジタル画像の品位に関しては、多くのチベット大蔵経の研究者が評価することができる。余談であるが、本資料は、他のチベット大蔵経の原本に相当すると考えられ、他の版は、印刷が極めて悪い部分があり、修正を加えなければ、写真印刷しても可読とはならないので、異なる編集の「版」を集めて出版も試みられてはいるが、結局この編集と修正の過程で多くのミスが生じていると考えられている。チベット語の判読には、チベット文字固有の問題からコンテクストデペンデンシーが生じ、単語だけでなく一文を理解できないと編集は不可能である[4]。

　このように、北京版チベット大蔵経は、最も困難な資料の一つと言って過言ではない。従って、本研究では最も適した資料と言えるため、本資料を用いて、写真撮影、スキャナによるデジタル化、デジタルデータの補正、CRTでの提示の一連の過程に対して研究を行った。当然、精度情報と可読性の証明がなければ、本資料の場合、特に禍根を残すことになる。なお、撮影に使用したページは、本資料中では退色が早く進行しているもので、最も小さい文字を含むものである。さらに、ルーチン化し、量産するための手法に関しても、検討した。

3. マイクロフィルム及び印刷による資料提示の問題点

　上述のように、一般に使用されるモノクロームマイクロフィルムや、カラー写真印刷では、実際には必要とされているほどの再現性や精度がないことが多い。これら多用される配布または参照形式の持つ問題点を、資料作成者のみならず資料利用者も理解しておく必要がある。

　モノクロームフィルムでは、色情報が欠落するという根本的な問題がある。一次資料が白黒の2値情報であれば、モノクロームフィルムで十分である場合が多いが、実際には、次に示す問題が生じる。まず、マイクロフィルムやマイクロフィッシュ、写真製版に使用されるモノクロームフィルムは、極めて再現可能な明度階調が少ない。例えば、典型的なフィルムでは、プラスマイナス1絞り分の階調表現しかない。これは、白と黒をより明確に分離するためである。従って、資料上の細い線分などは、消失してしまう（図1）。

図1. 写真製版用モノクロフィルムによる細線の消失と修正

　フィルムから印刷用の原版を作成する場合、フィルムでの細線の消失は一般的であるため、通常撮影者などによって加筆修正されるが、修正が撮影依頼者に報告されないことが一般的である。実際にマイクロフィルムから写真印刷された書籍では、修正ミスが多いので安易に信用できないことは、周知の事実である。

　階調情報の欠落は、一次資料が絵画や絵図の場合、さらに汚れや退色で資料面のコントラストが低下している場合、想像以上の誤差を生じる（図2）。

図2. 写真製版用モノクロフィルムによる階調情報の欠落

　汚れの色調が文字や図と異なっていれば、カラーフィルムでは、図2示すような欠落は生じにくい。実際の資料では、資料上の各部で汚れの程度と退色の程度が異なり、濃淡差を生じているケースが多い。このような場合、マイクロフィルムや写真印刷用のモノクロームフィルムでは、正確に情報を保持した撮影は不可能である（図3）。

図3. 写真製版用モノクロフィルムによる汚れ・にじみ部分の情報欠落

　資料上の線幅に対して十分な程度に銀粒子サイズが小さくても、上述の問題で、再現性や可読性が高いわけではない。マイクロフィルムでの最大の問題は、マイクロフィルムリーダーの投影面のすりガラスが粗く、カラーフィルムであっても高い再現性や可読性が得られないことである。

　写真印刷では、さらに大きな誤差が含まれる。モノクロ写真印刷では、濃淡差を黒点の大小で表現する。そのため、300DPIといっても、その誤差は極めて大きい（図4）。

図4. モノクロ階調写真印刷の品位

　印刷用フォントでは、線幅に対し1ピクセルでも良いが、逆の場合では線幅に対し5ピクセル以上ないと、位置などの誤差から可読とはとても言えない。

　カラー写真印刷でも、種々の問題が発生する。カラー写真は、リバーサルフィルムを使用すれば、印刷用モノクロームフィルムより再現可能な明度諧調は大きく、3.5絞り（D）程度である。しかし、カラー印刷では、根本的に誤差が大きくなってしまう問題がある。フィルムの色素粒子が十分に小さく、1ピクセルに相当する小さな円に対して正しい色と諧調情報が得られたとしても、印刷時にその色の情報が同じ位置の点に再現されるわけではない。それは、色分解過程で、1ピクセルの各原色の情報は、それぞれ異なる位置のインクの点になるからである。同じ位置の点にできないのは、完全な減色法で色を再現できないため、点描のように数種類の原色インクを別の位置に印刷しなければならないことによる。結果として、1ピクセルの情報は、該当するピクセルよりはるかに広い範囲の点に分散されることになる。従って、インク点の直径がモノクロームより小さくても、精度や再現性は高くない（図5）。

図5. カラー印刷の品位

　カラー印刷には、さらに根本的な問題がある。インクの直径が小さくなるとインクの厚みも薄くなり、吸光が小さくなる。そのため、コントラストを大きくできなくなる。その結果、印刷の品位を上げようとしていわゆる線数を増加させると、濃度諧調の再現ができなくなってしまう。紙の誤差のため、多重印刷して濃度を上げるにも限度がある。紙の大きさは、湿度に影響されやすく精度も望めない。なお、中間調インクによる多色刷りでは、色分解が困難で、色調合わせは一般に感覚の問題として処理される。インク点の大きさの違いは、インク点の厚みをも変えるため、インク点の直径と吸光は単純ではなく、インク点の大きさの段階もそう多いわけではない。

　印刷用のインクは、温度に依存して粘度が変わるため、温度によって溶剤の濃度を変える。すなわち、季節によってインクの濃度が変わるため、一年を通じて同じ色で印刷できるわけではない。このようにカラー印刷は、再現性は高いとはいえず、再現性の程度や精度を示すことも実質的に不可能である。従って、カラー印刷では、精度や色の再現性を向上させる試みはあるものの、制限が大きいことは否めない。このような再現性の低さから、古典学では、常に資料の共有化が困難という問題に制限されてしまう。

　カラー印刷の各過程は、現状ではほとんど人間の感覚的に依存して行われており、印刷の個々の段階で精度を保証するというより、「感覚的な美しさ」によって進められている。カラー印刷の主目的は宣伝用であり、感覚的美しさを中心とする現状の手法を批判すべきではない。

4. CRTでのデジタル資料の提示の利点と問題点

　デジタル静止画の再現性の最終段階はCRT上での表示である。CRT上では、R(ed)、 B(lue)、G(reen)の3色による加色法で色とその諧調が表現される。その3点は、通常極めて接近しており、カラー印刷における色分解の問題は発生しないため、位置と発色に対する精度は高い。しかし、CRTが表現できる明度諧調は、約3D程度で大きくはない。従って、肉眼で識別し得る範囲での黒から白の全範囲を表現できるわけではない。しかし、表示される対象が、紙や絵画であって光源や金属光沢などの3Dの範囲を超えるものがなければ、CRT上で十分な精度を持って表現できる可能性がある。すなわち、高精度のデジタル静止画データがあれば、CRT上では、印刷やマイクロフィルムより、高い再現性で表示可能である潜在能力を持っている。

　しかし、一般に使用されるCRTは、蛍光体の色調が明度によって変化し、アパチャーグリル形式のために、縦と横で分解能が異なるなどの欠点を持つばかりでなく、個々の CRTの明度と色調を合わせることが困難であり、印刷やマイクロフィルムより劣るとされている。実際に、色調と明度、色温度を精密に設定可能なCRTを使用し、明度と色調の指標を用意して調整しなければ、誤差は極めて大きいといえ、高精彩のCRTを選択するだけでは目的を達することはない。換言すれば、印刷や博物館で使用される高価なCRT を購入しても、調整が不可能であれば、実質的に無意味である。また、これらのCRTは、精度より感覚的美しさを基準にしていることが多く、必ずしも精度が高いとはいえない。

　CRTを使用する上での問題点には、使用するグラフィックボードに起因する重要な制限がある。現在のグラフィックボードは、使用されるGraphic CPUの能力が高くなっておりRGB各色8ビット以上のダイナミックレンジを持たせることも不可能ではなくなってきている。しかし、DAC（デジタルアナログコンバータ）がRGB各8ビットの精度しか持たず、表現できる諧調が制限されて、表示精度が低下してしまうことがある。さらに、 TIFなどのRGB各データを16ビットで保持する形式のデータで精度を保っていても、表示ソフトウエアがCRTの表示特性に合わせるための8ビットの補正情報を用意し、データの上位8ビットの部分を補正して値を変更するような場合、DACの8ビットの範囲を逸脱して逆にダイナミックレンジが不足し、大きく誤差量が変わってしまうことになるので注意が必要である。同様に、デバイスドライバで色調やガンマカーブを変更できるグラフィックボードが多いが、デフォールトから変更すると精度が低下する場合もある。従って、CRTそのもの再現性が極めて重要になってくる。

　データを表示するソフトウエアの問題は、無視されがちであるが重要である。最高の精度でデジタル画像データを表示するためには、データ1のピクセルがCRT上の1ピクセルに対応する必要がある。ところが、PhotoShop（Adobe社）のように100％表示が1対 1でない場合がある。画像を縮小拡大して表示したときには、そのalgorithmに関わらず誤差が生じる。

　このように、デジタル画像データをCRTで表示するときには、利用者側に誤差を最小として表示するために基礎知識が必要で設定も負担がかかる。従って、その負担を最小限にするための指標およびその使用方法の提示が、データ作成者側の義務となると言える。当然、CRTの物理的サイズと分解能によって表示されるサイズが変わるため、データには大きさの指標も含まれなければならない。明度諧調の指標としてはグレースケールを使用し、色調の指標としてはカラーチャートを使用する。これらの指標と使用法以外に、CRT で資料を観察する時、推奨される機器と設定値の例示も、データ作成者の義務であるといえる。

　このような問題の解決は困難ではなく、適切な機器とソフトウエアを使用すれば、印刷を超える品位の表示が可能である。

5. 一次資料の分析とデジタル化条件の決定

　北京版チベット大蔵経にかぎらず、一次資料の持つ情報の分析が必要である。北京版チベット大蔵経では、可読性を保証することが必須であり、それが最低の条件ということになる。一次資料が絵画や図表であっても、同様の分析は必須となる。即ち、資料分析で決定すべき内容は、次の点に集約される。

・1.　条件を満足する分解能の決定

・2.　ダイナミックレンジの決定

である。

　分解能と単位長さあたりのピクセル数とは異なることに注意が必要である。分解能と通常1インチ当たりのピクセル数（DPI）で示されるピクセル密度が混同されるため、分解能を高域特性として扱い、ピクセル密度をDPIで示す。高域特性が悪いと、DPIが大きくても、線や点が分離されない。また、高域特性が良くても、量子化誤差の特徴として、線の幅や点の直径がピクセルサイズに近づくと、誤差が大きくなる。

　ダイナミックレンジとは、静止画像であれば、RGBの各量を示すビット数である。ダイナミックレンジといっても、絶対的な大きさではなく、ある範囲内でのRGB各色のとりえる値の範囲での段数である。実際に測定しうる明るさの範囲は、高性能のスキャナでも CCDの限界から3.9D程度であり、その3.9DをRGB各8ビット（各256段階）で表現するか、12ビット（各4096段階）で表現するかで、大きく精度が変わってしまう。スキャナは一般に、デジタル化可能な明度範囲が固定であり、8ビット出力では諧調段数が不足する。

　高域特性は、資料の全体の大きさと必要とされる最小の情報によって決定される。北京版チベット大蔵経のような文字資料では、最小図形の位置情報の誤差が、近接する図形と十分に分離可能なだけ小さいことが必要とされる。ダイナミックレンジは、色調および明度の最小差と、資料全体の色調範囲と明度範囲の比となる。本資料の場合、文字が退色しており、バックグラウンドとなる紙の明度および色調との差が、記録可能な段階数で表現可能であることが必要とされる。

図6. 北京版チベット大蔵経の1ページの例

　図6に示す北京版チベット大蔵経は、枠部の幅約71cm高さ約21cmで、最小線幅は 0.4mmである。例示したページには、最も小さい文字、引用符、ツェックと呼ばれる単語（一般にツェックは音節の区切り記号と考えられているが、実際には音節ではなく単語の区切り記号である）の区切り記号が印刷されている。

　図6は、図表にするために、明度諧調を極めて増幅したグレースケール（GIF形式から表示）であり、実物の文字と紙との明度差はわずかに0.5Dしかない。従って、RGB各8 ビットのサンプリングでは、ダイナミックレンジが不足し消失してしまう線分が多くなる。分光測色計によって、資料の反射光スペクトルと明度差を簡単に計測できる。

　図7に、高域特性が十分に高い時でのDPIの差による誤差の実例を示す。

図7. DPIの違いによる誤差の実例

図7から、線分の幅に対し、約1ピクセルでは、可読とはならないことが一目瞭然である。

　デジタル化資料作成の第一段階として、一次資料中のどの程度の情報をデジタル情報として保持するか、または可能であるかの検討は、このように極めて重要である。特に資料の枚数が多く、個々のページで撮影条件とスキャニングの条件を変えなければならない場合、全ての条件をデジタル資料に添付する必要がある。条件の添付は、データ作成者の義務である。なお、最細線に対し、6ピクセル以上が対応しないと、種々の誤差の蓄積で、不可読部分が現れる。文字と紙との明度差が0.5D程度で色調差が少ない場合、RGB各12 ビットでデジタル化しないと、誤差のため消失する部分ができてしまう。

　CCDの持つ感光範囲を超えられないので、金属光沢がある資料では、金属光沢の部分まで含めて正確にデジタル化はできないことに注意がいる。一般の紙の資料では、3.5Dを超えることは稀であるので、高級なスキャナではダイナミックレンジをオーバーすることはない。しかし、諧調差の少ない資料では、データのビット数が8ビットでは、誤差を記録しているようなものになってしまう。

6. 写真撮影：レンズとフィルム

　資料が巨大である場合、直接スキャンは困難であり、写真撮影後、フィルムをスキャンすることになる。直接スキャンでも写真撮影でも、分割した資料を接続することは、ほとんど不可能である（図8）。

図8. レンズによる像の歪み

　35mmフィルムとマイクロレンズの分解能は、中判や大判フィルムとカメラのレンズに劣ると言われているが、一般に使用される中判や大判カメラのレンズは、いわゆる商品の傷や人物の欠点などが写っては困るコマーシャルフォト用であり、空間周波数は高くない。すなわち、ボケ味が良いレンズが中判や大判フィルム用のレンズである。従って、フィルムとレンズの選択さえミスがなければ、35mmフィルムとマイクロレンズでも十分な精度で撮影可能である。35mmフィルム用マイクロレンズは、極めて分解能が高いものが市販されているので、実測して購入すれば良い。

　レンズの分解能、すなわち2線（点）の分離能力は、被写体との距離で変化する。35mm フィルム用マイクロレンズは、被写体までの距離が1m以下でも分離能力が低下しにくいという特徴がある。一般にポートレート用レンズは、近距離撮影で分離能力が低下する。

　2点もしくは2線間の分離は、図9に示すような誤差の原因となる。

図9. 線分の分離能力

　バックグラウンド、すなわち紙面の黒く、線分との明度差が小さいとき、線分間がより黒くなってしまい分解能が低下するので、線分の分離能力は、実測しておく必要がある。なお、写真雑誌に掲載されることがあるレンズの分解能は、雑誌や測定者ごとに基準が異なるので、参考程度にとどめておくべきである。

　ここで、線分の幅に注目する必要がある。線分の幅が小さくなると、コントラストが低下してしまう（図10）。

図10. 線分の幅とコントラスト

従って、線分の間隔だけでなく、線分の幅と線分の明度が分解能に影響する。このように線分の幅が細くなり、同時に線分の明度が高い（色が薄い）と、量子化誤差が相対的に大きくなり、誤差が一定ではないことに注意が必要である。

　フィルムの色素粒子径と密度も、分解能に著しく影響する（図11）。色素粒子径が大きくなると線分のエッジがボケ、分解能が低下すると共に誤差が増加する。

図11. フィルムの色素粒子径と分解能

　外式のリバーサルフィルムは、低感度であるが極めて粒子径が小さく密度が高い。同時に色調および明度諧調の再現性も優れている。このタイプのフィルムでの明度諧調の再現範囲は、約3.5Dである。フィルムの乳剤厚も分解能に強い影響を与える（図12）。

図12. 乳剤厚と分解能

図12に示したように、撮影時でもスキャニング時でも、乳剤厚が大きいフィルムでは、分解能が悪くなる。特に精密スキャニングでは、その厚さが大きく影響する。上述の外式リバーサルフィルムの乳剤厚は極めて薄いため、スキャン時の影響は少ない。むしろ、乳剤厚のため、スキャナによっては焦点を、意図的に完全には合わないように設計してあると考えられる。

　このように、量子化誤差は高域特性のみを劇的に低下させるため、分解能（高域特性）を実測する必要がある。実測には、図13に示す図を用いる。図13に示した画像の実物は、極めてファイルサイズが巨大であるため、強制的に圧縮してGIFフォーマットに変換したので、正しく表示されていないことに注意されたい。

図13. 量子化誤差の検定用画像

　図13に示す図を適当な距離、すなわち間隔の狭い線分の分離はできないが、間隔の広い線分は分解できる距離で撮影することで、極めて簡単に分解能に関する量子化誤差を測定することができる。この図と共に、JIS1級金尺、カラーチャート、グレースケールを撮影すれば、色調誤差と明度諧調の再現範囲を同時に知ることができる。撮影時の色温度を測定しておかないと、後の補正とCRTでの再現で修正と調整ができず困ることになるので記録しておく。

　撮影時の注意点としては、ストロボを直接資料に向けず、撮影用反射分散傘を使用する。傘の直径は、90cm程度の大きいものの方が光量ムラが少なくなる。なお、ストロボは2 灯以上で偶数個使用し、ストロボに紙を切り抜いた絞りを被せ、ストロボ光が重なる部分の光量を減らし均一化する。すなわち、非円形の穴をあけ、光量ムラを少なくする。一般の撮影では、資料上の数点しかストロボ光量を測光しないのでわからないが、10cm間隔の格子上で測光すると、光量ムラが厳密にわかる。このような絞りを使用しなければ、均一な照射は不可能である。なお、資料に光を照射する角度が悪いと、ストロボの直接反射光が資料上で反射し見えてしまう。特に光沢のある資料では、極めて悪い結果を生じる。

　このような厳密な撮影は、一般のマイクロフィルムなどの撮影でも行われないため、撮影者に指示する必要がある。なお、撮影機材と撮影の詳細に関しては、参考文献[2]に記述してある。

図14. 分解能に関与する条件

　図14に分解能に関与する条件を列挙した。レンズの絞り値（F値）を大きくしすぎると、絞り羽根のエッジによる回折現象が強く現れ、分解能が低下する。レンズにもよるが、 F5.6からF8あたりが最適となる。資料の照明のムラは、プラスマイナス0.1EVでも大きすぎるので可能な限り小さくする（上述の方法で可能である）。プラスマイナス0.1EVの明るさの差は、肉眼ではフィルム上で識別できないが、作成されたデジタル画像データで、明度諧調を強調すると、0.1EVの差でも極めて明瞭に判別できる。また、資料は、18％グレーの基準明度ではないので、そのずれを考慮して最適露出を決める。3分の1絞りづつ露出を変えて撮影し、グレースケールと比較し最適露出を決定する。なお、フィルムを10 度C前後で保管し、さらに撮影中フィルム温度が一定でないと、感度に差が現れる。照明の色温度に関しては、50度Kの差が明瞭に現れるので、厳密に測定し管理する必要があるが、プロ用冷光ストロボを使用すれば、光量差と色温度差は、測定限界以下であり、資料を痛める程度も極めて小さい。白熱電球を低電圧で発光させて長時間露出で撮影するモノクロームマクロフィルムの撮影技術は、再現性という点では、全く役に立たない。低い色温度では、赤い文字はコントラストが低下する。フィルムの色温度に合わせた色温度で撮影しなければ、高再現性は得られない。

本資料では、図15に示す数値が可読性を保証する条件となる。

図15. 北京版チベット大蔵経可読性を保証する条件

　図15の条件は、写真撮影の条件であるが、本資料だけではなく、一般にも適応できる。写真撮影では、最細線の幅に対し、20色素粒子以上ないと、次の段階のスキャニングでの誤差を無視できなくなる。図15の値は、光学的限界からすればかなり余裕があることから、35mmフィルムでも不可能ではないことが分かる。実測結果を図16に示す。

図16. 35mmフィルムでの撮影結果

　当然であるが、フィルムをスキャンした結果から判断してはならない。図16のスキャン結果は参考である。フィルムの観察による粒子径の計測と分解能の判断には、200倍の光学式マイクロメータを使用する。一般に使用される7倍程度の写真用ルーペでは、全く判断できない。

　図16の結果は、1.3mの距離からJIS1級金尺の0.5mm間隔の目盛を分解できることを示しており、コントラスト差が小さい資料であっても、35mm外式リバーサルフィルムとマイクロレンズを用いて、十分精度が高く再現性の高い写真を得ることができる。従って、条件設定のための機材をそろえれば、高価な機材を購入し、撮影を専門化に委託する必要はない。なお、ストロボは高価であるが、撮影室の一部として、撮影台と共にそろえるべきである。

　撮影に使用した機材を、図17に示す。

図17. 選択された撮影機材

　機材をセットし、一度適切な条件を見つけてしまえば、何枚であろうと連続して撮影できる。最も時間を要するのは、均一なストロボの照射を得るためのストロボに付ける非円形絞り穴の適切な形状を見つけ出す作業である。なお、ストロボは、発光時間が短いほど色温度が高いので、発光時間で光量を調節するストロボでは、光量を変えるたびに色温度の計測が必要となる。資料の撮影で次に時間を必要とするのは、焦点合わせである。シャッターの衝撃で、レンズの焦点がずれるので、正確に焦点を合わせるためには、マグニファイアを接眼部に接続し、1枚ごとに焦点を合わせる。資料の近辺にコントラストの高い資料番号札を置けば、自動焦点レンズを使用して撮影が可能となるが、現在自動焦点レンズの精度を調査中である。なお、撮影者が色付きの衣服を着用していると、その反射光で色温度が部分的に変わってしまうので注意が必要である。撮影環境の周囲の壁は、18％グレー紙で覆い一定の反射状態にしておく。

7. スキャニング：スキャナの構造と誤差、誤差検定

　スキャナで得られるデジタル画像データは、写真のフィルムをスキャンした場合、フィルムで生じている誤差とスキャナ自身で生じる誤差の和となる。直接資料をスキャンしたとしても、スキャナのフォトセルが感光する範囲である集光エリアは大きく、結果として収差の大きいレンズを使用しているのと同じことになる（図18）。

図18. スキャナの誤差

　このように一般に誤差が大きいため、一般的にスキャナから得られるデジタル画像データは、ソフトウエアによるフォーカシングや強調などの種々の処理を経たものである。ほとんどのスキャナは、CCDからの無加工データを出力できない。ズームレンズを使用しない形式のスキャナでは、CCD上の光学的投影像の大きさを変更できないため、光学的限界分解能（通常DPIで示される値で、真の分解のではないので注意）以外では、出力DPI 値を変更するための処理もソフトウエアで行う。従って、さらに誤差が混入する。従って、精密なデジタルデータを得るためには、特性の実測が必須となる。特に、スキャナはコマーシャルユースのものが多く、DPI数が大きくても、実際の分解能が高くはない、すなわち高域特性が良いとは限らない。

　量子化誤差は、資料上の線や点のサイズが小さくなって、サンプリングされる点のサイズに接近すると急激に増加する（図19）。すなわち、ある幅の線分を、線幅に対し10点でサンプリングしたときより、100点でサンプリングしたときのほうが、量子化誤差が少なくなる。図19に示すように、線幅や点の直系が小さくなると、急激に量子化誤差が増加するため、ほんのわずかなDPIの差が、再現性に著しく影響する。

図19. 量子化誤差と分解能さらにDPI数が大きくても高域特性が良いとは限らないので、急激に量子化誤差が増加する領域が生じる。従って、この現象を利用して、急激に誤差が増加する領域で実測を行えば、簡単に高域特性を知ることができる。この測定には、図13に示した分解能計測用図形を用いる。

　スキャン結果のデジタル画像データの誤差や精度は、スキャナの構造に依存するため、構造を知ることで誤差の由来と限界を知ることができ、選択を誤ることがなくなる。

　図20は、CCDカメラの構造である。

図20. CCDカメラの構造と誤差

　CCDカメラは、図20に示すように、フォトセル（感光素子）が、同一点の光をRGB の強度に変換するわけではなく、位置の異なる3個のフォトセルで変換している。従って、線分のエッジが特定の角度で斜めに投影されるとき、特定の色のフォトセルだけが感光し、エッジに色がついてしまう現象が起こる。異なる位置の3フォトセルから1点の色を求めるため、実際に得られるピクセル数は、フォトセル数の3分の1であるが、何らかの補間などの処理を行い、フォトセル数とピクセル数を同じにする場合が多く、その過程でアーティファクトが混入する。各フォトセルが小さいため、強い光が入射すると近傍のフォトセルに電子が流れ込むブルーミング現象が発生し、十分な明度差を得られないことがある。さらに、フォトセル数が多いため、各フォトセルの感度補正が困難である。このように、現状では、CCDカメラを用いた場合、DPI数に見合う高域特性は得られず、ソフトウエアによってシャープニングなどを行うため、誤差量を特定できない。従って、高再現性画像データの作成には不向きである。

図21. ドラムスキャナの構造と誤差

　ドラムスキャナの構造は、1点の光をRGB3色に分解するため、位置の誤差は生じないが、真円ドラムの作成と回転中心にドラムを合わせることが困難なため、振動が生じて誤差が大きくなる欠点がある（図21）。また、フィルムをドラムに密着させることが困難で、モアレ模様が生じやすくなるため、焦点円を比較的大きくしている。フィルムのドラムへの密着のために、オイルやパウダーを使用するため、フィルム表面が劣化してしまう。精度を上げるためにはドラムの直径を大きくしなければならないが、スキャン速度が落ちてしまうので現在は生産されていない。従って、DPI数は大きいが、高域特性は良くはない。また、フィルムの密着に技術が必要であり、フィルムそのものも痛むので、精密スキャンには適しているとは言えない。ドラムスキャナは、コマーシャルフォトに最適化されてきたといってよい。

図22. シリンドリカルレンズ型フラットベッドスキャナの構造と誤差

　フラットベッドスキャナは、図22に示すシリンドリカルレンズ型と図23に示すズームレンズ型に分けられる。一般に多用されるのは、図22のシリンドリカルレンズ型である。シリンドリカルレンズは、レンズの長尺方向の光を集光できない欠点があり、当然、分解能が、角度によって変わってしまうという問題点を持つ。ズームレンズではないので、 CCD上の投影像の大きさを変えることができず、ソフトウエアもしくは、フォトセルの間引きによってDPI数を変更するため、光学的最大DPI数以外での誤差は大きい。当然ではあるが、ソフトウエアでCCD出力を加工したものが結果となり、algorithmは通常公開されないので、どのような誤差が混入しているか不明である。従って、高再現性スキャニングには向かない。高DPIのものは、コマーシャルフォト印刷用に開発されている。

図23. 円形ズームレンズ型フラットベッドスキャナの構造と誤差

　円形ズームレンズ型フラットベッドスキャナ（図23）は、ズームレンズとCCDの距離を変更して、CCD上の投影像の大きさを変えることでDPI数を変更する。さらに、写真撮影用のズームレンズを使用するため、焦点円の大きさは、他の方式のスキャナより小さく誤差も小さい。使用法は、一般に使用されるフラットベッドスキャナと大差はなく簡便であるが、稼動部が多いので精度を維持するためには保守を必要とする。この形式のスキャナは、原理的に最も誤差が少なくフィルムも痛めないため高精度スキャニングには最適である。この形式のスキャナも、通常コマーシャルフォト印刷に使用されるため、機種によっては意図的に高域特性を低下させているので、やはり実測が必要である。

　本研究の趣旨は、高精度デジタル静止画像データの簡便な作成であるため、フィルムの貼りつけに技術を要するドラムスキャナは、対象外となる。また、フィルムそのものを損傷する可能性がある機材では、フィルム自身が貴重な資料でもあるため、使用できない。そのため、精度検証には、最も高い精度が予測される円形ズームレンズ型フラットベッドスキャナと、シリンドリカルレンズ型フラットベッドスキャナを用いた。円形ズームレンズ型フラットベッドスキャナには、GENASCAN5000（大日本スクリーン製造）を、シリンドリカルレンズ型フラットベッドスキャナには、ProPhotoCDと呼ばれ、極めて多用されているスキャニングサービスを用いた。ProPhotoCDには各種のDPI数があり、64BASE という最高DPI数を使用した。使用したフィルムは、同一のもので、35mmフィルムでの精度検証用に撮影したものであり、十分な精度を持ったフィルムである。以下に検証結果を示す。

図24. 形式の異なるスキャナの分解能の差

　図24に結果を示す。左は5400DPIで、右は約4500DPIである。DPI数の差から生じる分解能の差以上に、高域特性に差が生じていることがわかる。図下の明度のヒストグラムを見ると、左では明るさに差があり分離されているが、右では、明度諧調にほとんど差がない。図24のデジタル画像データは、どちらもスキャナからの出力結果を直接表示したもので、極めて色調誤差も明度諧調誤差も大きい。

　図25は、本資料における可読性を保証する精度と再現性目標である。本資料の場合、 5400DPIで、そのDPIの匹敵する高域特性ならば、5400DPIでなんとか目標を達成できるが、4500DPIでは、最細線にはかなりの誤差が混入する。図24で示したように、スキャナからの出力結果は、大きな色調と明度諧調の誤差を含むので、そのままでは正確な精度検定もできない。勿論、色調と明度諧調を補正しないで、そのままデータとして公開はできない。なお、図25の左の金尺は、右の文字と同一縮尺であり、同一撮影条件とスキャニング条件（5300DPI）のデータを貼り合わせたものである。

図25. 可読性を保証するデジタル画像化の目標

8. デジタル画像データの補正の基礎

　スキャナの出力データは、そのままではあまりに色調と明度諧調がずれているため、精度検定のためにも公開のためにも補正が必要である。図26に補正前後のデジタル画像を示す。

図26. 明度と色調の補正前後の比較

　図26は、強制的にピクセル数が少ないGIFファイルに変更しており色数も256色に減色されてしまっているが、それでも大きな差があることがわかる。補正が必須であることは、一目瞭然である。しかし、単純に資料と共に撮影してあるカラーチャートとグレースケールを基準に補正すれば良いわけではない。

図27. サンプリングビット数の差による量子化誤差

　図27に8ビットサンプリングと12ビットサンプリングでの諧調情報の差を示す。8 ビットサンプリングデータでは、最も諧調表現の大きい白から黒でも256階調しかないため、補正をすることによって極めて大きな誤差が蓄積する。従って、データそのものが、 RGB各12ビット以上のデジタル画像データでなければならない。TIFフォーマットであれば、RGB各16ビットまで情報を保持できる。勿論、補正を行うソフトウエアが、RGB 各16ビットで情報を保持し、同時に演算できなければ、誤差が大きくなりすぎる。図2 6ではわかりにくいが、8ビット画像データのProPhotoCDでは、補正しきれない。

　スキャナによっては、諧調の特定の領域だけを伸張して8ビットデータを作成することが可能であるが、得られるデータの誤差が大きくなりすぎて補正は不可能にちかい。

　補正は、8ビットデータであっても、レタッチソフトウエアで16ビットに変換して行う。なお、肉眼での補正は不可能であり、グレースケールの部分で、RGBの値をソフトウエア内のツールで測定しながらRGB別々にトーンカーブを変更して補正を行う。レタッチソフトウエアの自動補正は、全く役にたたない。グレースケールは、スキャナでサンプリングできる明度諧調を超えているので、グレースケールのどの範囲に諧調の直線性があるか判断できなければならない。その範囲のみで補正する。補正が正しければ、カラーチャートの原色も正しく表示され、数値で確認できる。逆にいえば、完全な補正は不可能なので、理論値からのずれで、誤差量を定量できる。

図28. 補正データによるスキャナの分解能検証

　補正前後の変化を図28に示す。補正後では、あきらかに分解能が向上しているように見えるが、28では、金属部分であってよりコントラストが明確になったので、他の諧調の部分では必ずしも分解能が向上するわけではない。

　誤差を最小にした補正を行うためには、まず、全体のダイナミックレンジ（各RGBのビット数）と情報を保持しているビット数の比を考慮しなければならない（図29）。

図29. ダイナミックレンジと情報を保持したビット数

図29の上は、バックグラウンドと文字の部分（シグナル）の差が小さい。このバックグラウンド（B）とシグナル（S）比が小さいとき、情報を保持しているビット（S）の段数が少なく、もともと誤差が大きい。即ち、明暗さや色調の差が小さいとき、相対的に量子化誤差が大きくなっている。このような情報をそのまま補正すると、無視し得ない誤差を蓄積することになる。従って、もし、原デジタルデータのダイナミックレンジが8ビットであるなら、それを16ビットに変換してから補正を行い、Sに含まれる誤差を最小にする。　S/B比が悪いからと言って、スキャナの特性を変え、もともとも3.5Dを計測していたのにソフトウエアで1.8D分を拡大（図29下）しても、誤差の割合は変わらない。スキャナは、CCDの感度を変更して物理的に範囲を限定してスキャンできるとは限らない。もし、CCD出力電圧の特定の部分だけに8ビットや12ビットのダイナミックレンジを割り当てることができれば、本当に誤差が減るが、そう簡単にスキャナの校正ができるわけではないので、普通は、ソフトウエアによる変更で、誤差は減らない。スキャナの取りこみソフトウエアによるダイナミックレンジと濃度階調の変更は、図30のように、誤差が増加する。図30では、RGB各色のパターンが全く異なってしまい、補正不可能となる。

図30. 明度指定取りこみによる誤差の増大

　図30と同じ現象は、レタッチソフトウエアでダイナミックレンジを特定の範囲で限定して伸張した時のも生じてしまう。従って、段やサチュレートする補正カーブを作成してはならない。

　次に補正時の誤差に大きな影響を与えるのは、RGB各色に与えるビット数である。RGB 各8ビットで十分と感じるかもしれないが、全く不足している（図31）。RGB各8ビットのとき、最も近似段数が多い色が｛白から黒｝であり、256段階になる。｛白から黒｝では、RGBがそれぞれ同じ値を取る。しかし、｛白から黒｝以外の色では、RGB各ビットの比率が1：1：1にならないので、近似段数は、256段階より劇的に減少してしまう。つまり、色調を変更せずに明度を変えなければならないこと考えると、RGB各8ビットでは、離散の程度が大きくなりすぎ、誤差が蓄積してしまう。従って、RGBにそれぞれ16 ビットを与えて補正しないと、誤差を示すことができないほど誤差が蓄積してしまう。実際には、赤は補正できるが、赤と緑の加色の黄色が補正できない、というような現象が生じてしまう。CMYK方式を使用しても、結局内部のビット数の大きさに制限されてしまうことに注意が必要である。

図31. RGB各ビット数の違いによる補正での誤差

　このように、デジタル処理で、何が誤差に関係しているかを理解していないと、補正は誤差を生じるだけの結果に終わってしまう。なお、撮影条件が同じで同一フィルムであれば、そのフィルム内の全コマに対し、同一の補正カーブを使用できる。

図32. 資料と補正用チャートの配置

　図32に資料と補正用チャートの配置を示す。正確に撮影されたフィルムであれば、図下のグレースケールを用いてRGBそれぞれの補正カーブを同時に作成して補正できる。上部のカラーチャートは、補正結果と色調のズレを示す指標となる。当然、補正がうまく行われれば、赤、緑、黄色の数値は、理論値に極めて近づく。レタッチソフトウエアには、 RGBの値を表示する機能があるので、それを使用してグレースケールでのRGB各数値を決定し、補正カーブに反映させる。同様に、カラーチャートもRGBの数値で表示できるので検定できる。

9. デジタル画像データの検定

　得られたデジタル画像データの補正後、実際に高域特性などの検定を行う。上述のように、スキャナの高域特性はDPI値とは異なり、さらにスキャナの目的によって、スキャナ内でデータが加工されてから出力される。この差は極めて大きい。

図33. 補正データによるスキャナの特性検定

　図33にGENASCAN5000とProPhotoCD 64BASEの比較を示す。GENASCAN5000 は、精度の向上を目指して開発され、一方ProPhotoCD 64BASEはコマーシャルフォトのデジタル化のために開発されており、目的がはっきりと異なっている。GENASCAN5000 では、金尺の目盛線に量子化誤差による濃淡差がはっきり記録されているが、64BASEでは、コントラストが低下すると同時に直線化している。これは、64BASEがかなりソフトウエアによる修正がなされていることを示している。

図34. 細線の拡大による高域特性の検証

　図34に、さらに拡大した目盛線を示す。左では、ほぼ理論どおりに誤差が表れている。一方右の64BASEでは、完全には分離されていないし、直線方向に補間が行われている。この結果、64BASEでは、商品では傷が目立たず、人物では肌があれないというコマーシャルフォト用には非常に良い結果を示すと思われ、そのような分野で多用されることが理解される。しかし、高域特性を重視した場合、64BASEは、誤差が極めて大きい。従って、微細情報を持つ資料のデジタル化には不向きである。図34のように、明確に高域特性を検証できない実資料では、図35のようになり、一見差がつかない。

図35. 実資料による比較

　図35では、左右の差はボケ具合の差のように見えるが、拡大すると全く違うことがわかる。

図36. 拡大による細部の比較

　図36に1文字の拡大を示す。細部に着目すると、角の消失や線の連結が見られる。文字を知っている人間が読む場合には、障害になるほどではないが、初学者やOCRでは確実にミスのもとになる。　このような細部の検討がなされなければ、可読性の保証やデジタル画像データとして OCRやその他の解析に使用可能な資料とはなり得ない。精度保証が無くても、データが存在すれば、入手した人はデジタル処理に用いてしまい、後々困る問題が出てくるわけである。このような事態は、種々の解析ソフトウエアが安価に提供される今日では既に発生しているのである。

　結果として、本資料には、GENASCAN5000を用いれば、可読性の保証が可能なデジタル画像データを得ることができた[5]。しかしDPI数と高域特性は、ギリギリであり、資料中のページによっては十分ではない部分もある。もし、GENASCANが6000から7000 のDPI数とそれにみあう高域特性を持っていれば、1枚づつデジタル資料を検定せずに済むことになる。なお、デジタル資料の参照者は、常に参照しているデジタル資料の精度に注意していなければならない。精度は、大きさによって変化するのである。1ドット分の有る無しは誤差の範囲であり、そのDPI数と高域特性では評価できないのである。

10. CRTによる画像の再現

　デジタル画像データは、主にCRTを用いて肉眼での観察が一般的である。前述のようにCRT（陰極線管）を用いた表示では、種々の問題がある。しかし、これらの問題は、解決可能であるが、CRT側に解決するための簡便な設定機能が用意されていなかったことが、 CRTを高精度再現から遠ざけていた理由である。現在、高価で煩雑な設定のCRTを用いないで、自動的に最も手間のかかる色調と明度階調を合わせてしまうCRTを用いて高再現性表示が可能となっている。しかし、全自動で設定が終了するといっても、正しく表示するための事前準備と環境を用意しなければならない。高再現性のCRTを得られるか否かで、デジタル図書館やデジタル博物館の重要性が大きくかわるのである。

　カラーCRTは、大きくトリニトロン管に代表されるアパチャーグリル方式と、シャドウマスク方式に分けられる。アパチャーグリル方式は、縦に電子線を遮る細い金属の線が多数ある方式で、日本では比較的好まれる。この多数の縦の金属線は、2本の細い横方向の金属線で振動しないように固定されている。従って、アパチャーグリル方式では、必ず見えない線の領域ができてしまう。縦方向の金属線であっても、発光する点の形状は、円形からそれほど大きくずれるわけではない。しかし、アパチャーグリル方式では、縦方向の金属線のため、横と縦で、分解能が同じではないという根本的な問題が生じてしまう。製図の図面のように直線や曲線であることが予め判明している場合では問題ではないが、文字や絵画を精密に観察するのであれば、アパチャーグリル型のCRTを避けるべきである。ほぼ正方形に近い大型のアパチャーグリル型の印刷用CRTが、博物館等で使用されることがあるが、蛍光体の表面反射が大きすぎ、部屋を暗くしないと再現性が極めて劣化し、調整も困難である。シャドウマスク型CRTは、アパチャーグリル型で現われるような角度による分解能の差は生じにくい。現在、高精度CRTは、シャドウマスク型が主である。

　超高精細CRTでは、シャドウマスクピッチが0.23mm程度であり、水平走査周波数が 135KHzを超え、横2000ドットを超える表示が楽にできる。勿論、最新のグラフィックスボードもメモリを32MB搭載し、350MHz程度のDACを持つため、横2000ドットの表示を可能にしている。しかし、そのような超高精細表示は、高周波であるため再現性の点から言えば非常に困難であり、調整と適切な準備が必要である。単純にグラフィックスボードとCRTを接続しても、求める再現性は得られない。以下のCRTの調整と選択に関しては、高再現性を保証し得る高級なCRTに限定した事項である。高級だからといって、非常に高価なわけではない。

　CRTの調整すべき最初の項目は、輝度とコントラストである。一般に工場出荷状態では、輝度70％から80％で、コントラストが最大の100％、色温度は9500度前後に設定されている。このような状態では、明るいほうの階調も暗いほうの階調も潰れてしまい、さらに、電子ビーム出力が強すぎて、光点の形状も円形とはならず、楕円形となってしまうし全体図形歪みも大きくなる。パーソナルコンピュータ雑誌などでは、この状態でテストしている場合が多く、正しい性能評価はできないことに注意されたい。まず、大雑把に色温度を合わせる。色温度の設定には、撮影された状態の色温度でカラーチャートを照射し、CRT で標準カラーチャートを表示して比較する。次に、白（RGBそれぞれ256の最大）から順に減らしたグレースケールビットマップを表示し、明るさとコントラストを設定する。色温度がずれてしまうので、再度色温度を合わせる。この時、画面上の色温度を計測できる機器（カラーキャリブレータ）を接続できるCRTがあるが、あまり正確ではないので、カラーチャートとの比較による目視調整が必要である。RGBの各明るさが別々に変更できないと、色温度は正確には合わせられない。むしろ、輝度が変わると色温度が変わってしまう現象が起こるので、輝度によって色温度があまりに変わってしまうCRTを選択してはならない。残念ながら、CRT側に輝度と色温度を合わせる回路がないときちんとした調整ができず、CRTの選択肢が狭まる。

　このCRT側の調整を行うとき、グラフィックスボード側のデバイスドライバを変更してしまうと、逆に精度が下がってしまうことがあるので初期値にしておく。勿論、レタッチソフトウエアや表示ソフトウエアでもCRT用の設定をしないほうが良い。　次に、CRTの像の歪みを修正する。これは、かなり手間のかかる作業であるが、一度行っておけば、CRTを移動したり磁気を帯びたものを近づけない限り必要ない。縦横が正方になったグリッドを表示して合わせる。

　なお、これらの調整は、CRT購入直後に行っても、直ぐにずれてしまうので、数日間連続して数時間通電しておき安定してから行う。さらに電源投入直後に調整するのではなく、温度が一定になってから行う。高精度CRTでは、約2週間の慣熟使用が必要になる。なお、グラフィックボードとCRTを接続するケーブルは、頻繁に取り外したり交換してはならない。しばらく接続して信号を流している間に高周波特性が良くなってくる。

　CRTの調整で問題になるのは地磁気である。高性能CRTは、地磁気に影響されるし、周囲にある帯磁したものにも影響される。高性能CRTの電源を入れたままCRT消磁器を使用してはならない。遠距離から弱く消磁する程度で十分であり、慣熟期間の2週間程度でCRT上のムラは減少する。慣熟期間中に、数度繰り返して調整を行う。

　CRTのカソードは、経年変化で消耗し、フォーカスが悪くなってくる。通常3年程度で明らかに劣化する。そのためCRTの選択では、カソードの形状を工夫してあり寿命の長いものを選択すべきである。

　CRTの輝度、コントラスト、色温度、歪、消磁が終わった時点で、グラフィックスボードとのインピーダンスマッチングを調べる。これは、CRT側の性能を超えない範囲で、最もピクセル数と垂直同期周波数を高くする。ケーブルやDACに問題があると、CRTの性能が十分に高ければ、画面がボケ、場合によってはゴーストが見える。また、高周波では混信が増加するので、必ず色が濁る。従って、ケーブルやグラフィックスボードのDAC などの性能によって、再現性の高い範囲でのピクセル数と垂直同期周波数が決まってしまう。むやみに縦横のピクセル数を増やしたり、垂直同期周波数を上げても無駄である。

　上述のCRTの調整は、なかなか厳密にはできず、また、同じ機種のCRTであっても、 2台並べて比較すると、調整後でもかなりずれていることが多い。従って、輝度とコントラスト、歪、色温度を調整した後、グラフィックスボードの特性も合わせて、CRTが一気に自動調整する機能があれば、2週間以上かかる微調整の手間もCRT間の輝度と色調のズレの補正も簡単に済んでしまう。満足の行く調整は、そのような機能がないCRTでは、輝度やコントラストを調整しても駄目で、結局蓋を開けて高電圧で危険な思いをして修正するしかない。すなわち、輝度などは、それほど直線性が高いわけではないので、実質的に補正不可能な機種が多い。

　精度及び調整の能力を含めて、CRTをテストした。結果、圧倒的に性能が良かったのは、 F980（NANAO）であった。F980は、輝度、コントラスト、色温度の調整の後、グラフィックスボードの特性も含めて色調などを自動で修正してしまう機能を持っている。2台のF980で、異なるグラフィックスボードを使用していても、一見しただけでは差が分からない。また、自動調整後、カラーチャートとグレースケールとの比較も、そのままで十分使用に耐えるほど良い結果を示した。従って、F980では、慣熟運用と、消磁、輝度、コントラスト、色温度設定だけで済む。色温度に関しては、輝度とコントラストの設定の後、十分正確であったので、RGBを別々に調整する必要は無かった。色温度は、正確でなければならない必要があるデジタルデータの修正でのカラーチャートとの目視比較以外、撮影時の色温度に合わせておけば、大きなズレはない（機種によってはかなりずれる）。 F980では、輝度の違いによって、色温度がほとんど変化しないようにする回路が導入されているので、他機種のような長時間かけても不可能かもしれない調整をするということがない。

　F980の欠点は、慣熟時間が非常に長いことにある。また、グラフィックスボードの性能差とケーブル（D－SUBコネクタケーブルとBNCコネクタケーブル）の差を如実に出してしまう。慣熟期間初期では、CRT上にかなりのムラが目立ち、定期的にデガウスボタンを押し、定期的に消磁作業を行う必要がある。また、地磁気の向きにも敏感である（補正ができる）。テストに使用した2台のF980では、慣熟期間にほぼ3週間を必要とした。　性能は、極めて良く、D-SUBコネクタのフェライトの効果もはっきり分かる。当然、ドットクロックが高いときには、フェライト付きケーブルではボケる。BNCコネクタのケーブルも、品質の差を出してしまうし、グラフィックスボード上のDACの性能も表現する。種々のグラフィックスボードと共にテストした結果、フェライト無しのBNCコネクタケーブル（Canopus社製）が最も高周波特性に優れていた。D-SUBコネクタケーブルでは、ドットクロックが高くなると（ピクセル数と垂直同期周波数が大きくなると）、画質の劣化が激しい。BNCコネクタケーブルの方がより精度が高いが、グラフィックスボード側がD-SUBコネクタでは、大きな差は出ない。グラフィックスボードでは、BNCケーブルが使用できるSPECTRA5400 Premium Edition（Canopus社）を使用した。NDIVA 社製のグラフィックスCPUに内蔵されるDACは、わずかではあるがゴーストを生じる。それでも、D-SUBコネクタケーブル（フェライト付き）を使用するゴーストを生じないグラフィックスボードより高い分解能を示した。また、BNCコネクタケーブルの混信は、 D-SUNコネクタケーブルよりはるかに少ない。

　F980は、カソード形状の工夫から経年変化が少ない構造となっているので、再現性の変化に悩まされることは少ないと思われる。図書館や博物館では、経年変化は大きな問題となる。

　上述のように、F980のように、CRTが自動でグラフィックスボードの修正も含めて行ってしまうと、極めて簡単に高再現性画像を表示することが可能となる。色温度が異なるデジタルデータに関しては、色温度を設定しなおしてから、自動設定を起動すれば済んでしまう。大変手間と専門知識を必要としたCRTの調整から利用者を解放したと言う点で、 F980は革命的であり、デジタル画像資料の高再現性表示の障害が激減し、デジタル図書館とデジタル博物館の実現が一層現実のものとなった。F980は、21インチ管であり大きくはなく、今までのように複数人が1台の巨大なCRTや3管式プロジェクタの前で共通のデータを眺めなければならない状態から、個人用の環境を用意できると言う点でも優れている。自動調整ソフトウエアの起動方法を利用者に示しておけば、利用者がデジタル画像データの条件に合わせて設定できる。しかし、現状では、F980以外に選択肢がないことが問題であるが、追随する機種が現われると期待する。

　なお、関東では50Hz、関西では60Hzで蛍光灯が点滅し、色温度も高いため、CRTでデータを観る環境を作る必要がある。周囲の色温度とCRTでの色温度が大きくずれていると、正しくない印象が残ってしまう。もはや入手が不可能なので、余談になってしまうが、DACがグラフィックスCPUと分離していた時代のグラフィックスボードには、今日のグラフィックスボードより再現性の高いものがあった。

11. デジタル画像データの活用

　精度保証付きの高再現性デジタル画像データは、それ自身が一次資料として貴重な役割を果たす。可読性を保証したデジタル画像データであれば、アウトラインを検出してフォントの作成やOCR技術を用いて電子テキストに変換可能である。図37に実際にアウトラインを抽出した結果を示す。

図37. アウトラインの抽出

図37では、中程度の精度のデータからアウトラインを抽出したため、良い結果は得られていないことに注意されたい。高精度デジタル画像であれば、OCR研究にも非常に役立つし、未コード化文字群のコード化研究の基礎にも使用できる。

　高いDPIで高精度でデジタル画像化してあれば、肉眼や顕微鏡では観察しきれない情報を得ることも可能である。図38は、カビの緑色の部分を強調するように画像処理した結果である。

図38. 保存状態の検証

図38では、周囲の部分および指紋の部分が特に緑に変色しており、好気性のカビの生育状態がはっきり識別できる。結果として、本資料の通気状態まで分かってしまう。

　このように、デジタル画像資料は、一次資料をそのまま閲覧する以上の情報を与えることが可能なのである。

12. 結語

　以上、基礎知識として考慮すべき部分を可能な限り解説し、精度を保証した高再現性デジタル画像データを簡便に安価な機材を用いて作成する過程および手法と、CRTを使用して高精度で表示する方法を示した。本論文で解説した基礎知識があれば、簡単なチャートを用いて十分に精度を保つと同時に、精度を数字として示し得ることが証明されたと考える。また、実際に必要な精度も示すことができた。本研究で、精度の証明のために高価な精度の測定機材が不必要になったわけではないことを強調しておく。高価な精度測定機器は、決して不用になったのではなく、より厳密なデータ作成のために人文系と理系の研究者が共同プロジェクトを推進するために、図書館や博物館にとってより重要になったということである。

　本研究で示したように、精度保証付きの高再現性デジタル画像データの作成は、困難ではない。しかし、より簡便な方法へのアプローチは、始まったばかりである。デジタル機器の進歩も極めて早いので、さらに簡便化可能であると予測されると同時に、より高精度のデジタルデータ作成の研究も推進しなければならない。11で示したように、精度が向上してより分解能が高くなると、思いもよらなかった利用法が生じてくるのである。現在種々の一次資料のデジタル化が進んでいるが、精度に関しての情報公開を願う。そして、日本からのデータの提供が増加することを希望する。

　音声に関しても、DVDオーディオの普及が始まっており、96KHz24ビットサンプリングデータの再生が一般的に可能となりつつある。192KHzサンプリングも不可能ではない。音声に関しても、無視されがちな位相問題や遅延時間問題がある。音声も高再現性に向けて研究を進めている。

謝辞

　精度向上のために協力していただいた、株式会社ニコン、MINOLTA、COMET、堀内カラー大阪現像所、Kodak、大日本スクリーン製造(株)、株式会社ナナオ、三菱電機、カノープス株式会社、MATROX、高速電脳、DOS/Vパラダイス京都店の皆様に深く感謝いたします。

参考文献

[1] 鈴木大拙編：影印北京版西蔵大蔵経、西蔵大蔵経研究会，1955年 12月 28 日（全 168 巻，絶版）.

[2] 柴田みゆき, et al. 北京版チベット大蔵経の高デジタル画像化：写真撮影過程. 情報処理学会「人文科学とコンピュータ研究会」報告書, Vol.98, No. 97, pp.73-80, 1998年10月.

[3] 今枝由郎，チベット大蔵経の編集と開版，岩波講座東洋思想第11巻チベット仏教，岩波書店， 1989年5月31日.

[4] 宮下晴輝, et al. チベット文字コードのデザインの考察, 財団法人国際情報化協力センター, 平成 10年度通商産業省工業技術院委託国際規格共同開発調査「多言語情報処理環境技術」成果報告書, pp. 125-136, 1999年3月.

[5] 柴田みゆき, et al. 北京版チベット大蔵経の高再現性デジタル画像化：高精度スキャニング過程, 情報処理学会「人文科学とコンピュータ研究会」報告書, Vol.99, No.59, pp.43-50, 1999年7月.