貴重資料やテキストの内容だけでなく書体などの情報が重要な資料は、一般にマイクロ フィルムや写真印刷物、または、デジタル画像データとして配布されてきた。しかし、マ イクロフィルムは、カラー・モノクロームに関わらず、保存・配布が困難であり、拡大投 影装置の限界もあって十分な再現性を得られない。同様に、写真印刷は、色分解と印刷の 過程で、極めて大きな誤差が混入して分解能が低下し、さらに色相と明度に対する再現性 も低く温度による季節変動も大きい。カラー・デジタル画像データが、原資料に対して十 分な精度と量子化誤差を持つことが可能であれば、他の媒体よりはるかに高い再現性を持 つと同時に、保存・配布・参照が極めて容易となる。このような高再現性を保証した画像 データであれば、画像処理の適応によって、保存状態の検証やOCRによる電子テキスト 化など、さらに情報を抽出できることになる。
従って、デジタル図書館では、精度保証付きデジタル資料が根幹をなすことになるが、 デジタル化での評価項目が多く簡便な計測法や機器評価法が確立しておらず、そのような デジタル資料が極めて少ない現状である。そのため、原資料の情報量を評価し、精度保証 付き高再現性デジタルデータの作成から表示までの全過程を詳細に研究し、高精度を保ち ながら簡便に作成から表示までを行う方法を、機材の評価・選択法を含めて行った。原資 料として、完本に近いセットが世界に2部のみである北京版チベット大蔵経(Tibetan Tripitaka Beijing Red Edition)を用いた。本大蔵経の選択理由は、歴史的価値及び内容 的価値が高いばかりでなく、退色が進行して文字と汚れの判別が困難であり、もはやモノ クロームのマイクロフィルム撮影は不可能で、高精度スキャナより大きく直接スキャンも できず、40000ページを超える極めて困難な資料であることによる。
高精度高再現性デジタル画像データの作成と表示のためには、
1) 資料分析による、要求される精度及び誤差の決定
2) 必要とされるデジタルデータのRGB各ビット数、及びファイルフォーマットの検討
3) 写真撮影におけるカメラ・レンズ・フィルム・ストロボの能力、撮影環境の評価
4) スキャナの精度・量子化誤差・スキャニングソフトウエアによるアーティファクトの測定
5) 生デジタル画像データの誤差の少ない色・明度階調補正
6) グラフィックス・ボードの再現性
7) CRTモニターの再現性と寿命、色・明度諧調設定の容易性
の検討が必要である。機器の工作精度の向上や構造によって生じる誤差で、著しく得られ る精度が異なるため、常識にとらわれずに全過程を実測する必要がある。本研究は、上述 の全項目を詳細に分析し、精度を劣化させる原因を求め、量子化誤差に対しても最小限と なる機材選択の評価法を求めた。使用機器に関しては、種々の機器由来の誤差を追及した 結果、誤差の範囲が判明し、入手が簡単であるが最も誤差の少ない機材を選択できること が示せた。さらに、画像処理に必要なRGBの各bit数を、実際の補正の結果から得た。
研究結果は、意外であった。一例を述べると、35mmカラーリバーサル外式フィルム が、粒子径と乳剤厚が最小で粒子密度が最大であり色相と階調の再現性も最高であること が判明した。精密撮影に使用される大判フィルムでは、フィルムの乳剤層が厚いため、精 密スキャナの焦点が合わず、かえって良い結果を得られない。このような実測の結果、技 術の進歩により、一般に信じられてきた結果とは異なる結果を得ることとなった。
本研究の結果、ルーチン化可能な簡便な精度保証付き高再現性デジタル画像データ作成 法が得られ、図書館をデータの供給源とすることが可能となり、さらに印刷用CRTより 安価で長寿命・高再現性のCRTの使用により、データ参照の距離的束縛を大幅に解消す ることとなった。これによって本格的なデジタル図書館の構築が可能となったといえる。
Primary samples like historic texts and drawings in libraries/museums have been distributed by low fidelity secondary forms as microfilms or printed copies. Recently, digital image forms started to use for distribution and exhibition, but a few digital data provide with high fidelity certifications. Thus, digital libraries/museums cannot remove barricades of time and distance between researchers and the primary samples yet. So, we see only first page of a historic book even we can visit a library, or we should watch printed matters. By photo-printings, a color of one point is distributed on multiple dots of on the papers, it is impossible to get fine resolution that researchers with to get. And colors of inks are changed depending on temperature. If CRT can display specific colors on the CRT all the time, digital image data can have much better fidelity than other distribution formats.
The difficulties to provide high fidelity samples used as primary sample have not been researched by complex measurement units and expensive equipments for that. But progress of equipments surrounding computers permits us to provide easy methods to provide high fidelity digital data. Once high fidelity digital data with required resolution and dynamic range could be provided, the data can be used for multiple purposes like OCR and so on after distribution of the data. Thus, providing easy methods for making high fidelity digital data is essential and basic role of digital libraries/museums.
To establish Hi-fidelity digital data, each process from taking photo to viewing the results on CRT has researched. And key points to provide high fidelity digital image could be specified. As the results, easy methods to measure fidelity and quality could be provided. Here, in this paper, following key points are reviewed;
・measuring original data to extract required information from it.
・specifying resolution and dynamic range to held information required.
・evaluating camera, lens, film, flush light and photo taking environment
・evaluating errors of scanners and artifacts from scanning software
・correcting color and contrast of raw digital data
・selecting a graphic board with image quality
・selecting a CRT with image quality and easy setting of color/contrast
Since the quality of the results highly depends on dramatically the equipments, each one was certified. Finally, easy methods to measure basic evaluation points were provided. Thus, we could provide high fidelity digital image data quite easily as routine work. And CRTs and PCs can be chosen for required fidelity without past large expensive CRTs and PCs. By total evaluation by our research, we can provide real contents to digital library/museum.
デジタル図書館やデジタル博物館の最大の利点は、閲覧時間や入館時間に拘束されずに 遠隔地から書籍や収蔵品を参照できることと言って過言ではない。換言すれば、参照が限 定されている一次資料をデジタル資料とすることで、一次資料を共有可能とすることが大 きな利点ということになる。すなわち、デジタル資料が、一次資料と同じ情報を含んでい なければ、デジタル図書館や博物館としての価値が激減するということである。デジタル 資料が十分な情報を含まず一次資料の代替となりえなければ、既存の図書館や博物館のカ タログ情報を増やすだけにすぎない。デジタル資料が一次資料の代替となることで既存の 図書館や博物館の価値が低下するという発想は、既存の図書館や博物館とデジタル図書館 やデジタル博物館の概念的差異の認識不足であり、それではデジタル図書館やデジタル博 物館を作る意味がない。また、デジタル資料の情報量を数量的に評価せず、デジタル資料 の価値を低くみなすことは、デジタル処理による資料分析の意義を理解していないことで ある。たとえば、高分解能高精度で資料をデジタル化し、特定の色のみを抽出して増幅す ると、肉眼や顕微鏡では判断ができないカビのコロニーの検出が可能で、保存状態まで判 断できる。
当然、参照目的によって、情報量を変えてデジタル化することになるが、それは、情報 交換用文字コードによる電子テキスト化のレベルから、デジタル画像まで幅広い段階があ る。文献資料では、近年の電子写植のようにはじめから限定された文字のみ使用された文 書であれば、電子テキスト化は簡単であるが、印刷数の制限で参照が困難な古書籍や貴重 書などでは、そのままデジタル画像化した資料とする。そしてそれが、一次資料の参照が 不可能なとき、実質的に最も情報を保存した資料となってしまう。事実、情報量の保証の ないマイクロフィルム化資料が、一次資料の代わりに多用されている。また、必ずしも情 報交換用文字コードが作成されているとは限らないし、作成されていたとしても、 DevanagariやThaiのように不完全な場合も多い。漢字では、意図的に一文字の構成図形 の位置を変え、それに意味を持たせた文書が、江戸時代には多数印刷されている。勿論、 書き込みなどが重要である場合や、文字書体そのものが歴史的情報を持つために重要であ る場合がある。このような一次資料では、含まれる情報量と精度、再現性を保証したデジ タル画像資料が必須である。そして、まさにこのような資料の情報を保証したデジタル化 による共有化が、研究の促進という極めて根本的な図書館の課題となって当然である。
なお、一次資料に匹敵する情報を持ち一次資料の代替となるデジタル画像データが、 著作権の侵害という理由で分配もしくは参照が、遠隔地において困難なる可能性が極めて高 い。この場合、デジタル図書館やデジタル博物館の意義を再考する必要があると同時にデ ジタル資料の参照と利用における制限に関し、国際的に法的に取り組む必要がある。いず れにせよ、今後、デジタル図書館やデジタル博物館は、デジタル資料の作成の機能を 持たなければ、成り立たないといえる。
上述の著作権と利用制限の問題は十分に解決してはいないが、実際に一次資料の代替と なりえるデジタル資料は、ほとんど作成されていない。繰り返すが、一次資料からどのよ うな情報を必要とするかによって、デジタル資料が包含すべき情報量が変わる。古書籍の 内容を読む必要がないカタログのような場合、表記されている文字が確実に可読である必 要はない。しかし、記述された内容が重要である場合、少なくとも文字の可読性は保証さ れなければならない。このように目的に合致したデジタル資料を作成する必要があるが、 一次資料の持つ情報量の測定以前に、高再現性デジタル画像データの作成自体の研究があ まり進展していない。これは、一次資料からデジタル画像データに変換する過程での誤差 に影響するファクターが多いこと、デジタル化の個々の過程での精度の測定法が簡単では なかったこと、作成されたデジタル画像データの高再現性表示が困難であったことによる。 従って、精度と情報量を保証した高再現性デジタル画像データの作成の試み以上に、高再 現性データの簡便な作成方法という基礎的研究も極めて少なかった。このように、デジタ ル化を行うにあたり、最初の段階から困難が伴い、機器類が進歩したにも関わらず、実際 に情報量と誤差が検討されることは極めて稀で、感覚的判断に頼ってきた印刷技術での過 程と手法をそのまま取り入れていることが多く、精度と再現性ではなくて、見かけの「美 しさ」という曖昧な判断基準を元にデジタル化されてしまうことになる。
このような状態であったため、デジタル化の前に必要な一次資料中の情報の分析と再現 すべき情報の検討から始まり、デジタル化、デジタル資料の再現(表示)までの過程を調 査し、明確に判断可能な基準が必須である。次に、誰もが簡便に目的に合致した情報を持 つ高再現性デジタルデータを作成可能とするために、簡便な精度測定法とデータの作成手 法の開発が必須である。この一連の過程の研究と手法の開発がなければ、機器の選択にも 無駄が生じると同時に、情報量の明記のない誤差の多いデジタル資料を配布することにな る。その結果、作成者に誤差量と精度を確認できない場合、多くのミスを生じることにな り、実際にそのようなミスが生じている。だからといって、理系文系を問わず、高精度デ ジタル化の機器は高価であり、各自が誤差と精度を検証してデジタル資料を作成していて は、本質的に必要な研究が遅滞してしまう。従って、一次資料の代替となりうるデジタル 資料の作成能力が、今後のデジタル図書館とデジタル博物館に強く求められる。
既存の資料配布と共有の一般的方法である、マイクロフィルムや写真印刷などの精度も 再検討も必要である。これらの手段も、フィルムには粒子があり、写真印刷も色分解によ る点をもとにしたデジタル資料である。当然、これらは誤差を含んでいるが、安易に依存 しすぎており、ミスを誘発している。一次資料を変換して配布および共有する場合、それ ぞれの手法で長所短所があり、原理的問題点を知っておく必要がある。
本研究は、上述の問題を解決し、デジタル図書館やデジタル博物館を現実ならしめるた めの基礎研究である。本研究は、貴重資料の共有化による研究の促進に対する効果に着目 し、特に参照が困難な資料を効率良く簡便に精度を示した高再現性デジタル画像資料とす ること、および、デジタル画像資料を可能な限り再現性を高くして表示することを目的と している。従って、各プロセスでの精度指標や測定法などを明示し、同時に簡便な手法を 得ることで、ルーチン化を目指している。
本研究の特徴は、一次資料として、大谷大学に所蔵されている北京版チベット大蔵経 (Tibetan Tripitaka Beijing Red Edition)を選択していることにある。本資料を選択することで、 種々の検討が可能となる。選択された北京版チベット大蔵経は、1950年代中葉にモノクロ ームフィルムから写真印刷されており[1]、この影印本と通称される写真印刷版と比較する ことが可能である。本資料は、大きくカンギュルとテンギュルの2部にわかれ、カンギュ ルが1410年に、テンギュルが1724年に改版され[2、3]、保存状態が良くなく、汚れが激 しい部分がある。植物性と考えられている赤色色素で印刷されており、現在も退色が進行 中である。従って、資料としては、肉眼でも可読性に優れているわけではなく、汚れと退 色のため、モノクロームフィルムやモノクローム印刷では、全く可読ではなくなる領域が ある。本資料の大蔵経は、他の大蔵経の原本と言ってよく、内容が重要であるため、不可 読部分がある影印本では、研究上支障を来す。さらに、本資料は、世界に2部がほぼ完本 で、極めて貴重なため、実物の閲覧は、極めて限定されている。このような性質を持つ資 料であるため、過去の影印本を超える可読性を保証しなければ、デジタル資料としての価 値がない。本資料の特徴は、横幅約80cmと巨大であり、単純にスキャナでスキャンして デジタル画像化できないことにある。巨大なスキャナも生産されているが、本資料を図書 館から持ち出すことは保存上禁止されており、そのようなスキャナのある場所へ移動でき ないし、そのようなスキャナを持ちこむこともできない環境である。従って、写真に撮影 してからスキャンすることになるが、全ページ数が約44000ページもあり、6cm幅の中判 フィルムやそれ以上の大判フィルムを使用することは、金銭的問題と撮影に要する時間の 問題から不可能で、35mmフィルムを使用しなければならない。しかし、木版で印刷され ている文字は、最小線幅が0.4mm前後であり、約5mmの字高の小さい文字と、さらに小 さい引用符としての点線を含むため、極めて撮影が困難である。しかしながら、北京版チ ベット大蔵経の印刷レベルは極めて高く、印刷時には全く不可読部がないものであり、こ の品質の高さは広く知られているため、作成されたデジタル画像の品位に関しては、多く のチベット大蔵経の研究者が評価することができる。余談であるが、本資料は、他のチベ ット大蔵経の原本に相当すると考えられ、他の版は、印刷が極めて悪い部分があり、修正 を加えなければ、写真印刷しても可読とはならないので、異なる編集の「版」を集めて出 版も試みられてはいるが、結局この編集と修正の過程で多くのミスが生じていると考えら れている。チベット語の判読には、チベット文字固有の問題からコンテクストデペンデン シーが生じ、単語だけでなく一文を理解できないと編集は不可能である[4]。
このように、北京版チベット大蔵経は、最も困難な資料の一つと言って過言ではない。 従って、本研究では最も適した資料と言えるため、本資料を用いて、写真撮影、スキャナ によるデジタル化、デジタルデータの補正、CRTでの提示の一連の過程に対して研究を行 った。当然、精度情報と可読性の証明がなければ、本資料の場合、特に禍根を残すことに なる。なお、撮影に使用したページは、本資料中では退色が早く進行しているもので、最 も小さい文字を含むものである。さらに、ルーチン化し、量産するための手法に関しても、 検討した。
上述のように、一般に使用されるモノクロームマイクロフィルムや、カラー写真印刷で は、実際には必要とされているほどの再現性や精度がないことが多い。これら多用される 配布または参照形式の持つ問題点を、資料作成者のみならず資料利用者も理解しておく必 要がある。
モノクロームフィルムでは、色情報が欠落するという根本的な問題がある。一次資料が 白黒の2値情報であれば、モノクロームフィルムで十分である場合が多いが、実際には、 次に示す問題が生じる。まず、マイクロフィルムやマイクロフィッシュ、写真製版に使用 されるモノクロームフィルムは、極めて再現可能な明度階調が少ない。例えば、典型的な フィルムでは、プラスマイナス1絞り分の階調表現しかない。これは、白と黒をより明確 に分離するためである。従って、資料上の細い線分などは、消失してしまう(図1)。
フィルムから印刷用の原版を作成する場合、フィルムでの細線の消失は一般的であるた め、通常撮影者などによって加筆修正されるが、修正が撮影依頼者に報告されないことが 一般的である。実際にマイクロフィルムから写真印刷された書籍では、修正ミスが多いの で安易に信用できないことは、周知の事実である。
階調情報の欠落は、一次資料が絵画や絵図の場合、さらに汚れや退色で資料面のコント ラストが低下している場合、想像以上の誤差を生じる(図2)。
汚れの色調が文字や図と異なっていれば、カラーフィルムでは、図2示すような欠落は 生じにくい。実際の資料では、資料上の各部で汚れの程度と退色の程度が異なり、濃淡差 を生じているケースが多い。このような場合、マイクロフィルムや写真印刷用のモノクロ ームフィルムでは、正確に情報を保持した撮影は不可能である(図3)。
図3. 写真製版用モノクロフィルムによる汚れ・にじみ部分の情報欠落
資料上の線幅に対して十分な程度に銀粒子サイズが小さくても、上述の問題で、再現性 や可読性が高いわけではない。マイクロフィルムでの最大の問題は、マイクロフィルムリ ーダーの投影面のすりガラスが粗く、カラーフィルムであっても高い再現性や可読性が得 られないことである。
写真印刷では、さらに大きな誤差が含まれる。モノクロ写真印刷では、濃淡差を黒点の 大小で表現する。そのため、300DPIといっても、その誤差は極めて大きい(図4)。
印刷用フォントでは、線幅に対し1ピクセルでも良いが、逆の場合では線幅に対し5ピ クセル以上ないと、位置などの誤差から可読とはとても言えない。
カラー写真印刷でも、種々の問題が発生する。カラー写真は、リバーサルフィルムを使 用すれば、印刷用モノクロームフィルムより再現可能な明度諧調は大きく、3.5絞り(D) 程度である。しかし、カラー印刷では、根本的に誤差が大きくなってしまう問題がある。 フィルムの色素粒子が十分に小さく、1ピクセルに相当する小さな円に対して正しい色と 諧調情報が得られたとしても、印刷時にその色の情報が同じ位置の点に再現されるわけで はない。それは、色分解過程で、1ピクセルの各原色の情報は、それぞれ異なる位置のイ ンクの点になるからである。同じ位置の点にできないのは、完全な減色法で色を再現でき ないため、点描のように数種類の原色インクを別の位置に印刷しなければならないことに よる。結果として、1ピクセルの情報は、該当するピクセルよりはるかに広い範囲の点に 分散されることになる。従って、インク点の直径がモノクロームより小さくても、精度や 再現性は高くない(図5)。
カラー印刷には、さらに根本的な問題がある。インクの直径が小さくなるとインクの厚 みも薄くなり、吸光が小さくなる。そのため、コントラストを大きくできなくなる。その 結果、印刷の品位を上げようとしていわゆる線数を増加させると、濃度諧調の再現ができ なくなってしまう。紙の誤差のため、多重印刷して濃度を上げるにも限度がある。紙の大 きさは、湿度に影響されやすく精度も望めない。なお、中間調インクによる多色刷りでは、 色分解が困難で、色調合わせは一般に感覚の問題として処理される。インク点の大きさの 違いは、インク点の厚みをも変えるため、インク点の直径と吸光は単純ではなく、インク 点の大きさの段階もそう多いわけではない。
印刷用のインクは、温度に依存して粘度が変わるため、温度によって溶剤の濃度を変え る。すなわち、季節によってインクの濃度が変わるため、一年を通じて同じ色で印刷でき るわけではない。このようにカラー印刷は、再現性は高いとはいえず、再現性の程度や精 度を示すことも実質的に不可能である。従って、カラー印刷では、精度や色の再現性を向 上させる試みはあるものの、制限が大きいことは否めない。このような再現性の低さから、 古典学では、常に資料の共有化が困難という問題に制限されてしまう。
カラー印刷の各過程は、現状ではほとんど人間の感覚的に依存して行われており、印刷 の個々の段階で精度を保証するというより、「感覚的な美しさ」によって進められている。 カラー印刷の主目的は宣伝用であり、感覚的美しさを中心とする現状の手法を批判すべき ではない。
デジタル静止画の再現性の最終段階はCRT上での表示である。CRT上では、R(ed)、 B(lue)、G(reen)の3色による加色法で色とその諧調が表現される。その3点は、通常極め て接近しており、カラー印刷における色分解の問題は発生しないため、位置と発色に対す る精度は高い。しかし、CRTが表現できる明度諧調は、約3D程度で大きくはない。従っ て、肉眼で識別し得る範囲での黒から白の全範囲を表現できるわけではない。しかし、表 示される対象が、紙や絵画であって光源や金属光沢などの3Dの範囲を超えるものがなけ れば、CRT上で十分な精度を持って表現できる可能性がある。すなわち、高精度のデジタ ル静止画データがあれば、CRT上では、印刷やマイクロフィルムより、高い再現性で表示 可能である潜在能力を持っている。
しかし、一般に使用されるCRTは、蛍光体の色調が明度によって変化し、アパチャー グリル形式のために、縦と横で分解能が異なるなどの欠点を持つばかりでなく、個々の CRTの明度と色調を合わせることが困難であり、印刷やマイクロフィルムより劣るとされ ている。実際に、色調と明度、色温度を精密に設定可能なCRTを使用し、明度と色調の 指標を用意して調整しなければ、誤差は極めて大きいといえ、高精彩のCRTを選択する だけでは目的を達することはない。換言すれば、印刷や博物館で使用される高価なCRT を購入しても、調整が不可能であれば、実質的に無意味である。また、これらのCRTは、 精度より感覚的美しさを基準にしていることが多く、必ずしも精度が高いとはいえない。
CRTを使用する上での問題点には、使用するグラフィックボードに起因する重要な制限 がある。現在のグラフィックボードは、使用されるGraphic CPUの能力が高くなってお りRGB各色8ビット以上のダイナミックレンジを持たせることも不可能ではなくなって きている。しかし、DAC(デジタルアナログコンバータ)がRGB各8ビットの精度しか 持たず、表現できる諧調が制限されて、表示精度が低下してしまうことがある。さらに、 TIFなどのRGB各データを16ビットで保持する形式のデータで精度を保っていても、 表示ソフトウエアがCRTの表示特性に合わせるための8ビットの補正情報を用意し、デ ータの上位8ビットの部分を補正して値を変更するような場合、DACの8ビットの範囲を 逸脱して逆にダイナミックレンジが不足し、大きく誤差量が変わってしまうことになるの で注意が必要である。同様に、デバイスドライバで色調やガンマカーブを変更できるグラ フィックボードが多いが、デフォールトから変更すると精度が低下する場合もある。従っ て、CRTそのもの再現性が極めて重要になってくる。
データを表示するソフトウエアの問題は、無視されがちであるが重要である。最高の精 度でデジタル画像データを表示するためには、データ1のピクセルがCRT上の1ピクセ ルに対応する必要がある。ところが、PhotoShop(Adobe社)のように100%表示が1対 1でない場合がある。画像を縮小拡大して表示したときには、そのalgorithmに関わらず 誤差が生じる。
このように、デジタル画像データをCRTで表示するときには、利用者側に誤差を最小 として表示するために基礎知識が必要で設定も負担がかかる。従って、その負担を最小限 にするための指標およびその使用方法の提示が、データ作成者側の義務となると言える。 当然、CRTの物理的サイズと分解能によって表示されるサイズが変わるため、データには 大きさの指標も含まれなければならない。明度諧調の指標としてはグレースケールを使用 し、色調の指標としてはカラーチャートを使用する。これらの指標と使用法以外に、CRT で資料を観察する時、推奨される機器と設定値の例示も、データ作成者の義務であるとい える。
このような問題の解決は困難ではなく、適切な機器とソフトウエアを使用すれば、印刷 を超える品位の表示が可能である。
北京版チベット大蔵経にかぎらず、一次資料の持つ情報の分析が必要である。北京版チ ベット大蔵経では、可読性を保証することが必須であり、それが最低の条件ということに なる。一次資料が絵画や図表であっても、同様の分析は必須となる。即ち、資料分析で決 定すべき内容は、次の点に集約される。
・1. 条件を満足する分解能の決定
・2. ダイナミックレンジの決定
である。
分解能と単位長さあたりのピクセル数とは異なることに注意が必要である。分解能と通 常1インチ当たりのピクセル数(DPI)で示されるピクセル密度が混同されるため、分解 能を高域特性として扱い、ピクセル密度をDPIで示す。高域特性が悪いと、DPIが大きく ても、線や点が分離されない。また、高域特性が良くても、量子化誤差の特徴として、線 の幅や点の直径がピクセルサイズに近づくと、誤差が大きくなる。
ダイナミックレンジとは、静止画像であれば、RGBの各量を示すビット数である。ダイ ナミックレンジといっても、絶対的な大きさではなく、ある範囲内でのRGB各色のとり える値の範囲での段数である。実際に測定しうる明るさの範囲は、高性能のスキャナでも CCDの限界から3.9D程度であり、その3.9DをRGB各8ビット(各256段階)で表現 するか、12ビット(各4096段階)で表現するかで、大きく精度が変わってしまう。スキ ャナは一般に、デジタル化可能な明度範囲が固定であり、8ビット出力では諧調段数が不 足する。
高域特性は、資料の全体の大きさと必要とされる最小の情報によって決定される。北京 版チベット大蔵経のような文字資料では、最小図形の位置情報の誤差が、近接する図形と 十分に分離可能なだけ小さいことが必要とされる。ダイナミックレンジは、色調および明 度の最小差と、資料全体の色調範囲と明度範囲の比となる。本資料の場合、文字が退色し ており、バックグラウンドとなる紙の明度および色調との差が、記録可能な段階数で表現 可能であることが必要とされる。
図6に示す北京版チベット大蔵経は、枠部の幅約71cm高さ約21cmで、最小線幅は 0.4mmである。例示したページには、最も小さい文字、引用符、ツェックと呼ばれる単語 (一般にツェックは音節の区切り記号と考えられているが、実際には音節ではなく単語の 区切り記号である)の区切り記号が印刷されている。
図6は、図表にするために、明度諧調を極めて増幅したグレースケール(GIF形式から 表示)であり、実物の文字と紙との明度差はわずかに0.5Dしかない。従って、RGB各8 ビットのサンプリングでは、ダイナミックレンジが不足し消失してしまう線分が多くなる。 分光測色計によって、資料の反射光スペクトルと明度差を簡単に計測できる。
図7に、高域特性が十分に高い時でのDPIの差による誤差の実例を示す。
図7から、線分の幅に対し、約1ピクセルでは、可読とはならないことが一目瞭然である。
デジタル化資料作成の第一段階として、一次資料中のどの程度の情報をデジタル情報と して保持するか、または可能であるかの検討は、このように極めて重要である。特に資料 の枚数が多く、個々のページで撮影条件とスキャニングの条件を変えなければならない場 合、全ての条件をデジタル資料に添付する必要がある。条件の添付は、データ作成者の義 務である。なお、最細線に対し、6ピクセル以上が対応しないと、種々の誤差の蓄積で、 不可読部分が現れる。文字と紙との明度差が0.5D程度で色調差が少ない場合、RGB各12 ビットでデジタル化しないと、誤差のため消失する部分ができてしまう。
CCDの持つ感光範囲を超えられないので、金属光沢がある資料では、金属光沢の部分ま で含めて正確にデジタル化はできないことに注意がいる。一般の紙の資料では、3.5Dを超 えることは稀であるので、高級なスキャナではダイナミックレンジをオーバーすることは ない。しかし、諧調差の少ない資料では、データのビット数が8ビットでは、誤差を記録 しているようなものになってしまう。
資料が巨大である場合、直接スキャンは困難であり、写真撮影後、フィルムをスキャン することになる。直接スキャンでも写真撮影でも、分割した資料を接続することは、ほと んど不可能である(図8)。
35mmフィルムとマイクロレンズの分解能は、中判や大判フィルムとカメラのレンズに 劣ると言われているが、一般に使用される中判や大判カメラのレンズは、いわゆる商品の 傷や人物の欠点などが写っては困るコマーシャルフォト用であり、空間周波数は高くない。 すなわち、ボケ味が良いレンズが中判や大判フィルム用のレンズである。従って、フィル ムとレンズの選択さえミスがなければ、35mmフィルムとマイクロレンズでも十分な精度 で撮影可能である。35mmフィルム用マイクロレンズは、極めて分解能が高いものが市販 されているので、実測して購入すれば良い。
レンズの分解能、すなわち2線(点)の分離能力は、被写体との距離で変化する。35mm フィルム用マイクロレンズは、被写体までの距離が1m以下でも分離能力が低下しにくい という特徴がある。一般にポートレート用レンズは、近距離撮影で分離能力が低下する。
2点もしくは2線間の分離は、図9に示すような誤差の原因となる。
バックグラウンド、すなわち紙面の黒く、線分との明度差が小さいとき、線分間がより 黒くなってしまい分解能が低下するので、線分の分離能力は、実測しておく必要がある。 なお、写真雑誌に掲載されることがあるレンズの分解能は、雑誌や測定者ごとに基準が異 なるので、参考程度にとどめておくべきである。
ここで、線分の幅に注目する必要がある。線分の幅が小さくなると、コントラストが低 下してしまう(図10)。
従って、線分の間隔だけでなく、線分の幅と線分の明度が分解能に影響する。このように 線分の幅が細くなり、同時に線分の明度が高い(色が薄い)と、量子化誤差が相対的に大 きくなり、誤差が一定ではないことに注意が必要である。
フィルムの色素粒子径と密度も、分解能に著しく影響する(図11)。色素粒子径が大き くなると線分のエッジがボケ、分解能が低下すると共に誤差が増加する。
外式のリバーサルフィルムは、低感度であるが極めて粒子径が小さく密度が高い。同時 に色調および明度諧調の再現性も優れている。このタイプのフィルムでの明度諧調の再現 範囲は、約3.5Dである。フィルムの乳剤厚も分解能に強い影響を与える(図12)。
図12に示したように、撮影時でもスキャニング時でも、乳剤厚が大きいフィルムでは、 分解能が悪くなる。特に精密スキャニングでは、その厚さが大きく影響する。上述の外式 リバーサルフィルムの乳剤厚は極めて薄いため、スキャン時の影響は少ない。むしろ、乳 剤厚のため、スキャナによっては焦点を、意図的に完全には合わないように設計してある と考えられる。
このように、量子化誤差は高域特性のみを劇的に低下させるため、分解能(高域特性) を実測する必要がある。実測には、図13に示す図を用いる。図13に示した画像の実物 は、極めてファイルサイズが巨大であるため、強制的に圧縮してGIFフォーマットに変換 したので、正しく表示されていないことに注意されたい。
図13に示す図を適当な距離、すなわち間隔の狭い線分の分離はできないが、間隔の広 い線分は分解できる距離で撮影することで、極めて簡単に分解能に関する量子化誤差を測 定することができる。この図と共に、JIS1級金尺、カラーチャート、グレースケールを 撮影すれば、色調誤差と明度諧調の再現範囲を同時に知ることができる。撮影時の色温度 を測定しておかないと、後の補正とCRTでの再現で修正と調整ができず困ることになる ので記録しておく。
撮影時の注意点としては、ストロボを直接資料に向けず、撮影用反射分散傘を使用する。 傘の直径は、90cm程度の大きいものの方が光量ムラが少なくなる。なお、ストロボは2 灯以上で偶数個使用し、ストロボに紙を切り抜いた絞りを被せ、ストロボ光が重なる部分 の光量を減らし均一化する。すなわち、非円形の穴をあけ、光量ムラを少なくする。一般 の撮影では、資料上の数点しかストロボ光量を測光しないのでわからないが、10cm間隔 の格子上で測光すると、光量ムラが厳密にわかる。このような絞りを使用しなければ、均 一な照射は不可能である。なお、資料に光を照射する角度が悪いと、ストロボの直接反射 光が資料上で反射し見えてしまう。特に光沢のある資料では、極めて悪い結果を生じる。
このような厳密な撮影は、一般のマイクロフィルムなどの撮影でも行われないため、撮 影者に指示する必要がある。なお、撮影機材と撮影の詳細に関しては、参考文献[2]に記述 してある。
図14に分解能に関与する条件を列挙した。レンズの絞り値(F値)を大きくしすぎる と、絞り羽根のエッジによる回折現象が強く現れ、分解能が低下する。レンズにもよるが、 F5.6からF8あたりが最適となる。資料の照明のムラは、プラスマイナス0.1EVでも大き すぎるので可能な限り小さくする(上述の方法で可能である)。プラスマイナス0.1EVの 明るさの差は、肉眼ではフィルム上で識別できないが、作成されたデジタル画像データで、 明度諧調を強調すると、0.1EVの差でも極めて明瞭に判別できる。また、資料は、18%グ レーの基準明度ではないので、そのずれを考慮して最適露出を決める。3分の1絞りづつ 露出を変えて撮影し、グレースケールと比較し最適露出を決定する。なお、フィルムを10 度C前後で保管し、さらに撮影中フィルム温度が一定でないと、感度に差が現れる。照明 の色温度に関しては、50度Kの差が明瞭に現れるので、厳密に測定し管理する必要があ るが、プロ用冷光ストロボを使用すれば、光量差と色温度差は、測定限界以下であり、資 料を痛める程度も極めて小さい。白熱電球を低電圧で発光させて長時間露出で撮影するモ ノクロームマクロフィルムの撮影技術は、再現性という点では、全く役に立たない。低い 色温度では、赤い文字はコントラストが低下する。フィルムの色温度に合わせた色温度で 撮影しなければ、高再現性は得られない。
本資料では、図15に示す数値が可読性を保証する条件となる。
図15の条件は、写真撮影の条件であるが、本資料だけではなく、一般にも適応できる。 写真撮影では、最細線の幅に対し、20色素粒子以上ないと、次の段階のスキャニングでの 誤差を無視できなくなる。図15の値は、光学的限界からすればかなり余裕があることか ら、35mmフィルムでも不可能ではないことが分かる。実測結果を図16に示す。
当然であるが、フィルムをスキャンした結果から判断してはならない。図16のスキャ ン結果は参考である。フィルムの観察による粒子径の計測と分解能の判断には、200倍の 光学式マイクロメータを使用する。一般に使用される7倍程度の写真用ルーペでは、全く 判断できない。
図16の結果は、1.3mの距離からJIS1級金尺の0.5mm間隔の目盛を分解できること を示しており、コントラスト差が小さい資料であっても、35mm外式リバーサルフィルム とマイクロレンズを用いて、十分精度が高く再現性の高い写真を得ることができる。従っ て、条件設定のための機材をそろえれば、高価な機材を購入し、撮影を専門化に委託する 必要はない。なお、ストロボは高価であるが、撮影室の一部として、撮影台と共にそろえ るべきである。
撮影に使用した機材を、図17に示す。
機材をセットし、一度適切な条件を見つけてしまえば、何枚であろうと連続して撮影で きる。最も時間を要するのは、均一なストロボの照射を得るためのストロボに付ける非円 形絞り穴の適切な形状を見つけ出す作業である。なお、ストロボは、発光時間が短いほど 色温度が高いので、発光時間で光量を調節するストロボでは、光量を変えるたびに色温度 の計測が必要となる。資料の撮影で次に時間を必要とするのは、焦点合わせである。シャ ッターの衝撃で、レンズの焦点がずれるので、正確に焦点を合わせるためには、マグニフ ァイアを接眼部に接続し、1枚ごとに焦点を合わせる。資料の近辺にコントラストの高い 資料番号札を置けば、自動焦点レンズを使用して撮影が可能となるが、現在自動焦点レン ズの精度を調査中である。なお、撮影者が色付きの衣服を着用していると、その反射光で 色温度が部分的に変わってしまうので注意が必要である。撮影環境の周囲の壁は、18%グ レー紙で覆い一定の反射状態にしておく。
スキャナで得られるデジタル画像データは、写真のフィルムをスキャンした場合、フィ ルムで生じている誤差とスキャナ自身で生じる誤差の和となる。直接資料をスキャンした としても、スキャナのフォトセルが感光する範囲である集光エリアは大きく、結果として 収差の大きいレンズを使用しているのと同じことになる(図18)。
このように一般に誤差が大きいため、一般的にスキャナから得られるデジタル画像デー タは、ソフトウエアによるフォーカシングや強調などの種々の処理を経たものである。ほ とんどのスキャナは、CCDからの無加工データを出力できない。ズームレンズを使用しな い形式のスキャナでは、CCD上の光学的投影像の大きさを変更できないため、光学的限界 分解能(通常DPIで示される値で、真の分解のではないので注意)以外では、出力DPI 値を変更するための処理もソフトウエアで行う。従って、さらに誤差が混入する。従って、 精密なデジタルデータを得るためには、特性の実測が必須となる。特に、スキャナはコマ ーシャルユースのものが多く、DPI数が大きくても、実際の分解能が高くはない、すなわ ち高域特性が良いとは限らない。
量子化誤差は、資料上の線や点のサイズが小さくなって、サンプリングされる点のサイ ズに接近すると急激に増加する(図19)。すなわち、ある幅の線分を、線幅に対し10点 でサンプリングしたときより、100点でサンプリングしたときのほうが、量子化誤差が少 なくなる。図19に示すように、線幅や点の直系が小さくなると、急激に量子化誤差が増 加するため、ほんのわずかなDPIの差が、再現性に著しく影響する。
図19. 量子化誤差と分解能 さらにDPI数が大きくても高域特性が良いとは限らないので、急激に量子化誤差が増加す る領域が生じる。従って、この現象を利用して、急激に誤差が増加する領域で実測を行え ば、簡単に高域特性を知ることができる。この測定には、図13に示した分解能計測用図 形を用いる。
スキャン結果のデジタル画像データの誤差や精度は、スキャナの構造に依存するため、 構造を知ることで誤差の由来と限界を知ることができ、選択を誤ることがなくなる。
図20は、CCDカメラの構造である。
CCDカメラは、図20に示すように、フォトセル(感光素子)が、同一点の光をRGB の強度に変換するわけではなく、位置の異なる3個のフォトセルで変換している。従って、 線分のエッジが特定の角度で斜めに投影されるとき、特定の色のフォトセルだけが感光し、 エッジに色がついてしまう現象が起こる。異なる位置の3フォトセルから1点の色を求め るため、実際に得られるピクセル数は、フォトセル数の3分の1であるが、何らかの補間 などの処理を行い、フォトセル数とピクセル数を同じにする場合が多く、その過程でアー ティファクトが混入する。各フォトセルが小さいため、強い光が入射すると近傍のフォト セルに電子が流れ込むブルーミング現象が発生し、十分な明度差を得られないことがある。 さらに、フォトセル数が多いため、各フォトセルの感度補正が困難である。このように、 現状では、CCDカメラを用いた場合、DPI数に見合う高域特性は得られず、ソフトウエ アによってシャープニングなどを行うため、誤差量を特定できない。従って、高再現性画 像データの作成には不向きである。
ドラムスキャナの構造は、1点の光をRGB3色に分解するため、位置の誤差は生じない が、真円ドラムの作成と回転中心にドラムを合わせることが困難なため、振動が生じて誤 差が大きくなる欠点がある(図21)。また、フィルムをドラムに密着させることが困難で、 モアレ模様が生じやすくなるため、焦点円を比較的大きくしている。フィルムのドラムへ の密着のために、オイルやパウダーを使用するため、フィルム表面が劣化してしまう。精 度を上げるためにはドラムの直径を大きくしなければならないが、スキャン速度が落ちて しまうので現在は生産されていない。従って、DPI数は大きいが、高域特性は良くはない。 また、フィルムの密着に技術が必要であり、フィルムそのものも痛むので、精密スキャン には適しているとは言えない。ドラムスキャナは、コマーシャルフォトに最適化されてき たといってよい。
図22. シリンドリカルレンズ型フラットベッドスキャナの構造と誤差
フラットベッドスキャナは、図22に示すシリンドリカルレンズ型と図23に示すズー ムレンズ型に分けられる。一般に多用されるのは、図22のシリンドリカルレンズ型であ る。シリンドリカルレンズは、レンズの長尺方向の光を集光できない欠点があり、当然、 分解能が、角度によって変わってしまうという問題点を持つ。ズームレンズではないので、 CCD上の投影像の大きさを変えることができず、ソフトウエアもしくは、フォトセルの間 引きによってDPI数を変更するため、光学的最大DPI数以外での誤差は大きい。当然で はあるが、ソフトウエアでCCD出力を加工したものが結果となり、algorithmは通常公 開されないので、どのような誤差が混入しているか不明である。従って、高再現性スキャ ニングには向かない。高DPIのものは、コマーシャルフォト印刷用に開発されている。
図23. 円形ズームレンズ型フラットベッドスキャナの構造と誤差
円形ズームレンズ型フラットベッドスキャナ(図23)は、ズームレンズとCCDの距 離を変更して、CCD上の投影像の大きさを変えることでDPI数を変更する。さらに、写 真撮影用のズームレンズを使用するため、焦点円の大きさは、他の方式のスキャナより小 さく誤差も小さい。使用法は、一般に使用されるフラットベッドスキャナと大差はなく簡 便であるが、稼動部が多いので精度を維持するためには保守を必要とする。この形式のス キャナは、原理的に最も誤差が少なくフィルムも痛めないため高精度スキャニングには最 適である。この形式のスキャナも、通常コマーシャルフォト印刷に使用されるため、機種 によっては意図的に高域特性を低下させているので、やはり実測が必要である。
本研究の趣旨は、高精度デジタル静止画像データの簡便な作成であるため、フィルムの 貼りつけに技術を要するドラムスキャナは、対象外となる。また、フィルムそのものを損 傷する可能性がある機材では、フィルム自身が貴重な資料でもあるため、使用できない。 そのため、精度検証には、最も高い精度が予測される円形ズームレンズ型フラットベッド スキャナと、シリンドリカルレンズ型フラットベッドスキャナを用いた。円形ズームレン ズ型フラットベッドスキャナには、GENASCAN5000(大日本スクリーン製造)を、シリ ンドリカルレンズ型フラットベッドスキャナには、ProPhotoCDと呼ばれ、極めて多用さ れているスキャニングサービスを用いた。ProPhotoCDには各種のDPI数があり、64BASE という最高DPI数を使用した。使用したフィルムは、同一のもので、35mmフィルムでの 精度検証用に撮影したものであり、十分な精度を持ったフィルムである。以下に検証結果 を示す。
図24に結果を示す。左は5400DPIで、右は約4500DPIである。DPI数の差から生じ る分解能の差以上に、高域特性に差が生じていることがわかる。図下の明度のヒストグラ ムを見ると、左では明るさに差があり分離されているが、右では、明度諧調にほとんど差 がない。図24のデジタル画像データは、どちらもスキャナからの出力結果を直接表示し たもので、極めて色調誤差も明度諧調誤差も大きい。
図25は、本資料における可読性を保証する精度と再現性目標である。本資料の場合、 5400DPIで、そのDPIの匹敵する高域特性ならば、5400DPIでなんとか目標を達成でき るが、4500DPIでは、最細線にはかなりの誤差が混入する。図24で示したように、スキ ャナからの出力結果は、大きな色調と明度諧調の誤差を含むので、そのままでは正確な精 度検定もできない。勿論、色調と明度諧調を補正しないで、そのままデータとして公開は できない。なお、図25の左の金尺は、右の文字と同一縮尺であり、同一撮影条件とスキ ャニング条件(5300DPI)のデータを貼り合わせたものである。
スキャナの出力データは、そのままではあまりに色調と明度諧調がずれているため、精 度検定のためにも公開のためにも補正が必要である。図26に補正前後のデジタル画像を 示す。
図26は、強制的にピクセル数が少ないGIFファイルに変更しており色数も256色に 減色されてしまっているが、それでも大きな差があることがわかる。補正が必須であるこ とは、一目瞭然である。しかし、単純に資料と共に撮影してあるカラーチャートとグレー スケールを基準に補正すれば良いわけではない。
図27に8ビットサンプリングと12ビットサンプリングでの諧調情報の差を示す。8 ビットサンプリングデータでは、最も諧調表現の大きい白から黒でも256階調しかないた め、補正をすることによって極めて大きな誤差が蓄積する。従って、データそのものが、 RGB各12ビット以上のデジタル画像データでなければならない。TIFフォーマットであ れば、RGB各16ビットまで情報を保持できる。勿論、補正を行うソフトウエアが、RGB 各16ビットで情報を保持し、同時に演算できなければ、誤差が大きくなりすぎる。図2 6ではわかりにくいが、8ビット画像データのProPhotoCDでは、補正しきれない。
スキャナによっては、諧調の特定の領域だけを伸張して8ビットデータを作成すること が可能であるが、得られるデータの誤差が大きくなりすぎて補正は不可能にちかい。
補正は、8ビットデータであっても、レタッチソフトウエアで16ビットに変換して行う。 なお、肉眼での補正は不可能であり、グレースケールの部分で、RGBの値をソフトウエア 内のツールで測定しながらRGB別々にトーンカーブを変更して補正を行う。レタッチソ フトウエアの自動補正は、全く役にたたない。グレースケールは、スキャナでサンプリン グできる明度諧調を超えているので、グレースケールのどの範囲に諧調の直線性があるか 判断できなければならない。その範囲のみで補正する。補正が正しければ、カラーチャー トの原色も正しく表示され、数値で確認できる。逆にいえば、完全な補正は不可能なので、 理論値からのずれで、誤差量を定量できる。
補正前後の変化を図28に示す。補正後では、あきらかに分解能が向上しているように 見えるが、28では、金属部分であってよりコントラストが明確になったので、他の諧調 の部分では必ずしも分解能が向上するわけではない。
誤差を最小にした補正を行うためには、まず、全体のダイナミックレンジ(各RGBの ビット数)と情報を保持しているビット数の比を考慮しなければならない(図29)。
図29の上は、バックグラウンドと文字の部分(シグナル)の差が小さい。このバックグ ラウンド(B)とシグナル(S)比が小さいとき、情報を保持しているビット(S)の段数 が少なく、もともと誤差が大きい。即ち、明暗さや色調の差が小さいとき、相対的に量子 化誤差が大きくなっている。このような情報をそのまま補正すると、無視し得ない誤差を 蓄積することになる。従って、もし、原デジタルデータのダイナミックレンジが8ビット であるなら、それを16ビットに変換してから補正を行い、Sに含まれる誤差を最小にする。 S/B比が悪いからと言って、スキャナの特性を変え、もともとも3.5Dを計測していた のにソフトウエアで1.8D分を拡大(図29下)しても、誤差の割合は変わらない。スキ ャナは、CCDの感度を変更して物理的に範囲を限定してスキャンできるとは限らない。も し、CCD出力電圧の特定の部分だけに8ビットや12ビットのダイナミックレンジを割り 当てることができれば、本当に誤差が減るが、そう簡単にスキャナの校正ができるわけで はないので、普通は、ソフトウエアによる変更で、誤差は減らない。スキャナの取りこみ ソフトウエアによるダイナミックレンジと濃度階調の変更は、図30のように、誤差が増 加する。図30では、RGB各色のパターンが全く異なってしまい、補正不可能となる。
図30と同じ現象は、レタッチソフトウエアでダイナミックレンジを特定の範囲で限定 して伸張した時のも生じてしまう。従って、段やサチュレートする補正カーブを作成して はならない。
次に補正時の誤差に大きな影響を与えるのは、RGB各色に与えるビット数である。RGB 各8ビットで十分と感じるかもしれないが、全く不足している(図31)。RGB各8ビッ トのとき、最も近似段数が多い色が{白から黒}であり、256段階になる。{白から黒}で は、RGBがそれぞれ同じ値を取る。しかし、{白から黒}以外の色では、RGB各ビットの 比率が1:1:1にならないので、近似段数は、256段階より劇的に減少してしまう。つ まり、色調を変更せずに明度を変えなければならないこと考えると、RGB各8ビットで は、離散の程度が大きくなりすぎ、誤差が蓄積してしまう。従って、RGBにそれぞれ16 ビットを与えて補正しないと、誤差を示すことができないほど誤差が蓄積してしまう。実 際には、赤は補正できるが、赤と緑の加色の黄色が補正できない、というような現象が生 じてしまう。CMYK方式を使用しても、結局内部のビット数の大きさに制限されてしまう ことに注意が必要である。
このように、デジタル処理で、何が誤差に関係しているかを理解していないと、補正は 誤差を生じるだけの結果に終わってしまう。なお、撮影条件が同じで同一フィルムであれ ば、そのフィルム内の全コマに対し、同一の補正カーブを使用できる。
図32に資料と補正用チャートの配置を示す。正確に撮影されたフィルムであれば、図 下のグレースケールを用いてRGBそれぞれの補正カーブを同時に作成して補正できる。 上部のカラーチャートは、補正結果と色調のズレを示す指標となる。当然、補正がうまく 行われれば、赤、緑、黄色の数値は、理論値に極めて近づく。レタッチソフトウエアには、 RGBの値を表示する機能があるので、それを使用してグレースケールでのRGB各数値を 決定し、補正カーブに反映させる。同様に、カラーチャートもRGBの数値で表示できる ので検定できる。
得られたデジタル画像データの補正後、実際に高域特性などの検定を行う。上述のよう に、スキャナの高域特性はDPI値とは異なり、さらにスキャナの目的によって、スキャナ 内でデータが加工されてから出力される。この差は極めて大きい。
図33にGENASCAN5000とProPhotoCD 64BASEの比較を示す。GENASCAN5000 は、精度の向上を目指して開発され、一方ProPhotoCD 64BASEはコマーシャルフォトの デジタル化のために開発されており、目的がはっきりと異なっている。GENASCAN5000 では、金尺の目盛線に量子化誤差による濃淡差がはっきり記録されているが、64BASEで は、コントラストが低下すると同時に直線化している。これは、64BASEがかなりソフト ウエアによる修正がなされていることを示している。
図34に、さらに拡大した目盛線を示す。左では、ほぼ理論どおりに誤差が表れている。 一方右の64BASEでは、完全には分離されていないし、直線方向に補間が行われている。 この結果、64BASEでは、商品では傷が目立たず、人物では肌があれないというコマーシ ャルフォト用には非常に良い結果を示すと思われ、そのような分野で多用されることが理 解される。しかし、高域特性を重視した場合、64BASEは、誤差が極めて大きい。従って、 微細情報を持つ資料のデジタル化には不向きである。図34のように、明確に高域特性を 検証できない実資料では、図35のようになり、一見差がつかない。
図35では、左右の差はボケ具合の差のように見えるが、拡大すると全く違うことがわ かる。
図36に1文字の拡大を示す。細部に着目すると、角の消失や線の連結が見られる。文 字を知っている人間が読む場合には、障害になるほどではないが、初学者やOCRでは確 実にミスのもとになる。 このような細部の検討がなされなければ、可読性の保証やデジタル画像データとして OCRやその他の解析に使用可能な資料とはなり得ない。精度保証が無くても、データが存 在すれば、入手した人はデジタル処理に用いてしまい、後々困る問題が出てくるわけであ る。このような事態は、種々の解析ソフトウエアが安価に提供される今日では既に発生し ているのである。
結果として、本資料には、GENASCAN5000を用いれば、可読性の保証が可能なデジタ ル画像データを得ることができた[5]。しかしDPI数と高域特性は、ギリギリであり、資 料中のページによっては十分ではない部分もある。もし、GENASCANが6000から7000 のDPI数とそれにみあう高域特性を持っていれば、1枚づつデジタル資料を検定せずに済 むことになる。なお、デジタル資料の参照者は、常に参照しているデジタル資料の精度に 注意していなければならない。精度は、大きさによって変化するのである。1ドット分の 有る無しは誤差の範囲であり、そのDPI数と高域特性では評価できないのである。
デジタル画像データは、主にCRTを用いて肉眼での観察が一般的である。前述のよう にCRT(陰極線管)を用いた表示では、種々の問題がある。しかし、これらの問題は、解 決可能であるが、CRT側に解決するための簡便な設定機能が用意されていなかったことが、 CRTを高精度再現から遠ざけていた理由である。現在、高価で煩雑な設定のCRTを用い ないで、自動的に最も手間のかかる色調と明度階調を合わせてしまうCRTを用いて高再 現性表示が可能となっている。しかし、全自動で設定が終了するといっても、正しく表示 するための事前準備と環境を用意しなければならない。高再現性のCRTを得られるか否 かで、デジタル図書館やデジタル博物館の重要性が大きくかわるのである。
カラーCRTは、大きくトリニトロン管に代表されるアパチャーグリル方式と、シャドウ マスク方式に分けられる。アパチャーグリル方式は、縦に電子線を遮る細い金属の線が多 数ある方式で、日本では比較的好まれる。この多数の縦の金属線は、2本の細い横方向の 金属線で振動しないように固定されている。従って、アパチャーグリル方式では、必ず見 えない線の領域ができてしまう。縦方向の金属線であっても、発光する点の形状は、円形 からそれほど大きくずれるわけではない。しかし、アパチャーグリル方式では、縦方向の 金属線のため、横と縦で、分解能が同じではないという根本的な問題が生じてしまう。製 図の図面のように直線や曲線であることが予め判明している場合では問題ではないが、文 字や絵画を精密に観察するのであれば、アパチャーグリル型のCRTを避けるべきである。 ほぼ正方形に近い大型のアパチャーグリル型の印刷用CRTが、博物館等で使用されるこ とがあるが、蛍光体の表面反射が大きすぎ、部屋を暗くしないと再現性が極めて劣化し、 調整も困難である。シャドウマスク型CRTは、アパチャーグリル型で現われるような角 度による分解能の差は生じにくい。現在、高精度CRTは、シャドウマスク型が主である。
超高精細CRTでは、シャドウマスクピッチが0.23mm程度であり、水平走査周波数が 135KHzを超え、横2000ドットを超える表示が楽にできる。勿論、最新のグラフィック スボードもメモリを32MB搭載し、350MHz程度のDACを持つため、横2000ドットの 表示を可能にしている。しかし、そのような超高精細表示は、高周波であるため再現性の 点から言えば非常に困難であり、調整と適切な準備が必要である。単純にグラフィックス ボードとCRTを接続しても、求める再現性は得られない。以下のCRTの調整と選択に関 しては、高再現性を保証し得る高級なCRTに限定した事項である。高級だからといって、 非常に高価なわけではない。
CRTの調整すべき最初の項目は、輝度とコントラストである。一般に工場出荷状態では、 輝度70%から80%で、コントラストが最大の100%、色温度は9500度前後に設定されて いる。このような状態では、明るいほうの階調も暗いほうの階調も潰れてしまい、さらに、 電子ビーム出力が強すぎて、光点の形状も円形とはならず、楕円形となってしまうし全体 図形歪みも大きくなる。パーソナルコンピュータ雑誌などでは、この状態でテストしてい る場合が多く、正しい性能評価はできないことに注意されたい。まず、大雑把に色温度を 合わせる。色温度の設定には、撮影された状態の色温度でカラーチャートを照射し、CRT で標準カラーチャートを表示して比較する。次に、白(RGBそれぞれ256の最大)から 順に減らしたグレースケールビットマップを表示し、明るさとコントラストを設定する。 色温度がずれてしまうので、再度色温度を合わせる。この時、画面上の色温度を計測でき る機器(カラーキャリブレータ)を接続できるCRTがあるが、あまり正確ではないので、 カラーチャートとの比較による目視調整が必要である。RGBの各明るさが別々に変更でき ないと、色温度は正確には合わせられない。むしろ、輝度が変わると色温度が変わってし まう現象が起こるので、輝度によって色温度があまりに変わってしまうCRTを選択して はならない。残念ながら、CRT側に輝度と色温度を合わせる回路がないときちんとした調 整ができず、CRTの選択肢が狭まる。
このCRT側の調整を行うとき、グラフィックスボード側のデバイスドライバを変更し てしまうと、逆に精度が下がってしまうことがあるので初期値にしておく。勿論、レタッ チソフトウエアや表示ソフトウエアでもCRT用の設定をしないほうが良い。 次に、CRTの像の歪みを修正する。これは、かなり手間のかかる作業であるが、一度行 っておけば、CRTを移動したり磁気を帯びたものを近づけない限り必要ない。縦横が正方 になったグリッドを表示して合わせる。
なお、これらの調整は、CRT購入直後に行っても、直ぐにずれてしまうので、数日間連 続して数時間通電しておき安定してから行う。さらに電源投入直後に調整するのではなく、 温度が一定になってから行う。高精度CRTでは、約2週間の慣熟使用が必要になる。な お、グラフィックボードとCRTを接続するケーブルは、頻繁に取り外したり交換しては ならない。しばらく接続して信号を流している間に高周波特性が良くなってくる。
CRTの調整で問題になるのは地磁気である。高性能CRTは、地磁気に影響されるし、 周囲にある帯磁したものにも影響される。高性能CRTの電源を入れたままCRT消磁器を 使用してはならない。遠距離から弱く消磁する程度で十分であり、慣熟期間の2週間程度 でCRT上のムラは減少する。慣熟期間中に、数度繰り返して調整を行う。
CRTのカソードは、経年変化で消耗し、フォーカスが悪くなってくる。通常3年程度で 明らかに劣化する。そのためCRTの選択では、カソードの形状を工夫してあり寿命の長 いものを選択すべきである。
CRTの輝度、コントラスト、色温度、歪、消磁が終わった時点で、グラフィックスボー ドとのインピーダンスマッチングを調べる。これは、CRT側の性能を超えない範囲で、最 もピクセル数と垂直同期周波数を高くする。ケーブルやDACに問題があると、CRTの性 能が十分に高ければ、画面がボケ、場合によってはゴーストが見える。また、高周波では 混信が増加するので、必ず色が濁る。従って、ケーブルやグラフィックスボードのDAC などの性能によって、再現性の高い範囲でのピクセル数と垂直同期周波数が決まってしま う。むやみに縦横のピクセル数を増やしたり、垂直同期周波数を上げても無駄である。
上述のCRTの調整は、なかなか厳密にはできず、また、同じ機種のCRTであっても、 2台並べて比較すると、調整後でもかなりずれていることが多い。従って、輝度とコント ラスト、歪、色温度を調整した後、グラフィックスボードの特性も合わせて、CRTが一気 に自動調整する機能があれば、2週間以上かかる微調整の手間もCRT間の輝度と色調のズ レの補正も簡単に済んでしまう。満足の行く調整は、そのような機能がないCRTでは、 輝度やコントラストを調整しても駄目で、結局蓋を開けて高電圧で危険な思いをして修正 するしかない。すなわち、輝度などは、それほど直線性が高いわけではないので、実質的 に補正不可能な機種が多い。
精度及び調整の能力を含めて、CRTをテストした。結果、圧倒的に性能が良かったのは、 F980(NANAO)であった。F980は、輝度、コントラスト、色温度の調整の後、グラフ ィックスボードの特性も含めて色調などを自動で修正してしまう機能を持っている。2台 のF980で、異なるグラフィックスボードを使用していても、一見しただけでは差が分か らない。また、自動調整後、カラーチャートとグレースケールとの比較も、そのままで十 分使用に耐えるほど良い結果を示した。従って、F980では、慣熟運用と、消磁、輝度、 コントラスト、色温度設定だけで済む。色温度に関しては、輝度とコントラストの設定の 後、十分正確であったので、RGBを別々に調整する必要は無かった。色温度は、正確でな ければならない必要があるデジタルデータの修正でのカラーチャートとの目視比較以外、 撮影時の色温度に合わせておけば、大きなズレはない(機種によってはかなりずれる)。 F980では、輝度の違いによって、色温度がほとんど変化しないようにする回路が導入さ れているので、他機種のような長時間かけても不可能かもしれない調整をするということ がない。
F980の欠点は、慣熟時間が非常に長いことにある。また、グラフィックスボードの性 能差とケーブル(D−SUBコネクタケーブルとBNCコネクタケーブル)の差を如実に出 してしまう。慣熟期間初期では、CRT上にかなりのムラが目立ち、定期的にデガウスボタ ンを押し、定期的に消磁作業を行う必要がある。また、地磁気の向きにも敏感である(補 正ができる)。テストに使用した2台のF980では、慣熟期間にほぼ3週間を必要とした。 性能は、極めて良く、D-SUBコネクタのフェライトの効果もはっきり分かる。当然、 ドットクロックが高いときには、フェライト付きケーブルではボケる。BNCコネクタの ケーブルも、品質の差を出してしまうし、グラフィックスボード上のDACの性能も表現 する。種々のグラフィックスボードと共にテストした結果、フェライト無しのBNCコネ クタケーブル(Canopus社製)が最も高周波特性に優れていた。D-SUBコネクタケーブ ルでは、ドットクロックが高くなると(ピクセル数と垂直同期周波数が大きくなると)、画 質の劣化が激しい。BNCコネクタケーブルの方がより精度が高いが、グラフィックスボ ード側がD-SUBコネクタでは、大きな差は出ない。グラフィックスボードでは、BNCケ ーブルが使用できるSPECTRA5400 Premium Edition(Canopus社)を使用した。NDIVA 社製のグラフィックスCPUに内蔵されるDACは、わずかではあるがゴーストを生じる。 それでも、D-SUBコネクタケーブル(フェライト付き)を使用するゴーストを生じない グラフィックスボードより高い分解能を示した。また、BNCコネクタケーブルの混信は、 D-SUNコネクタケーブルよりはるかに少ない。
F980は、カソード形状の工夫から経年変化が少ない構造となっているので、再現性の 変化に悩まされることは少ないと思われる。図書館や博物館では、経年変化は大きな問題 となる。
上述のように、F980のように、CRTが自動でグラフィックスボードの修正も含めて行 ってしまうと、極めて簡単に高再現性画像を表示することが可能となる。色温度が異なる デジタルデータに関しては、色温度を設定しなおしてから、自動設定を起動すれば済んで しまう。大変手間と専門知識を必要としたCRTの調整から利用者を解放したと言う点で、 F980は革命的であり、デジタル画像資料の高再現性表示の障害が激減し、デジタル図書 館とデジタル博物館の実現が一層現実のものとなった。F980は、21インチ管であり大き くはなく、今までのように複数人が1台の巨大なCRTや3管式プロジェクタの前で共通 のデータを眺めなければならない状態から、個人用の環境を用意できると言う点でも優れ ている。自動調整ソフトウエアの起動方法を利用者に示しておけば、利用者がデジタル画 像データの条件に合わせて設定できる。しかし、現状では、F980以外に選択肢がないこ とが問題であるが、追随する機種が現われると期待する。
なお、関東では50Hz、関西では60Hzで蛍光灯が点滅し、色温度も高いため、CRTで データを観る環境を作る必要がある。周囲の色温度とCRTでの色温度が大きくずれてい ると、正しくない印象が残ってしまう。もはや入手が不可能なので、余談になってしまう が、DACがグラフィックスCPUと分離していた時代のグラフィックスボードには、今日 のグラフィックスボードより再現性の高いものがあった。
精度保証付きの高再現性デジタル画像データは、それ自身が一次資料として貴重な役割 を果たす。可読性を保証したデジタル画像データであれば、アウトラインを検出してフォ ントの作成やOCR技術を用いて電子テキストに変換可能である。図37に実際にアウト ラインを抽出した結果を示す。
図37では、中程度の精度のデータからアウトラインを抽出したため、良い結果は得られ ていないことに注意されたい。高精度デジタル画像であれば、OCR研究にも非常に役立つ し、未コード化文字群のコード化研究の基礎にも使用できる。
高いDPIで高精度でデジタル画像化してあれば、肉眼や顕微鏡では観察しきれない情報 を得ることも可能である。図38は、カビの緑色の部分を強調するように画像処理した結 果である。
図38では、周囲の部分および指紋の部分が特に緑に変色しており、好気性のカビの生育 状態がはっきり識別できる。結果として、本資料の通気状態まで分かってしまう。
このように、デジタル画像資料は、一次資料をそのまま閲覧する以上の情報を与えるこ とが可能なのである。
以上、基礎知識として考慮すべき部分を可能な限り解説し、精度を保証した高再現性デ ジタル画像データを簡便に安価な機材を用いて作成する過程および手法と、CRTを使用し て高精度で表示する方法を示した。本論文で解説した基礎知識があれば、簡単なチャート を用いて十分に精度を保つと同時に、精度を数字として示し得ることが証明されたと考え る。また、実際に必要な精度も示すことができた。本研究で、精度の証明のために高価な 精度の測定機材が不必要になったわけではないことを強調しておく。高価な精度測定機器 は、決して不用になったのではなく、より厳密なデータ作成のために人文系と理系の研究 者が共同プロジェクトを推進するために、図書館や博物館にとってより重要になったとい うことである。
本研究で示したように、精度保証付きの高再現性デジタル画像データの作成は、困難で はない。しかし、より簡便な方法へのアプローチは、始まったばかりである。デジタル機 器の進歩も極めて早いので、さらに簡便化可能であると予測されると同時に、より高精度 のデジタルデータ作成の研究も推進しなければならない。11で示したように、精度が向 上してより分解能が高くなると、思いもよらなかった利用法が生じてくるのである。現在 種々の一次資料のデジタル化が進んでいるが、精度に関しての情報公開を願う。そして、 日本からのデータの提供が増加することを希望する。
音声に関しても、DVDオーディオの普及が始まっており、96KHz24ビットサンプリン グデータの再生が一般的に可能となりつつある。192KHzサンプリングも不可能ではない。 音声に関しても、無視されがちな位相問題や遅延時間問題がある。音声も高再現性に向け て研究を進めている。
[2] 柴田みゆき, et al. 北京版チベット大蔵経の高デジタル画像化:写真撮影過程. 情報処理学会 「人文科学とコンピュータ研究会」報告書, Vol.98, No. 97, pp.73-80, 1998年10月.
[3] 今枝由郎,チベット大蔵経の編集と開版,岩波講座東洋思想第11巻チベット仏教,岩波書店, 1989年5月31日.
[4] 宮下晴輝, et al. チベット文字コードのデザインの考察, 財団法人国際情報化協力センター, 平成 10年度通商産業省工業技術院委託国際規格共同開発調査「多言語情報処理環境技術」成果報告書, pp. 125-136, 1999年3月.
[5] 柴田みゆき, et al. 北京版チベット大蔵経の高再現性デジタル画像化:高精度スキャニング過程, 情報処理学会「人文科学とコンピュータ研究会」報告書, Vol.99, No.59, pp.43-50, 1999年7月.