電子図書館における発想支援機能の評価方法

土橋 喜  堀 浩一  中須賀真一  山内平行  立花隆輝

東京大学先端科学技術研究センター
〒153 目黒区駒場4-6-1
東京大学先端科学技術研究センター(堀研究室)
tel:03-3481-4486
fax:03-3481-4585
dobashi@ai.rcast.u-tokyo.ac.jp

概要

発想支援システムに最も期待される効果は、思考作業の結果として、新たな視点や新 たな考えが浮かぶといった量的な増加と、アイディアがより精緻化されるなどの質の改 善と精緻化にある。発想支援システムの評価では、より正確な評価を行なうために、定 量的分析と定性的分析の両方から行なうことが必要である。そのため本論文では電子図 書館を活用して開発した発想支援システムを、定量的・定性的に評価するための新たな 枠組みを提案する。

本論文で提案する方法は、利用者の思考過程におけるシステムの効果を明らかにする ため、比較実験を基本としている。そのため実験は、開発したシステムと既存の代表的 なシステムとの比較、専門家と非専門家の比較を中心に行なった。提案する実験方法で は、発想の量的な増加を専門用語と文字数の増減として把握する。さらに開発したシス テムを利用して、被験者がまとめた文章を定性的に分析することによって、システムの 効果による被験者の概念構造の変化を可視化することができる。これらの方法によって、 電子図書館と一体となった発想支援システムの効果を、定量的かつ定性的に把握するこ とが可能になった。

キーワード

発想支援、電子図書館、評価方法、概念ネットワーク、可視化、問題解決

A New Method of Evaluation for the Effect of the Creativity Support System using Digital Library

Konomu Dobashi, Koichi Hori, Shinichi Nakasuka, Hiroyuki Yamauchi, Ryuki Tachibana
Research Center for Advanced Science and Technology (Hori Lab)
The University of Tokyo
4-6-1 Komaba, Meguro-ku, Tokyo 153
tel:03-3481-4486
fax:03-3481-4585
dobashi@ai.rcast.u-tokyo.ac.jp

Abstract

In this paper, we propose a new method of evaluation for the effect of the creativity support system using digital library. The important point to evaluate the effect of the creativity support system is quantitative analysis and qualitative analysis. In our proposed method, we grasped the quantity of creativity by increase and decrease of terms in the hypothesis which written by subject using our system. Moreover our system can use for qualitative analysis of the results.We can visualize the change of conceptual structure by eliciting terms from the hypothesis which written by subject through the two experiments. We also show the results of the experiments compared with our system and NCSA Mosaic by subjects.

Keywords

creativity, digital library, evaluation method, conceptual network, visualizaiton, problem solving,

1.はじめに

本論文は、電子図書館における発想支援機能の効果を評価するための、新たな実験方 法を提案するものである。

発想支援システムに最も期待される効果は、思考作業の結果として、新たな視点や新 たな考えが浮かぶといった量的な増加と、アイディアがより精緻化されるなどの質の改 善と精緻化にある。発想支援システムの評価では、より正確な評価を行なうために、定 量的分析と定性的分析の両方から行なうことが必要である。そのため本論文では、我々 が開発した発想支援システムを利用して、システムが利用者に与える発想支援的な効果 を、定量的・定性的に評価するための新たな枠組みを提案する。我々が開発したシステ ムは、電子図書館と発想支援システムを統合化したもので、本論文で提案する実験と評 価方法は、電子図書館の一つの評価方法としても活用が可能であると考える。

本論文で提案する方法は、利用者の思考過程におけるシステムの効果を明らかにする ため、比較実験を基本としている。そのため実験は、開発したシステムと既存の代表的 なシステムとの比較、専門家と非専門家の比較を中心に行なった。開発した実験方法で は、発想の量的な増加を専門用語と文字数の増減で把握している。さらに開発したシス テムを利用して、被験者がまとめた文章を定性的に分析することによって、システムの 効果による被験者の概念構造の変化を可視化することができる。これらの方法によって、 電子図書館と一体となった発想支援システムの効果を、定量的かつ定性的に把握するこ とが可能になった。

以下、まず第2章では、これまでの評価方法の概略について述べ、第3章では、開発 したシステムの概要を紹介し、第4章では、電子図書館と統合した発想支援システムの ひとつの実験方法を提案する。第5章では、実験結果の定量的分析とその考察を行なう。 第6章では、被験者の概念構造の変化を把握するための定性的分析方法を提案し、分析 結果の考察を行なう。第7章はむすびである。

2.これまでの評価方法

これまでにもさまざまな発想支援システムの研究開発が行なわれてきた[國藤 93][折 原 93][杉山 93]。発想支援システムには、人間の思考過程を支援したいという願い が込められているが、その効果を明確に把握することは以外に難しく、一つの研究テー マとしてとらえることが必要である。発想支援システムを利用した結果として、発想あ るいはアイディアの量的な増加や、精緻化されるなどの質の向上が達成されることが期 待されるが、これらの性質自体があまり明確になっているとは言えず、測定方法も試行 錯誤の段階であり、さまざまな方法が試みられている。

例えば、これまでに開発されたシステムでは、各機能の使用感や満足度をアンケート によって回答を求めるなど、ユーザの主観をベースにした評価が一般的に行なわれてい る[三末 94]。しかしアンケートだけでは主観的な評価にとどまり、開発したシステ ムがどう役立つかを客観的に評価するためには充分とは言えない。KJ法を取り入れた システムでは、D-ABDUCTOR[三末 95][新田 95]、郡元[宗森 94]、KJエデ ィタ[小山 92]などがあり、これらのシステムでは、システムを利用した発想活動に おける作業の時間的な観点からの評価が中心に行なわれている。

D-ABDUCTORでは、システムの使える機能を制限した5つモードで行なった作業時間 の比較を行ない、手作業に比較して効果があることを示している[三末 95]。さらに 実際の思考作業を行ない、その際の操作や意図を詳細に記録し、その分析による思考過 程の時間的な進行による実体把握が試みられている[新田 95]。郡元では、複数台で 行なう分散協調型KJ法を、学生実験に適用した結果と、紙面上で行なったKJ法の結 果とを比較し、意見の数、文字数、かかった時間などをパラメータとして分析している [宗森 94]。KJエディタでは、KJ法で普通に行なわれるカードを広げる作業、あ るいはカードに文字を書き込むというようなKJ法の基本的な作業において、システム を使う場合と使わない場合の作業時間の比較を行なっている[小山 92]。

それぞれのシステムによって実験方法は異なるが、どのシステムも被験者がシステム を使う作業と使わないで行なう作業の比較を行なう方法を基本としている。さらに同じ テーマを開発したシステムを使う方法と使わない方法で行なうと、慣れによって発想法 として正しい実験が行なわれない可能性が大きいため、被験者に異なるテーマを与えて いる場合もある[宗森 94]。また実験条件をできるだけ同一にするため、カードを自 由に広げる作業やカードを規則正しく広げる作業のように、作業の単位を小さくするな どの工夫が行なわれている[小山 92]。

これらの方法は、同じ作業を繰り返すことで、被験者が特定の思考作業に習熟する学 習効果を排除しようとする工夫と言える。しかし問題点として、テーマを変えると作業 ごとの難易度が異なることが指摘され、作業単位を小さくする方法なども、作業が中断 されるため、問題解決における一連の作業として評価することはできない。さらにこれ らの実験は、作業効率に注目することを主な目的としており、発想支援システムが本来 目的とすべき、アイディアの量的増加や質的な向上の評価まで行なうことはできない、 というところに大きな問題を残している。

またこれまでの情報検索システムでは、長い間、検索効率や再現率といった評価尺度 が一般的に用いられてきたが、これらの指標もシステム本来がめざすべき思考支援のた めの指標とは言えないと考える。次章では実験におけるこのような問題点を改善する評 価方法を提案するため、開発したシステムの目的と概要についてまとめる。

3.システムの概要

3.1.問題構造の可視化

我々が開発したシステムは、問題構造の可視化による問題解決支援が目的である[土 橋 95]。問題を正確な意味で正しく認識するためには、問題の構造を理解することが 必要であるが、最初に必要なことは何らかのきっかけで問題の存在に気づくことである。 このような問題解決と問題発見を支援するためには、思考過程における「思いつき」や 「着想」、例えば何度も文献を読んだ後で「わかった」と感じるような場合や、あるい は問題解決に結びつく新たな用語に「気づく」ようなときの支援が、有力な方法である と考える。これらの支援を実現するため、文献から専門用語を抽出し、2次元空間にマ ップして、問題構造を可視化するシステムを開発した。提案する方法の基本は、全く何 もないところから新しいアイディアを創りだすのではなく、素材の新たな組み合わせや、 異なる視点からの隠れた関係の発見支援にある。

3.2.概念ネットワークの自動生成

問題構造の可視化を実現するために、概念ネットワークの自動生成を行なっている。 概念ネットワークの自動生成は、データベースから隠された関連性を見いだす知識発見 の研究と深く関係がある[Fayyad 96,Piatetsky-Shapiro 91]。システムが目指している のは、問題を完全に説明する構造の可視化ではなく、被験者の新たな発想を刺激するた めの、いわば断片的な知識から仮説の構造を自動生成することである。ここでは概念ネ ットワークを生成するための、知識発見における結合のルールを次のように定義した[福 田 96]。一つ一つのセンテンスを見ると、その中には文脈を構成する上で、重要な用語 が含まれている。例えば科学技術関係であるなら、名詞などから構成される用語が重要 な用語に該当する。このような用語が同一のセンテンス上に複数出現しているなら、そ れらの用語間に、著者の考えに基づいた、何らかの概念関係が成り立っていると考える ことができる。これらの用語をセンテンスごとに抽出し、2項関係を構成する組み合わ せを生成する。これを文献ごとに全てのセンテンスに渡って行ない、用語の組み合わせ による集合をつくると、文献ごとの著者の概念のつながりを抽出することができる。例 えばある一つのセンテンスから、A、B、C の3つの専門用語が抽出されたとすると、A −B,A−C,B−C という用語の組み合わせが生成される。そして出現した同じ文字列を 連結してネットワークを生成する。大規模で複雑なネットワークもこのような要素の連 結を繰り返して生成している。

用語の抽出は、辞典の索引から作成した専門用語辞書(現在9,980語)[荒木 85]を使 う方法と、出現頻度の高い用語を自動的に抽出する方法を併用している。この方法によ って文献に表現されている重要な部分を、出現頻度だけに頼らないで取り出す可能性を 高めることができる。専門用語を抽出する場合、センテンスによっては組み合わせを生 成するために必要なものが含まれていないこともある。専門用語が一つのセンテンスか ら1つだけしか抽出されない場合は、本システムでは、そのまま2次元空間に単独でマ ップすることにしている。このような用語は、利用者が必要に応じて関連のありそうな 用語との間にリンクを形成し、概念ネットワークに組み入れることができる。生成され た概念ネットワークは、概念間のつながりを自動的に線分で連結し、利用者の自由な発 想を促すため、2次元空間にランダムにマップされる。図1は概念ネットワークの生成 過程を概念図で示したものである。

図1 概念ネットワークの生成過程:数値は出現頻度を表わす。

図3および図4は、問題構造を可視化するために、システムが生成した概念ネットワ ークの例である。このマップを操作することによって、問題解決と問題発見において問 題を正しく認識し、問題を構成しているものは何か、どのような関連性があるか、など を考えさせることをめざした[佐藤 84]。

また文献の中で頻繁に言及される部分は、文献の主要なテーマを表わす概念や概念間 の関係である。これらのことから専門用語の組み合わせを生成すると、頻繁に利用され るものとそうでないのもとの間に出現頻度に差が生じることになる。これらの出現頻度 の差を利用して、問題構造を表現する可能性の高い概念構造と、可能性が少ないものと を出現頻度で描き分けることができる。地球環境問題の文献を対象に、このようにして 生成した概念ネットワークを分析してみると、概ね次のようなことが言える。

出現頻度の高い用語の組み合わせは、著者によって頻繁に利用された専門的な用語の 組み合わせであり、文献の内容から見れば相対的に重要な部分である。この部分は領域 の専門家にとってみれば、常識的な用語で問題構造を説明するようなつながりを構成し ており、新たに気づく関連性は少ない。しかし文献が表現している中心となる主題を視 覚的に把握することができるので、文献の要約を生成することと似たような効果が期待 できる。

逆に出現頻度の低い用語の組み合わせは、著者が文献中で言及した回数が少なく、シ ステムによって新たに組み合わせが生成された部分が多く、文献の内容から見れば相対 的に重要性が低いと言える。問題の構造を説明する上では、可能性の少ないつながりが 多く含まれている。しかし、新たな着想のきっかけや視点の発見につながるような部分 は、この頻度の低い部分に含まれている可能性が高く、システムが新たな概念構造を提 案している部分である。

また複数の文献から抽出された広い意味での因果関係も、生成された概念ネットワー クの中に含まれていることがある[Swanson 87]。

3.3.文献の活用と分析のためのシステム統合

本システムは研究者の利用に耐えられるように開発することが目標である。研究者は 日頃から関心のある文献を収集し、内容について考察を加え、それらを利用して新たな 論文をまとめる。このような研究活動のサイクルの中で、研究者が論文で伝えたいこと は、論文の中で表現された概念や概念間の関係であると言える。研究者は論文の内容に ついて考察を加える時、このような関係を考えながら行なっているはずである。論文を 読みながら、概念や概念間の関係を考えるとき、今まではメモなどを用いることがあっ ても、計算機による支援はほとんど行なわれていなかったと言ってよい。先に述べた本 システムにおける概念ネットワークの自動生成と、それによる問題構造の可視化支援は、 研究活動における研究者のルーチンワークに新たな支援機能を提供するものである。こ こで述べた機能は、研究者のルーチンワークにおけるプラスアルファの部分であるが、 システムの基本には、ルーチンワークを適確に支援できる機能も必要である。ルーチン ワークの支援機能とプラスアルファの支援機能が相乗効果を発揮できるようなシステム 統合を実現する必要がある。この点について、我々はインターネットを利用した電子図 書館(NCSA Mosaic)と統合化して、システム開発を行なった[Adam 95][長尾 94] [野村 96]。現在のインターネット上の情報は、必ずしも有用なものばかりではなく、 ユーザ自身の目で確認する必要があろう。専門の研究者が自分自身で収集したものであ るなら、その蓄積と再利用は有効な支援のもとになりうると期待できる。本システムは 地球環境問題の研究者が、インターネットに流通する文献を読みながら、研究テーマの 設定や政策の策定などに、思考をめぐらすときの状況を想定している[村上 94]。

またこれまでの発想支援システムの開発では、発散的思考と収束的思考の支援に分け て考えられる傾向があったが[國藤 93][折原 93][杉山 93]、本システムの開発で は両方の支援を目標にした。発散的思考の支援は、考え方の幅を広げたり複数の解を得 ることの支援である。収束的思考の支援は、問題を限定して考えたり、事実やアイディ アをまとめることの支援である。また製品開発や科学的研究などさまざまな創造的活動 における新たな概念形成過程では、概念の中身に関わる内容刺激と発想のプロセスに関 わる刺激が共に必要になる[堀 94]。ユーザが必要とする文献を揃えて知識ベースを充 実させたり、ユーザが思い落としていたことに新たに気づかせるなどの支援は、内容刺 激になる。これに対して概念ネットワークを自由に操作し、ユーザの考えに基づいた概 念構造を組み立てるなどの支援は、プロセス刺激と言える。本システムの開発では、概 念ネットワークの自動生成と問題構造の可視化を効果的に機能させるため、これらの点 を考慮して次のようなシステムの諸機能を開発し、図2のようにNCSA Mosaic、Message Browser、Network Editorの中に組み込み、一体となった発想支援システムとして統合した [堀 97]。

図2 システムの全体構成

(1) 知識ベース構築支援機能

発想の幅を広げたりする内容刺激を与えるためには、大規模な知識ベースを利用する ことが効果的である。知識ベースが大きければ、それだけ生成される知識の組み合わせ が多くなり、発散的な発想支援効果が期待できる。本システムはインターネットなどを 利用して、ユーザが自分で収集した文献が分析の対象である。そのためインターネット から収集した文献は、自動的に知識ベースに追加される。

(2) 知識ベース検索支援機能

知識ベースを自由に検索するため、タイトル、著者、図表および文章中に出現するキ ーワードへのインデックスを生成する。文献から抽出した専門用語によるキーワードイ ンデックスは、用語が出現する文献および文献中の該当するセンテンスがブラウズでき るように、リンクを自動生成している。キーワードインデックスは、ユーザのキーワー ドからその場で生成することが可能であり、検索機能を同時に実現したものになってい る。

(3) 類似文献提案機能

類似文献の提案機能は、内容的に関連のある問題を扱った文献の収集を、自動的に支 援することを目的にした機能である。類似の文献を多く集めれば、問題構造を網羅的に 把握することができるため、問題解決の概念形成により多くの情報を利用することがで きる。ユーザが文献を一つ選択すると、実験システムは自動的に内容の類似した文献を 提案する。文献間の類似度は、共出現したそれぞれの専門用語の出現回数の合計で求め ている。これによってユーザは、類似した文献が提案されるウインドウから文献を選択 することによって、内容的に関連した文献を容易に収集することができる。

(4) 複数の視点による概念ネットワーク生成機能

本システムでは文献の分析の視点をかえることで、異なる構造が生成される。複数の 視点から問題を捉えることにより、不十分な情報を補い、思い落としていた関連性を発 見することが期待できる。また断片的な情報を統合することによって、知識の体系化に 必要な概念構造をユーザに提供することが目的でもある。問題と文献との関係から、概 念ネットワークは次のような複数の視点から生成することができる。

[a] 単独の文献から生成する。

[b] 複数の文献を自由に組み合わせて生成する。

[c] ユーザのキーワードを中心に生成する。

(5) KJ法による発想支援機能[川喜田 86]

概念ネットワークは単にマップされるだけでなく、ネットワークエディタ上でKJ法 による試行錯誤的な発想支援活動を行うことができる。ノードやリンクの追加と削除、 およびノードの移動とグルーピングなどが自由に行える。また初期配置の段階で、文章 上で関係のありそうなものは、あらかじめ線分で連結されており、自動初期配置機能を 取り入れている。同時に関係ないものの間にはリンクを生成しないようにしており、自 動的なグルーピング機能も備えている。また利用頻度の高い用語を含む比較的長い文献 から概念ネットワークを生成すると、非常に多くの組み合わせを生成する場合がある。 そのため生成した概念ネットワークを出現頻度、特定の用語などから自由に絞り込んで、 ネットワークを見やすくする機能を備えている。

(6) 概念関係の確認機能

本システムが生成する概念ネットワークは、知識ベースから生成された仮説の構造と 見なすことができる。仮説は知識として利用するためには、検証が必要である。そのた め生成された概念間の関係が妥当がどうか、確認する機能が必要である。ネットワーク エディタにマップされたノード上の用語は、文献のキーワードインデックスに自動的に リンクされている。このノード上の用語が出現する文献のタイトルや文章を一覧表示す る機能が、NCSA Mosaic と連結して用意されており、用語がどのような文脈で使われて いるかを即座に確認することができる。

3.4.概念ネットワークの自動生成と問題構造の可視化例

システムはSun SparcStationのX11R5 (X Window 11 Release 5)上で稼働している。シス テムの知識ベースは、地球環境問題に関する文献を収集して構築した。文献は学術論文集 [Brown 93][Brown 94]やインターネットを通じて収集したもので、すべてHTML を用いて、システムによって自動的にタグ付けされた英語の論文である。実験では133タ イトル(3.4メガバイト)の文献を収集して知識ベース化しており、この中には241の図表 (10.9メガバイト)を含んでいる。以下は概念ネットワークの自動生成による問題構造の 可視化例である。

(1)複数文献からの生成

図3 複数文献によるマップ例

ユーザが複数の文献を組み合わせた場合、複数の著者のそれぞれの問題に対する視点か らの見解が、分析結果として一つにマージされて生成される。これはより多面的に問題 の関連構造を可視化するための機能である。実際の画面では、複数の文献の場合は文献 ごとにリンクの色分けを行い、さらに共通部分を分離できるように色分けを行っている。 これによって文献間における用語の関連が、リンクの色の違いをとおして、明確に認識 できる。図3は2つの文献を同時にマップした例であり、それぞれの文献ごとに色分け されており、全体的に出現頻度を2以上に限定している。リンクの色が黒でco_appearと 表示されている組み合わせは、2つ以上の文献に共通に出現した組み合わせである。黒 色以外のリンクの上には、出現頻度のほかに、文献の識別番号を表示しており、タイト ルを知る手がかりにしている。

図3に生成された概念ネットワークのマップは、論文集[Brown 93][Brown 94] から、「Air Pollution Dameging Forests(1993, pp.108-109)」と「Sulfur and Nitrogen Emission Resume Rise(1994, pp.94-95)」という異なる著者の2つの文献を同時にマップ し、手作業で見やすくしたものである。前者の文献は単語数が1,789、抽出された用語は 83、用語のこの文献中におけるのべ出現回数は168、生成された用語の組み合わせは267 である。後者の文献は単語数1,122、抽出された用語は37、用語の文献中におけるのべ出 現回数は86、生成された用語の組み合わせは126である。2つの文献を合わせた総単語数 は2,911であり、その中で用語が合計のべ254回出現し、マップを生成するための用語の組 み合わせは合計393となっている。マップの右側は前者の文献、中央部分は2つの文献に 共出現する部分、左側は後者の文献の内容がそれぞれマップされているが、見やすいマ ップを作成するため一部のデータは表示していない。

これら2つの文献は大気汚染が地球環境にどのような影響を与えるかを中心に論じたも のである。マップのほぼ中央には、sulfurやnitrogen oxideのように2つの文献に共通に出 現する重要な用語が配置されていることが分かる。さらに前者の文献では、sulfurを多く 含んだcoalの最大の利用国であるChinaでは、air pollutionによって引き起こされる森林破壊 が起きていることに触れ、後者の文献ではChinaにおけるsulfurの大気中への放出が年々増 大しているが、米国は逆に近年減少していることが述べられている。生成された概念ネ ットワークには、coal - China - sulfur - United States - air pollutionのようにリンクが生成され、 文献で触れられている関連性がマップされていることが分かる。このように複数の文献 から概念ネットワークを生成すると、互いの文献で独立に述べられている問題の関連性 を統合し、まとまった一つの問題構造として生成することができる[Swanson 87]。

(2)ユーザのキーワードを中心に生成

図4.キーワードによるマップ例

文献を読んでいると、意味を調べたい用語が出現することがある。このシステムでは意 味を調べることはできないが、調べたい用語がどのような用語と関連性があるかをシス テムを利用して調べることができる。ユーザから関連構造を調べたい用語をキーワード として受け取り、そのキーワードを中心とした概念ネットワークを生成する。この機能 ではユーザの要望を取り入れるために、事前の処理は行なわず、知識ベースのセンテン スを全て検索し、その場で概念ネットワークを生成する。

図4はacid rainという複合語で知識ベース全体を検索して生成した概念ネットワークで ある。この場合には知識ベース全体から13のセンテンスが検索され、その中から161の用 語の組み合わせが生成された。この場合の生成に必要な時間は約5分であった。マップ は全体を表示した後、出現頻度を2以上に限定し、acid rainに直接つながっている部分だ け再度マップさせたものである。収集した文献を調べて見ると、acid rainの主な原因は化 石燃料の燃焼によるsulfurなどの大気中への放出にあると述べられている。またacid rainは 森林破壊をもたらし、湖沼の酸性化などによって生態系に影響を与え、また建築物など にも被害を与えることも述べられている。生成された概念ネットワークを確認すると、 smog, carbon, sulfur, lead, air pollution, coal, burn, global warmなど、acid rainの原因と強く関 連した用語がマップされていることに気がつく。また、side effect, bird, habitat, health, productivityなどacid rainが与える影響と関係の深い用語も抽出されており、広い意味での 因果関係が表現されている。さらにreduceという用語がacid rainとcarbonの間に生成され、 acid rainの対策としてcarbonを削減することが示唆されているが、これらの関係は文献の 中でも指摘されていることである。

4.実験方法

システムが与えた効果を手掛かりに、何らかの行動を起こすきっかけを被験者に与え ることができれば、より明確にシステムの効果があったということが断言できる。実験 内容は心理学実験で行なわれている方法を参考に[原岡 90]、システムが与えた効果 を明確に把握することをめざし、新たに考案した。開発したシステムは既存の電子図書 館システムに、新たな機能を追加するものであるため、これまでの発想支援システムな どの評価実験では、手作業と比較することが多かったが、本実験では手作業との比較は 不適切と考え、他の一般的なシステムと比較する方法を取った。そのため本システムを 使わない状態として、NCSA Mosaicのみを使って行なった作業結果と、本システムを使っ て行った作業結果の比較を行なっている。またどのようなグループに効果があるかを調 べるため、知識ベースの内容を考慮し、専門家と非専門家の2つの被験者グループに与 える効果を、客観的に把握するように独自の工夫を行なった。

(1)システム間の比較

実験1:NCSA Mosaicのみを使った作業

実験2:開発した実験システムを使って行う作業

(2)被験者間の比較

被験者グループ1:地球環境関係の大学院生(専門家)

被験者グループ2:情報工学関係の大学院生(非専門家)

本実験では、被験者が課題に回答することにより、具体的な問題解決における仮説を 文章で記述してもらうことにした。また被験者の文献やリンクの検索履歴および作成し た概念構造のマップを保存することによって、システムを利用した仮説の文章の作成過 程を記録しておくことにした。このような方法を採用することによって、開発したシス テムが、被験者の思考や仮説の生成に、どのような影響を与えているかを明確に把握す ることを試みている。

実験では「地球温暖化の原因とその対策について」という与えられた課題に対して、 自分の考えを仮説としてまとめることを被験者に依頼し、問題解決を行なう実験を行な った。最初に被験者はMosaicのみを使って、課題に対する仮説の作成作業を行い、回答を まとめる。その際に被験者に対して、実験は被験者固有の知的側面を調べるのではなく、 システムの性能評価が目的であり、自分で思ったことや意見を自由に、できるだけ書い てもらうように要請した。

次に実験1の回答が終了した被験者に、開発した実験システムの操作説明を行い、被 験者の仮説がどのように変化したかを調べるため、実験1と同じ課題を実験2で再度行 ってもらうことにした。その際に、実験2では開発した本システムをできるだけ有効に 活用し、次のような点に留意してこの実験2での仮説をまとめるように要請した。(1)さ らに内容を精緻化し、発展させる。(2)できるだけ数多くの関連した仮説を作成するよう に試みる。(3)実験1の仮説に不要な部分や不適切な部分があれば、削除したり、修正し たりする。(4)実験1とは全く別な考えが浮かんだ場合は、新たな仮説としてまとめ、追 加する。(5)必ずマップ機能を利用して概念ネットワークを操作してみる。

このような手順で与えられた課題に対して問題解決を試み、それぞれの実験に用意さ れたシステムと知識ベースを使って得られた新たなアイディアを中心に仮説をまとめる 作業を行ってもらった。この作業によって、実験1のMosaicだけでは気がつかなかった新 たな視点や関連性が、実験2で見いだせるかどうかを調べる。そして実験1と実験2の 比較を行うことによって、被験者の回答における仮説の変化を分析し、実験システムの 性能評価に利用する。これらの2つの実験を比較するため、インターネットに流通する 学術的な論文の形態を参考に、実験1においてMosaicのみを使ったときの、Mosaicと知識 ベースの条件を次のように設定した。

(1) 知識ベース内の文献の数と内容は、実験システムと同じにする。

(2) 文献をブラウズするためのハイパーリンクは、現在インターネット上で見られる 標準的なものに設定する。そのためTitle Index, Author Index, Figure and Table Indexは文献を 検索するために使えるように生成している。

(3) Mosaicが持つ機能はそのまま利用する。

5.実験結果の定量的分析

被験者は、地球環境関係を専攻する大学院生7人と情報工学を専攻する大学院生13人 の計20人である。

実験2で仮説の追加あるいは修正などを行った場合は、数量的な変化として現れる。 そのため被験者がまとめた仮説の分析から、数量的に仮説の変化を測定した。表1に地 球環境関係の被験者、表2に情報工学関係の被験者の、それぞれの実験1と実験2にお ける仮説の量的変化の分析結果を示す。被験者が作成した仮説の量を、専門用語のべ出 現回数(表では用語数)、文章の文字数全体の変化という観点から考えると、次のよう なことが言える。

(1) 数量的に仮説の変化があった被験者は、実験1で作成した仮説に対して、追加や 削除などの修正を行なっている。

(2) 仮説の量が数量的に増加している場合と減少している場合の両方に、システムの 効果があると言えるが、増加している場合の方が文章を書く上での支援があったことに なり、効果は大きい。

(3) 仮説の量が変化していない場合は、全く修正が行なわれなかったもので、システ ムの効果が最も少ないケースである。

表1 実験1と実験2の仮説の量的変化(地球環境関係の被験者7人)

表2 実験1と実験2の仮説の量的変化(情報工学関係の被験者13人)

表3 実験結果のt検定

実験結果における差の有意性を、t検定によって行なった結果を表3に示す。本実験 では、被験者の専門用語の増減が最も重要と考えられるので、表には用語数の検定結果 を示している。

地球環境関係の被験者の結果からは、仮説棄却の危険率Pが0.10 < P < 0.20となり、危 険率が10%を越えるため、統計学的な検定の趣旨から有意差は認められない。このグル ープでも増加傾向を示す被験者の方が多いが、これには例外的に増加したものも含まれ ていると解釈される。

情報工学関係の被験者の結果から、仮説棄却の危険率Pは0.05 < P < 0.10となり、有意 差が例外的に認められるぎりぎりの危険率を示している。検定の趣旨に従えば情報工学 関係の被験者には、用語数に強い増加傾向が現われていると言える。

次にどちらの被験者グループにより効果があったかを調べるため、実験2における用 語数の平均の検定を行なった。これらの値は互いに独立であるから、2分散の検定を行 なうと非等分散を示すため、コクラン・コックス法を適用して、2つのグループの平均 のt検定を行なった。その結果、2つのグループには有意差は認められないことが明ら かになった。これは実験1のMosaicだけを利用した結果でも、同様の検定結果となった。

t検定は実験結果の全体的な有意差の判断に利用されるが、被験者個別の微妙な変化 を把握することは困難である。そこで後で触れる定性的分析にも利用するため、単純に 被験者ごとの実験1と実験2の用語数と文字数の増減率(実験1と実験2の増加分に対 する実験1の割合)を求めた。これらはそれぞれ表1の増減率の欄に示す値のよう になるが、増減率の数値的な増加傾向が現われているものに注目すれば、用語数では被 験者の61%、文字数では74%が増加傾向を示している。用語数と文字数から見ると、仮 説の文章が増加した被験者は全体の80%(20人中16人)に達する。

以上の定性的分析から、開発したシステムを利用すると、仮説の文章をまとめる上で、 両グループの用語数と文字数に増加傾向が見られる。このことは、文章をまとめる上で 効果があるという被験者の意見が多数寄せられたことを裏付けている。検定と増減率か らは非専門家である情報工学関係の被験者の方が効果が大きく、専門家には効果が少な いことが明らかになった。またMosaicだけを利用した場合は、地球環境関係の被験者の文 章の量が情報工学関係の被験者より多く、専門家の能力の一端が現われている。開発し たシステムを利用すると、今度は逆に情報工学関係の被験者の用語数と文字数が多くな り、明らかに効果があると言える。

この結果の背景には、専門家と非専門家の知識の量とその活用の仕方に差があるもの と考えられる。専門家は与えられた課題に対して、ある程度事前に自分なりの考えを持 っており、新たなデータでも発見されないことには、専門家の考えに大きな変化は起き にくいことを示している。しかし専門家にも、いくつかの考え落としていた用語に思い 付かせる程度の効果は認められる。逆に異分野の非専門家の研究者に取ってみれば、知 識の少ない分野であるから、開発したシステムを利用すると、新たな専門用語を簡単に 獲得でき、それを仮説の文章の中に容易に取り込むことができるこが示された。地球環 境問題では、多くの分野の研究協力が必要とされており、異分野の研究者の支援に効果 が期待される。

また仮説の量が減少した被験者は、全体の15%(20人中3人)である。被験者がシス テムを利用して、一度作成した仮説の中に、何等かの矛盾のようなものが存在すること に気がついて、文章の削除などの修正をしているならば、これは利用した効果があった と言える。例えば、仮説が減少したと答えた表2の情報工学関係の被験者Sの場合は、 実験2でシステムを使うことによって、仮説の根拠が薄いと気がついた部分を削除した ため、仮説が減少する結果になった。

仮説の量が変化しなかった表1の被験者Fは地球環境関係の中でも、地球環境政治に関 する研究をしている博士過程の院生であるが、実験2のシステムを使う前に、関連する 文献に大体目を通してしまったため、新しい仮説形成には至らなかった。これは課題が 同じなため、被験者が最初にまとめた仮説に対して、修正しようとする気持を起こさせ るような情報がシステムから提示されなかったこと、および知識ベースの内容と大きさ に限界があることを示している。

6.概念構造の変化の定性的分析

心理学実験では、繰り返し同じ課題を行なうことに対して、学習効果があることが早 くから指摘されており、本実験で求めた増減率にも学習効果が含まれている。これは、 似たような作業を繰り返すことで、被験者が特定の思考作業に以前より習熟してくる結 果として自然に現われる効果である。先に行なった定量的な分析の場合は、このような 学習効果を取り除いて考えることは困難であり、この点は同一課題による実験結果を分 析する場合に注意が必要になる。学習効果を排除した評価を行なうためには、被験者を 実験の内容に合わせて、2つのグループにあらかじめ分けて実験を行なうことになる。 しかしグループを2つに分けてしまうと、2つの実験を通してシステムがどのように被 験者の概念構造に影響を与えたかを分析することはできない。このようなことから本実 験では、システムの効果によって学習効果が高まることを含めた支援を考えている。そ のなかでシステムが被験者の行動に直接的に影響を与えた点を探しだし、それを純粋な システムの効果として把握する方法を新たに考案した。ここで行なう定性的分析は、被 験者の行動に直接的に影響を与えたシステムの効果だけを対象に、検定では把握できな い微妙な効果をも分析しようとするものであり、今回のシステム開発によって可能にな った方法である。

ここでは被験者の代表的な例として、地球環境関係の被験者のひとりを取り上げて分 析結果を示すが、他の被験者も同様に分析することができる。表1の被験者Eは、都市工 学を専攻している博士課程の院生で、環境リスク論を研究している。実験1における仮 説の本文自体の変化は、文章では1文が増加、重要な用語では13個の増加、全体の文字 数では118文字の増加であったが、このうち4つの文章に追加および修正が行われた。

6.1.概念マップと仮説の対応関係

図5 被験者がシステムを利用して作成した概念マップの例:楕円で囲まれた4つの 部分は、被験者が文章上で仮説を追加、修正した部分と関係が深い部分を示している。

表4 被験者の概念構造の変化の対応関係

実験1と実験2で被験者が作成した仮説を比較し、文章に変化がないかどうかを調べ る。ほとんどの被験者は仮説をまとめる場合に、被験者なりに問題構造を解釈した概念 マップを作成している。その仮説の文章の変化と概念マップに関連性がないかどうかを 調べる。そのためシステムを使って概念マップ上の用語と知識ベースの原文との対応を 調べ、さらに原文と仮説の文章が変化した部分との間に似たような表現が使われていな いかどうかを調べる。被験者がシステムを利用して作成したマップの中に、仮説の追加 や修正と関係の深い部分が示されていれば、それはシステムの効果があったという確証 を得ることにつながる。

被験者Eは、複数の文献をマップし、専門用語のつながりを見ていて、仮説の修正や追 加思い付いくことができた。被験者Eが作成したマップの中には、仮説の修正や追加を行 なうために新たに気づいた部分が示されている。図5は被験者Eが実験2で作成した12枚 のマップのうち、仮説の修正された部分と最も関連の深いと思われるものである。被験 者はこのマップを作成するに時に、つながりが低いものを落としたり、不要なリンクを 落としたりして、わかりやすいマッピングになるように心がけて行なった。表4は被験 者がまとめた仮説と概念マップおよび知識ベースの間の対応関係を、システムを利用し て調べたものである。これらの間には、専門用語と文脈から考えて、共通の部分が含ま れていることを見いだすことができる。このようにシステムを利用して分析すると、被 験者がネットワークエディタ上のマップを操作しているうちに、最初にまとめた仮説に 追加すべき点を見いだしたことを明らかにすることができる。

6.2.概念構造の可視化による変化の比較

図6 2つの実験における被験者Eの仮説と概念構造の変化

被験者が実験1と実験2で作成した2つの仮説から、専門用語を中心に重要な用語を 取り出し、今回開発した方法で仮説から概念ネットワークをマップするためのデータを 生成する。2つの仮説をマップすることで可視化し、マップ上で出現頻度による絞り込 みなどの操作を通して、被験者の概念構造が変化している部分があるかどうかを調べる。 この方法によると、2つの仮説における概念構造の変化を確認することができる。図6 に2つの実験における被験者Eの仮説とそれに対応する概念構造の変化を示す。

2つの実験をとおして被験者Eが作成した2つの仮説から、図6に示すように文章上の 変化では、「火山活動」が新たに追加された用語であるが、マップ上でも変更されてい ることがわかる。また「気候変動−変化−植生」の部分にあたる文章上の表現も修正さ れており、この部分は実験2でシステムを利用することによって、より重要性が増して いる部分ということが言える。

このように問題解決における概念構造の変化が行なわれたことに対して、被験者はキ ーワードや描写が追加され、より説得力のある文章になったと思われるが、仮説自体は 変化しなかったと感じた。また実験2での仮説の修正・追加に対して、文章を書く上で 最も有効であったと思われたのは、複数文献のマップであるという意見が得られた。こ の被験者の場合は与えれた課題に対して、実験を行なう前にすでに自分の仮説が固まっ ており、そのことが新たな仮説の発想を妨げた。そのため文章の追加や修正が行なわれ ても、新たな仮説の発想を得たと考えることはできなかった。しかし新たな専門用語を 思い付くことができた点で、発想支援的な効果が認められる。

7.むすび

問題解決において解決策をまとめようとするときは、全く何もないところから新しい アイディアを創りだすのではなく、むしろ問題を考えるために知識を再利用し、素材の 新しい組み合わせや、新しい視点の発見を通して、適切な解決案をまとめることも有力 な方法であると思われる。また全く構造を持たないデータを多量に提示されると、認知 的な限界から利用者はそれを整理しようとすると混乱することになりがちである。その ため何らかの構造を持つ情報を利用者に提示し、それを整理する支援機能を活用しなが ら、自分なりに隠された関連性や新たな意味を見いだすことも、ひとつの創造的な支援 になると考えられる。本論文ではこのような観点をも考慮し、概念ネットワークの自動 生成によって問題の概念構造を明確に示し、問題の関連性を考えさせる構造の生成を目 標にした。

本論文では、実際のシステム開発を例に、電子図書館における発想支援機能のひとつ の評価方法を提案した。これからの電子図書館は、全文データベースやマルチメディア 化がより充実してくる。これらのシステム開発には、システムの機能と知識ベースの内 容が、問題発見や問題解決にどのような支援効果があるかを、明確にすることが必要で あると考える。実験結果の定量的分析から、仮説をまとめるためのアイディアの量的な 増加傾向が確認され、専門家に対しても効果があり、異分野の被験者へはより効果が大 きいことも明らかになった。また定性的な分析では、システムが被験者の概念構造に直 接影響を与えた部分を把握することが可能になり、考え落としていた用語や文章をまと めるなどの発想支援的な効果があることが確認された。しかし、現状では原文を読まな いわけには行かず、納得のいく構造をマップさせるには、多少の作業時間とシステムを 使いこなすなどの工夫が必要であることも明らかになった。これらの問題点は、システ ムのヒューマン・コンピュータ・インタラクションの機能に、まだ多くの改善が必要で あることを示しているが、それらは今後の課題である。

参 考 文 献

[Adam 95]Adam, Nabil R., Bhargava, Bharat K., Yesha, Yelena eds.: Digital Library, Lecture Notes in Computer Science 916, Springer-Verlag, pp. 321 (1995).

[荒木 85]荒木峻ほか編:環境科学辞典,東京化学同人,pp.1015 (1985).

[Brown 93]Brown, R. Lester et al.: Vital signs : trends that are shaping our future, 1993-1994, Earthcan, pp.150(1993).

[Brown 94]Brown, R. Lester et al.: Vital signs : trends that are shaping our future, 1994-1995, Earthcan, pp.160(1994).

[Davis 72]Davis,William H.: Peirces's epistemology, Martinus nijhoff, 1972.(日本語訳:赤 木昭夫訳、パースの認識論、産業図書、pp.288, 1990.)

[土橋 95]土橋喜、堀浩一、中須賀真一、山内平行、立花隆輝;ディジタル・ライブ ラリを活用した概念ネットワークの自動生成と問題構造の可視化支援、ディジタル図書 館、No. 7, pp. 17-31 (1996).

[Fayyad 96]Fayyad, Usama M.etal eds.: Advances in Knowledge Discovery and Data Mining, AAAI Press, pp.611 (1996).

[福田 96]福田剛志:データマイニングの最新情報−巨大データからの知識発見技術 −,情報処理,Vol. 37, No. 7, pp.597-603 (1996).

[原岡 90]原岡一馬:心理学研究の課題と問題,ナカニシヤ,pp. 372 (1990).

[堀 94]堀浩一:発想支援システムの効果を議論するための一仮説,情報処理学会論 文誌,Vol. 35, No. 10, pp.1998-2008 (1994).

[堀 97]堀浩一:システム統合のAIへむけて−発想支援系と知識処理系の結合の提案 −,人工知能学会誌,Vol. 12, No. 2, pp. (1997). 

[川喜田 86]川喜田二郎:KJ法,pp.581, 中央公論社 (1986).

[小山 92]小山雅庸,河合和久,大岩元:カード操作ツールKJエディタの実現と評価, コンピュータソフトウエア,Vol. 9, No. 5, pp. 38-53 (1992).

[國藤 93]國藤進:発想支援システムの研究開発動向とその課題,人工知能学会誌, Vol. 8, No. 5, pp. 16-23 (1993).

[三末 94]三末和男,杉山公造;図的発想支援システムD-ABDUCTORの開発について、 情報処理学会論文誌、Vol. 35, No. 9, pp. 1739-1749 (1994).

[三末 95]三末和男,杉山公造;思考支援システムの評価法およびD-ABDUCTORの評 価実験について,第17回システム工学部会研究会「発想支援ツール」資料,pp.69-76 (1995).

[宗森 94]宗森純,堀切一郎,長澤庸二:発想支援システム群元の分散協調型KJ法 実験への適用と評価,情報処理学会論文誌,Vol. 35, No. 1, pp. 143-153 (1994).

[村上 94]村上陽一郎:科学者とは何か,新潮社,pp.186, 1994.

[長尾 94]長尾真:電子図書館(岩波科学ライブラリー15),岩波,pp.125 (1994).

[新田 95]新田清,三末和男,杉山公造:D-ABDUCTORを使った一連の作業における 思考過程の記録と分析,第17回システム工学研究部会「発想支援ツール」資料,計測自 動制御学会,pp.69-76 (1995).

[野村 96]野村浩郷ほか著:情報ハイウエイ時代のテキスト情報への知的アクセス, 情報処理,Vol. 37, No. 1, pp.1-9(1996).

[折原 93]折原良平:発想支援システムの動向,情報処理,Vol. 34, No. 1, pp.81-87 (1993).

[Piatetsky-Shapiro91]Piatetsky-Shapiro, G. and Frawley, W.J. editors : Knowledge Discovery in Databases, AAAI Press, pp.525 (1991).

[佐藤 84]佐藤允一:問題構造学入門−知恵の方法を考える−,ダイヤモンド社, pp.223 (1984).

[杉山 93]杉山公造:収束的思考支援ツールの研究開発動向−KJ法を参考とした支 援を中心として−,人工知能学会誌,Vol. 8, No. 5, pp.32-38 (1993).

[Swanson 87]Swanson, Don R.: Two Medical Literature that are Logically but not Bioliographically Connected, Journal of the American Society for Information Science, Vol.38, No.4, pp.228-233 (1987).