東京大学先端科学技術研究センター
〒153 目黒区駒場4-6-1
東京大学先端科学技術研究センター(堀研究室)
tel:03-3481-4486
fax:03-3481-4585
dobashi@ai.rcast.u-tokyo.ac.jp
本論文で提案する方法は、利用者の思考過程におけるシステムの効果を明らかにする ため、比較実験を基本としている。そのため実験は、開発したシステムと既存の代表的 なシステムとの比較、専門家と非専門家の比較を中心に行なった。提案する実験方法で は、発想の量的な増加を専門用語と文字数の増減として把握する。さらに開発したシス テムを利用して、被験者がまとめた文章を定性的に分析することによって、システムの 効果による被験者の概念構造の変化を可視化することができる。これらの方法によって、 電子図書館と一体となった発想支援システムの効果を、定量的かつ定性的に把握するこ とが可能になった。
発想支援システムに最も期待される効果は、思考作業の結果として、新たな視点や新 たな考えが浮かぶといった量的な増加と、アイディアがより精緻化されるなどの質の改 善と精緻化にある。発想支援システムの評価では、より正確な評価を行なうために、定 量的分析と定性的分析の両方から行なうことが必要である。そのため本論文では、我々 が開発した発想支援システムを利用して、システムが利用者に与える発想支援的な効果 を、定量的・定性的に評価するための新たな枠組みを提案する。我々が開発したシステ ムは、電子図書館と発想支援システムを統合化したもので、本論文で提案する実験と評 価方法は、電子図書館の一つの評価方法としても活用が可能であると考える。
本論文で提案する方法は、利用者の思考過程におけるシステムの効果を明らかにする ため、比較実験を基本としている。そのため実験は、開発したシステムと既存の代表的 なシステムとの比較、専門家と非専門家の比較を中心に行なった。開発した実験方法で は、発想の量的な増加を専門用語と文字数の増減で把握している。さらに開発したシス テムを利用して、被験者がまとめた文章を定性的に分析することによって、システムの 効果による被験者の概念構造の変化を可視化することができる。これらの方法によって、 電子図書館と一体となった発想支援システムの効果を、定量的かつ定性的に把握するこ とが可能になった。
以下、まず第2章では、これまでの評価方法の概略について述べ、第3章では、開発 したシステムの概要を紹介し、第4章では、電子図書館と統合した発想支援システムの ひとつの実験方法を提案する。第5章では、実験結果の定量的分析とその考察を行なう。 第6章では、被験者の概念構造の変化を把握するための定性的分析方法を提案し、分析 結果の考察を行なう。第7章はむすびである。
例えば、これまでに開発されたシステムでは、各機能の使用感や満足度をアンケート によって回答を求めるなど、ユーザの主観をベースにした評価が一般的に行なわれてい る[三末 94]。しかしアンケートだけでは主観的な評価にとどまり、開発したシステ ムがどう役立つかを客観的に評価するためには充分とは言えない。KJ法を取り入れた システムでは、D-ABDUCTOR[三末 95][新田 95]、郡元[宗森 94]、KJエデ ィタ[小山 92]などがあり、これらのシステムでは、システムを利用した発想活動に おける作業の時間的な観点からの評価が中心に行なわれている。
D-ABDUCTORでは、システムの使える機能を制限した5つモードで行なった作業時間 の比較を行ない、手作業に比較して効果があることを示している[三末 95]。さらに 実際の思考作業を行ない、その際の操作や意図を詳細に記録し、その分析による思考過 程の時間的な進行による実体把握が試みられている[新田 95]。郡元では、複数台で 行なう分散協調型KJ法を、学生実験に適用した結果と、紙面上で行なったKJ法の結 果とを比較し、意見の数、文字数、かかった時間などをパラメータとして分析している [宗森 94]。KJエディタでは、KJ法で普通に行なわれるカードを広げる作業、あ るいはカードに文字を書き込むというようなKJ法の基本的な作業において、システム を使う場合と使わない場合の作業時間の比較を行なっている[小山 92]。
それぞれのシステムによって実験方法は異なるが、どのシステムも被験者がシステム を使う作業と使わないで行なう作業の比較を行なう方法を基本としている。さらに同じ テーマを開発したシステムを使う方法と使わない方法で行なうと、慣れによって発想法 として正しい実験が行なわれない可能性が大きいため、被験者に異なるテーマを与えて いる場合もある[宗森 94]。また実験条件をできるだけ同一にするため、カードを自 由に広げる作業やカードを規則正しく広げる作業のように、作業の単位を小さくするな どの工夫が行なわれている[小山 92]。
これらの方法は、同じ作業を繰り返すことで、被験者が特定の思考作業に習熟する学 習効果を排除しようとする工夫と言える。しかし問題点として、テーマを変えると作業 ごとの難易度が異なることが指摘され、作業単位を小さくする方法なども、作業が中断 されるため、問題解決における一連の作業として評価することはできない。さらにこれ らの実験は、作業効率に注目することを主な目的としており、発想支援システムが本来 目的とすべき、アイディアの量的増加や質的な向上の評価まで行なうことはできない、 というところに大きな問題を残している。
またこれまでの情報検索システムでは、長い間、検索効率や再現率といった評価尺度 が一般的に用いられてきたが、これらの指標もシステム本来がめざすべき思考支援のた めの指標とは言えないと考える。次章では実験におけるこのような問題点を改善する評 価方法を提案するため、開発したシステムの目的と概要についてまとめる。
用語の抽出は、辞典の索引から作成した専門用語辞書(現在9,980語)[荒木 85]を使 う方法と、出現頻度の高い用語を自動的に抽出する方法を併用している。この方法によ って文献に表現されている重要な部分を、出現頻度だけに頼らないで取り出す可能性を 高めることができる。専門用語を抽出する場合、センテンスによっては組み合わせを生 成するために必要なものが含まれていないこともある。専門用語が一つのセンテンスか ら1つだけしか抽出されない場合は、本システムでは、そのまま2次元空間に単独でマ ップすることにしている。このような用語は、利用者が必要に応じて関連のありそうな 用語との間にリンクを形成し、概念ネットワークに組み入れることができる。生成され た概念ネットワークは、概念間のつながりを自動的に線分で連結し、利用者の自由な発 想を促すため、2次元空間にランダムにマップされる。図1は概念ネットワークの生成 過程を概念図で示したものである。
図3および図4は、問題構造を可視化するために、システムが生成した概念ネットワ ークの例である。このマップを操作することによって、問題解決と問題発見において問 題を正しく認識し、問題を構成しているものは何か、どのような関連性があるか、など を考えさせることをめざした[佐藤 84]。
また文献の中で頻繁に言及される部分は、文献の主要なテーマを表わす概念や概念間 の関係である。これらのことから専門用語の組み合わせを生成すると、頻繁に利用され るものとそうでないのもとの間に出現頻度に差が生じることになる。これらの出現頻度 の差を利用して、問題構造を表現する可能性の高い概念構造と、可能性が少ないものと を出現頻度で描き分けることができる。地球環境問題の文献を対象に、このようにして 生成した概念ネットワークを分析してみると、概ね次のようなことが言える。
出現頻度の高い用語の組み合わせは、著者によって頻繁に利用された専門的な用語の 組み合わせであり、文献の内容から見れば相対的に重要な部分である。この部分は領域 の専門家にとってみれば、常識的な用語で問題構造を説明するようなつながりを構成し ており、新たに気づく関連性は少ない。しかし文献が表現している中心となる主題を視 覚的に把握することができるので、文献の要約を生成することと似たような効果が期待 できる。
逆に出現頻度の低い用語の組み合わせは、著者が文献中で言及した回数が少なく、シ ステムによって新たに組み合わせが生成された部分が多く、文献の内容から見れば相対 的に重要性が低いと言える。問題の構造を説明する上では、可能性の少ないつながりが 多く含まれている。しかし、新たな着想のきっかけや視点の発見につながるような部分 は、この頻度の低い部分に含まれている可能性が高く、システムが新たな概念構造を提 案している部分である。
また複数の文献から抽出された広い意味での因果関係も、生成された概念ネットワー クの中に含まれていることがある[Swanson 87]。
またこれまでの発想支援システムの開発では、発散的思考と収束的思考の支援に分け て考えられる傾向があったが[國藤 93][折原 93][杉山 93]、本システムの開発で は両方の支援を目標にした。発散的思考の支援は、考え方の幅を広げたり複数の解を得 ることの支援である。収束的思考の支援は、問題を限定して考えたり、事実やアイディ アをまとめることの支援である。また製品開発や科学的研究などさまざまな創造的活動 における新たな概念形成過程では、概念の中身に関わる内容刺激と発想のプロセスに関 わる刺激が共に必要になる[堀 94]。ユーザが必要とする文献を揃えて知識ベースを充 実させたり、ユーザが思い落としていたことに新たに気づかせるなどの支援は、内容刺 激になる。これに対して概念ネットワークを自由に操作し、ユーザの考えに基づいた概 念構造を組み立てるなどの支援は、プロセス刺激と言える。本システムの開発では、概 念ネットワークの自動生成と問題構造の可視化を効果的に機能させるため、これらの点 を考慮して次のようなシステムの諸機能を開発し、図2のようにNCSA Mosaic、Message Browser、Network Editorの中に組み込み、一体となった発想支援システムとして統合した [堀 97]。
(1) 知識ベース構築支援機能
発想の幅を広げたりする内容刺激を与えるためには、大規模な知識ベースを利用する ことが効果的である。知識ベースが大きければ、それだけ生成される知識の組み合わせ が多くなり、発散的な発想支援効果が期待できる。本システムはインターネットなどを 利用して、ユーザが自分で収集した文献が分析の対象である。そのためインターネット から収集した文献は、自動的に知識ベースに追加される。
(2) 知識ベース検索支援機能
知識ベースを自由に検索するため、タイトル、著者、図表および文章中に出現するキ ーワードへのインデックスを生成する。文献から抽出した専門用語によるキーワードイ ンデックスは、用語が出現する文献および文献中の該当するセンテンスがブラウズでき るように、リンクを自動生成している。キーワードインデックスは、ユーザのキーワー ドからその場で生成することが可能であり、検索機能を同時に実現したものになってい る。
(3) 類似文献提案機能
類似文献の提案機能は、内容的に関連のある問題を扱った文献の収集を、自動的に支 援することを目的にした機能である。類似の文献を多く集めれば、問題構造を網羅的に 把握することができるため、問題解決の概念形成により多くの情報を利用することがで きる。ユーザが文献を一つ選択すると、実験システムは自動的に内容の類似した文献を 提案する。文献間の類似度は、共出現したそれぞれの専門用語の出現回数の合計で求め ている。これによってユーザは、類似した文献が提案されるウインドウから文献を選択 することによって、内容的に関連した文献を容易に収集することができる。
(4) 複数の視点による概念ネットワーク生成機能
本システムでは文献の分析の視点をかえることで、異なる構造が生成される。複数の 視点から問題を捉えることにより、不十分な情報を補い、思い落としていた関連性を発 見することが期待できる。また断片的な情報を統合することによって、知識の体系化に 必要な概念構造をユーザに提供することが目的でもある。問題と文献との関係から、概 念ネットワークは次のような複数の視点から生成することができる。
[a] 単独の文献から生成する。
[b] 複数の文献を自由に組み合わせて生成する。
[c] ユーザのキーワードを中心に生成する。
(5) KJ法による発想支援機能[川喜田 86]
概念ネットワークは単にマップされるだけでなく、ネットワークエディタ上でKJ法 による試行錯誤的な発想支援活動を行うことができる。ノードやリンクの追加と削除、 およびノードの移動とグルーピングなどが自由に行える。また初期配置の段階で、文章 上で関係のありそうなものは、あらかじめ線分で連結されており、自動初期配置機能を 取り入れている。同時に関係ないものの間にはリンクを生成しないようにしており、自 動的なグルーピング機能も備えている。また利用頻度の高い用語を含む比較的長い文献 から概念ネットワークを生成すると、非常に多くの組み合わせを生成する場合がある。 そのため生成した概念ネットワークを出現頻度、特定の用語などから自由に絞り込んで、 ネットワークを見やすくする機能を備えている。
(6) 概念関係の確認機能
本システムが生成する概念ネットワークは、知識ベースから生成された仮説の構造と 見なすことができる。仮説は知識として利用するためには、検証が必要である。そのた め生成された概念間の関係が妥当がどうか、確認する機能が必要である。ネットワーク エディタにマップされたノード上の用語は、文献のキーワードインデックスに自動的に リンクされている。このノード上の用語が出現する文献のタイトルや文章を一覧表示す る機能が、NCSA Mosaic と連結して用意されており、用語がどのような文脈で使われて いるかを即座に確認することができる。
(1)複数文献からの生成
ユーザが複数の文献を組み合わせた場合、複数の著者のそれぞれの問題に対する視点か らの見解が、分析結果として一つにマージされて生成される。これはより多面的に問題 の関連構造を可視化するための機能である。実際の画面では、複数の文献の場合は文献 ごとにリンクの色分けを行い、さらに共通部分を分離できるように色分けを行っている。 これによって文献間における用語の関連が、リンクの色の違いをとおして、明確に認識 できる。図3は2つの文献を同時にマップした例であり、それぞれの文献ごとに色分け されており、全体的に出現頻度を2以上に限定している。リンクの色が黒でco_appearと 表示されている組み合わせは、2つ以上の文献に共通に出現した組み合わせである。黒 色以外のリンクの上には、出現頻度のほかに、文献の識別番号を表示しており、タイト ルを知る手がかりにしている。
図3に生成された概念ネットワークのマップは、論文集[Brown 93][Brown 94] から、「Air Pollution Dameging Forests(1993, pp.108-109)」と「Sulfur and Nitrogen Emission Resume Rise(1994, pp.94-95)」という異なる著者の2つの文献を同時にマップ し、手作業で見やすくしたものである。前者の文献は単語数が1,789、抽出された用語は 83、用語のこの文献中におけるのべ出現回数は168、生成された用語の組み合わせは267 である。後者の文献は単語数1,122、抽出された用語は37、用語の文献中におけるのべ出 現回数は86、生成された用語の組み合わせは126である。2つの文献を合わせた総単語数 は2,911であり、その中で用語が合計のべ254回出現し、マップを生成するための用語の組 み合わせは合計393となっている。マップの右側は前者の文献、中央部分は2つの文献に 共出現する部分、左側は後者の文献の内容がそれぞれマップされているが、見やすいマ ップを作成するため一部のデータは表示していない。
これら2つの文献は大気汚染が地球環境にどのような影響を与えるかを中心に論じたも のである。マップのほぼ中央には、sulfurやnitrogen oxideのように2つの文献に共通に出 現する重要な用語が配置されていることが分かる。さらに前者の文献では、sulfurを多く 含んだcoalの最大の利用国であるChinaでは、air pollutionによって引き起こされる森林破壊 が起きていることに触れ、後者の文献ではChinaにおけるsulfurの大気中への放出が年々増 大しているが、米国は逆に近年減少していることが述べられている。生成された概念ネ ットワークには、coal - China - sulfur - United States - air pollutionのようにリンクが生成され、 文献で触れられている関連性がマップされていることが分かる。このように複数の文献 から概念ネットワークを生成すると、互いの文献で独立に述べられている問題の関連性 を統合し、まとまった一つの問題構造として生成することができる[Swanson 87]。
(2)ユーザのキーワードを中心に生成
文献を読んでいると、意味を調べたい用語が出現することがある。このシステムでは意 味を調べることはできないが、調べたい用語がどのような用語と関連性があるかをシス テムを利用して調べることができる。ユーザから関連構造を調べたい用語をキーワード として受け取り、そのキーワードを中心とした概念ネットワークを生成する。この機能 ではユーザの要望を取り入れるために、事前の処理は行なわず、知識ベースのセンテン スを全て検索し、その場で概念ネットワークを生成する。
図4はacid rainという複合語で知識ベース全体を検索して生成した概念ネットワークで ある。この場合には知識ベース全体から13のセンテンスが検索され、その中から161の用 語の組み合わせが生成された。この場合の生成に必要な時間は約5分であった。マップ は全体を表示した後、出現頻度を2以上に限定し、acid rainに直接つながっている部分だ け再度マップさせたものである。収集した文献を調べて見ると、acid rainの主な原因は化 石燃料の燃焼によるsulfurなどの大気中への放出にあると述べられている。またacid rainは 森林破壊をもたらし、湖沼の酸性化などによって生態系に影響を与え、また建築物など にも被害を与えることも述べられている。生成された概念ネットワークを確認すると、 smog, carbon, sulfur, lead, air pollution, coal, burn, global warmなど、acid rainの原因と強く関 連した用語がマップされていることに気がつく。また、side effect, bird, habitat, health, productivityなどacid rainが与える影響と関係の深い用語も抽出されており、広い意味での 因果関係が表現されている。さらにreduceという用語がacid rainとcarbonの間に生成され、 acid rainの対策としてcarbonを削減することが示唆されているが、これらの関係は文献の 中でも指摘されていることである。
(1)システム間の比較
実験1:NCSA Mosaicのみを使った作業
実験2:開発した実験システムを使って行う作業
(2)被験者間の比較
被験者グループ1:地球環境関係の大学院生(専門家)
被験者グループ2:情報工学関係の大学院生(非専門家)
本実験では、被験者が課題に回答することにより、具体的な問題解決における仮説を 文章で記述してもらうことにした。また被験者の文献やリンクの検索履歴および作成し た概念構造のマップを保存することによって、システムを利用した仮説の文章の作成過 程を記録しておくことにした。このような方法を採用することによって、開発したシス テムが、被験者の思考や仮説の生成に、どのような影響を与えているかを明確に把握す ることを試みている。
実験では「地球温暖化の原因とその対策について」という与えられた課題に対して、 自分の考えを仮説としてまとめることを被験者に依頼し、問題解決を行なう実験を行な った。最初に被験者はMosaicのみを使って、課題に対する仮説の作成作業を行い、回答を まとめる。その際に被験者に対して、実験は被験者固有の知的側面を調べるのではなく、 システムの性能評価が目的であり、自分で思ったことや意見を自由に、できるだけ書い てもらうように要請した。
次に実験1の回答が終了した被験者に、開発した実験システムの操作説明を行い、被 験者の仮説がどのように変化したかを調べるため、実験1と同じ課題を実験2で再度行 ってもらうことにした。その際に、実験2では開発した本システムをできるだけ有効に 活用し、次のような点に留意してこの実験2での仮説をまとめるように要請した。(1)さ らに内容を精緻化し、発展させる。(2)できるだけ数多くの関連した仮説を作成するよう に試みる。(3)実験1の仮説に不要な部分や不適切な部分があれば、削除したり、修正し たりする。(4)実験1とは全く別な考えが浮かんだ場合は、新たな仮説としてまとめ、追 加する。(5)必ずマップ機能を利用して概念ネットワークを操作してみる。
このような手順で与えられた課題に対して問題解決を試み、それぞれの実験に用意さ れたシステムと知識ベースを使って得られた新たなアイディアを中心に仮説をまとめる 作業を行ってもらった。この作業によって、実験1のMosaicだけでは気がつかなかった新 たな視点や関連性が、実験2で見いだせるかどうかを調べる。そして実験1と実験2の 比較を行うことによって、被験者の回答における仮説の変化を分析し、実験システムの 性能評価に利用する。これらの2つの実験を比較するため、インターネットに流通する 学術的な論文の形態を参考に、実験1においてMosaicのみを使ったときの、Mosaicと知識 ベースの条件を次のように設定した。
(1) 知識ベース内の文献の数と内容は、実験システムと同じにする。
(2) 文献をブラウズするためのハイパーリンクは、現在インターネット上で見られる 標準的なものに設定する。そのためTitle Index, Author Index, Figure and Table Indexは文献を 検索するために使えるように生成している。
(3) Mosaicが持つ機能はそのまま利用する。
実験2で仮説の追加あるいは修正などを行った場合は、数量的な変化として現れる。 そのため被験者がまとめた仮説の分析から、数量的に仮説の変化を測定した。表1に地 球環境関係の被験者、表2に情報工学関係の被験者の、それぞれの実験1と実験2にお ける仮説の量的変化の分析結果を示す。被験者が作成した仮説の量を、専門用語のべ出 現回数(表では用語数)、文章の文字数全体の変化という観点から考えると、次のよう なことが言える。
(1) 数量的に仮説の変化があった被験者は、実験1で作成した仮説に対して、追加や 削除などの修正を行なっている。
(2) 仮説の量が数量的に増加している場合と減少している場合の両方に、システムの 効果があると言えるが、増加している場合の方が文章を書く上での支援があったことに なり、効果は大きい。
(3) 仮説の量が変化していない場合は、全く修正が行なわれなかったもので、システ ムの効果が最も少ないケースである。
表1 実験1と実験2の仮説の量的変化(地球環境関係の被験者7人)
表2 実験1と実験2の仮説の量的変化(情報工学関係の被験者13人)
実験結果における差の有意性を、t検定によって行なった結果を表3に示す。本実験 では、被験者の専門用語の増減が最も重要と考えられるので、表には用語数の検定結果 を示している。
地球環境関係の被験者の結果からは、仮説棄却の危険率Pが0.10 < P < 0.20となり、危 険率が10%を越えるため、統計学的な検定の趣旨から有意差は認められない。このグル ープでも増加傾向を示す被験者の方が多いが、これには例外的に増加したものも含まれ ていると解釈される。
情報工学関係の被験者の結果から、仮説棄却の危険率Pは0.05 < P < 0.10となり、有意 差が例外的に認められるぎりぎりの危険率を示している。検定の趣旨に従えば情報工学 関係の被験者には、用語数に強い増加傾向が現われていると言える。
次にどちらの被験者グループにより効果があったかを調べるため、実験2における用 語数の平均の検定を行なった。これらの値は互いに独立であるから、2分散の検定を行 なうと非等分散を示すため、コクラン・コックス法を適用して、2つのグループの平均 のt検定を行なった。その結果、2つのグループには有意差は認められないことが明ら かになった。これは実験1のMosaicだけを利用した結果でも、同様の検定結果となった。
t検定は実験結果の全体的な有意差の判断に利用されるが、被験者個別の微妙な変化 を把握することは困難である。そこで後で触れる定性的分析にも利用するため、単純に 被験者ごとの実験1と実験2の用語数と文字数の増減率(実験1と実験2の増加分に対 する実験1の割合)を求めた。これらはそれぞれ表1、2の増減率の欄に示す値のよう になるが、増減率の数値的な増加傾向が現われているものに注目すれば、用語数では被 験者の61%、文字数では74%が増加傾向を示している。用語数と文字数から見ると、仮 説の文章が増加した被験者は全体の80%(20人中16人)に達する。
以上の定性的分析から、開発したシステムを利用すると、仮説の文章をまとめる上で、 両グループの用語数と文字数に増加傾向が見られる。このことは、文章をまとめる上で 効果があるという被験者の意見が多数寄せられたことを裏付けている。検定と増減率か らは非専門家である情報工学関係の被験者の方が効果が大きく、専門家には効果が少な いことが明らかになった。またMosaicだけを利用した場合は、地球環境関係の被験者の文 章の量が情報工学関係の被験者より多く、専門家の能力の一端が現われている。開発し たシステムを利用すると、今度は逆に情報工学関係の被験者の用語数と文字数が多くな り、明らかに効果があると言える。
この結果の背景には、専門家と非専門家の知識の量とその活用の仕方に差があるもの と考えられる。専門家は与えられた課題に対して、ある程度事前に自分なりの考えを持 っており、新たなデータでも発見されないことには、専門家の考えに大きな変化は起き にくいことを示している。しかし専門家にも、いくつかの考え落としていた用語に思い 付かせる程度の効果は認められる。逆に異分野の非専門家の研究者に取ってみれば、知 識の少ない分野であるから、開発したシステムを利用すると、新たな専門用語を簡単に 獲得でき、それを仮説の文章の中に容易に取り込むことができるこが示された。地球環 境問題では、多くの分野の研究協力が必要とされており、異分野の研究者の支援に効果 が期待される。
また仮説の量が減少した被験者は、全体の15%(20人中3人)である。被験者がシス テムを利用して、一度作成した仮説の中に、何等かの矛盾のようなものが存在すること に気がついて、文章の削除などの修正をしているならば、これは利用した効果があった と言える。例えば、仮説が減少したと答えた表2の情報工学関係の被験者Sの場合は、 実験2でシステムを使うことによって、仮説の根拠が薄いと気がついた部分を削除した ため、仮説が減少する結果になった。
仮説の量が変化しなかった表1の被験者Fは地球環境関係の中でも、地球環境政治に関 する研究をしている博士過程の院生であるが、実験2のシステムを使う前に、関連する 文献に大体目を通してしまったため、新しい仮説形成には至らなかった。これは課題が 同じなため、被験者が最初にまとめた仮説に対して、修正しようとする気持を起こさせ るような情報がシステムから提示されなかったこと、および知識ベースの内容と大きさ に限界があることを示している。
ここでは被験者の代表的な例として、地球環境関係の被験者のひとりを取り上げて分 析結果を示すが、他の被験者も同様に分析することができる。表1の被験者Eは、都市工 学を専攻している博士課程の院生で、環境リスク論を研究している。実験1における仮 説の本文自体の変化は、文章では1文が増加、重要な用語では13個の増加、全体の文字 数では118文字の増加であったが、このうち4つの文章に追加および修正が行われた。
実験1と実験2で被験者が作成した仮説を比較し、文章に変化がないかどうかを調べ る。ほとんどの被験者は仮説をまとめる場合に、被験者なりに問題構造を解釈した概念 マップを作成している。その仮説の文章の変化と概念マップに関連性がないかどうかを 調べる。そのためシステムを使って概念マップ上の用語と知識ベースの原文との対応を 調べ、さらに原文と仮説の文章が変化した部分との間に似たような表現が使われていな いかどうかを調べる。被験者がシステムを利用して作成したマップの中に、仮説の追加 や修正と関係の深い部分が示されていれば、それはシステムの効果があったという確証 を得ることにつながる。
被験者Eは、複数の文献をマップし、専門用語のつながりを見ていて、仮説の修正や追 加思い付いくことができた。被験者Eが作成したマップの中には、仮説の修正や追加を行 なうために新たに気づいた部分が示されている。図5は被験者Eが実験2で作成した12枚 のマップのうち、仮説の修正された部分と最も関連の深いと思われるものである。被験 者はこのマップを作成するに時に、つながりが低いものを落としたり、不要なリンクを 落としたりして、わかりやすいマッピングになるように心がけて行なった。表4は被験 者がまとめた仮説と概念マップおよび知識ベースの間の対応関係を、システムを利用し て調べたものである。これらの間には、専門用語と文脈から考えて、共通の部分が含ま れていることを見いだすことができる。このようにシステムを利用して分析すると、被 験者がネットワークエディタ上のマップを操作しているうちに、最初にまとめた仮説に 追加すべき点を見いだしたことを明らかにすることができる。
被験者が実験1と実験2で作成した2つの仮説から、専門用語を中心に重要な用語を 取り出し、今回開発した方法で仮説から概念ネットワークをマップするためのデータを 生成する。2つの仮説をマップすることで可視化し、マップ上で出現頻度による絞り込 みなどの操作を通して、被験者の概念構造が変化している部分があるかどうかを調べる。 この方法によると、2つの仮説における概念構造の変化を確認することができる。図6 に2つの実験における被験者Eの仮説とそれに対応する概念構造の変化を示す。
2つの実験をとおして被験者Eが作成した2つの仮説から、図6に示すように文章上の 変化では、「火山活動」が新たに追加された用語であるが、マップ上でも変更されてい ることがわかる。また「気候変動−変化−植生」の部分にあたる文章上の表現も修正さ れており、この部分は実験2でシステムを利用することによって、より重要性が増して いる部分ということが言える。
このように問題解決における概念構造の変化が行なわれたことに対して、被験者はキ ーワードや描写が追加され、より説得力のある文章になったと思われるが、仮説自体は 変化しなかったと感じた。また実験2での仮説の修正・追加に対して、文章を書く上で 最も有効であったと思われたのは、複数文献のマップであるという意見が得られた。こ の被験者の場合は与えれた課題に対して、実験を行なう前にすでに自分の仮説が固まっ ており、そのことが新たな仮説の発想を妨げた。そのため文章の追加や修正が行なわれ ても、新たな仮説の発想を得たと考えることはできなかった。しかし新たな専門用語を 思い付くことができた点で、発想支援的な効果が認められる。
本論文では、実際のシステム開発を例に、電子図書館における発想支援機能のひとつ の評価方法を提案した。これからの電子図書館は、全文データベースやマルチメディア 化がより充実してくる。これらのシステム開発には、システムの機能と知識ベースの内 容が、問題発見や問題解決にどのような支援効果があるかを、明確にすることが必要で あると考える。実験結果の定量的分析から、仮説をまとめるためのアイディアの量的な 増加傾向が確認され、専門家に対しても効果があり、異分野の被験者へはより効果が大 きいことも明らかになった。また定性的な分析では、システムが被験者の概念構造に直 接影響を与えた部分を把握することが可能になり、考え落としていた用語や文章をまと めるなどの発想支援的な効果があることが確認された。しかし、現状では原文を読まな いわけには行かず、納得のいく構造をマップさせるには、多少の作業時間とシステムを 使いこなすなどの工夫が必要であることも明らかになった。これらの問題点は、システ ムのヒューマン・コンピュータ・インタラクションの機能に、まだ多くの改善が必要で あることを示しているが、それらは今後の課題である。
[荒木 85]荒木峻ほか編:環境科学辞典,東京化学同人,pp.1015 (1985).
[Brown 93]Brown, R. Lester et al.: Vital signs : trends that are shaping our future, 1993-1994, Earthcan, pp.150(1993).
[Brown 94]Brown, R. Lester et al.: Vital signs : trends that are shaping our future, 1994-1995, Earthcan, pp.160(1994).
[Davis 72]Davis,William H.: Peirces's epistemology, Martinus nijhoff, 1972.(日本語訳:赤 木昭夫訳、パースの認識論、産業図書、pp.288, 1990.)
[土橋 95]土橋喜、堀浩一、中須賀真一、山内平行、立花隆輝;ディジタル・ライブ ラリを活用した概念ネットワークの自動生成と問題構造の可視化支援、ディジタル図書 館、No. 7, pp. 17-31 (1996).
[Fayyad 96]Fayyad, Usama M.etal eds.: Advances in Knowledge Discovery and Data Mining, AAAI Press, pp.611 (1996).
[福田 96]福田剛志:データマイニングの最新情報−巨大データからの知識発見技術 −,情報処理,Vol. 37, No. 7, pp.597-603 (1996).
[原岡 90]原岡一馬:心理学研究の課題と問題,ナカニシヤ,pp. 372 (1990).
[堀 94]堀浩一:発想支援システムの効果を議論するための一仮説,情報処理学会論 文誌,Vol. 35, No. 10, pp.1998-2008 (1994).
[堀 97]堀浩一:システム統合のAIへむけて−発想支援系と知識処理系の結合の提案 −,人工知能学会誌,Vol. 12, No. 2, pp. (1997).
[川喜田 86]川喜田二郎:KJ法,pp.581, 中央公論社 (1986).
[小山 92]小山雅庸,河合和久,大岩元:カード操作ツールKJエディタの実現と評価, コンピュータソフトウエア,Vol. 9, No. 5, pp. 38-53 (1992).
[國藤 93]國藤進:発想支援システムの研究開発動向とその課題,人工知能学会誌, Vol. 8, No. 5, pp. 16-23 (1993).
[三末 94]三末和男,杉山公造;図的発想支援システムD-ABDUCTORの開発について、 情報処理学会論文誌、Vol. 35, No. 9, pp. 1739-1749 (1994).
[三末 95]三末和男,杉山公造;思考支援システムの評価法およびD-ABDUCTORの評 価実験について,第17回システム工学部会研究会「発想支援ツール」資料,pp.69-76 (1995).
[宗森 94]宗森純,堀切一郎,長澤庸二:発想支援システム群元の分散協調型KJ法 実験への適用と評価,情報処理学会論文誌,Vol. 35, No. 1, pp. 143-153 (1994).
[村上 94]村上陽一郎:科学者とは何か,新潮社,pp.186, 1994.
[長尾 94]長尾真:電子図書館(岩波科学ライブラリー15),岩波,pp.125 (1994).
[新田 95]新田清,三末和男,杉山公造:D-ABDUCTORを使った一連の作業における 思考過程の記録と分析,第17回システム工学研究部会「発想支援ツール」資料,計測自 動制御学会,pp.69-76 (1995).
[野村 96]野村浩郷ほか著:情報ハイウエイ時代のテキスト情報への知的アクセス, 情報処理,Vol. 37, No. 1, pp.1-9(1996).
[折原 93]折原良平:発想支援システムの動向,情報処理,Vol. 34, No. 1, pp.81-87 (1993).
[Piatetsky-Shapiro91]Piatetsky-Shapiro, G. and Frawley, W.J. editors : Knowledge Discovery in Databases, AAAI Press, pp.525 (1991).
[佐藤 84]佐藤允一:問題構造学入門−知恵の方法を考える−,ダイヤモンド社, pp.223 (1984).
[杉山 93]杉山公造:収束的思考支援ツールの研究開発動向−KJ法を参考とした支 援を中心として−,人工知能学会誌,Vol. 8, No. 5, pp.32-38 (1993).
[Swanson 87]Swanson, Don R.: Two Medical Literature that are Logically but not Bioliographically Connected, Journal of the American Society for Information Science, Vol.38, No.4, pp.228-233 (1987).