堀 浩一 立花隆輝
東京大学大学院 工学系研究科 航空宇宙工学専攻
〒153 目黒区駒場4-6-1
東京大学先端科学技術研究センター(堀研究室)
tel:03-3481-4486, fax:03-3481-4585, dobashi@ai.rcast.u-tokyo.ac.jp
Koichi Hori, Ryuki Tachibana
Aeronautics and Astronautics Course, School of School of
Engineering, The University of Tokyo
Research Center for Advanced Science and Technology (Hori Lab)
The University of Tokyo
4-6-1 Komaba, Meguro-ku, Tokyo 153
tel:03-3481-4486, fax:03-3481-4585, dobashi@ai.rcast.u-tokyo.ac.jp
(1)地球環境問題の多くは、必ずしも科学的に問題の因果関係が明確に立証されていない状況で、議論される傾向にある。
(2)いくつかの地球環境問題を分析してみると、多様な知識の組み合わせが必要であることがわかる。これは多くの一見関係なさそうな領域における極く普通の知識から、必要でない情報や知識を選り分けて組み合わせることである。そこから因果性に基づき、起こり得る様々な可能性を道出してみることが必要である。
(3)地球環境問題が既存の学問体系では解決できない問題であることから、研究者に要求されているのは、近代的な学問の概念自体の改革であると言える。自然科学と社会科学の広大な研究領域と政治とを結び付ける新しい課題であることは、世界中の研究者の常識である。また既存の知識体系では十分に対応できない問題であることから、知識体系の再構築が必要とされている。
このような問題点の指摘から要求されているのは新たな問題解決の方法論であるが、このような問題解決の全体を支援することは非常に困難な課題である。そのためここでは問題解決の視点を、地球環境問題の解決を目標にした、研究テーマの設定や政策の策定などにおける、発想支援システムの研究開発に設定することにした[堀94][Hori94]。
(1)地球環境問題の解決には多様な知識の組み合わせが必要であることから、システムではマルチメディアを扱えるディジタル・ライブラリの機能と大規模な知識ベースが必要である。
(2)地球環境問題を扱った文献の中から、問題を表現している部分抽出し、それらの情報を利用して因果関係などの問題の関連構造の可視化を試みる。
(3)文献の分析を利用して、問題解決のための新しい知識体系の構築を支援することを目標に、可能性のある新たな知識の組み合わせを生成することを試みる。
これらの目標を実現するため、システムでは環境問題の文献を集めて、知識ベースを構築している。この中には全文のほか、文献に含まれている図表などや引用文献リストなども含んでいる。文献は環境問題の学術論文やインターネットを通じて収集したもので、すべて英語の論文である。現在130タイトルの文献を用意し、この中には241の図表を含んでいる。実験システムはNCSA Mosaic を知識ベースのブラウザに利用しており、一種の電子図書館の機能を備えている。システムの全体的な特徴として、次のような点をあげることができる。
(1)知識ベースへの文献の追加は、HTMLで一定のルールによってタグ付けされたものであれば、テキスト部分は自動的に行うことができる。
(2)知識ベースを自由に検索できるように、各種のインデックスを生成する。例えばタイトル、著者、図表などへのインデックスである。文献から抽出した専門用語によるキーワードインデックスは、専門用語が出現する文献および文献中の該当する文章がブラウズできるようにしている。キーワードインデックスは、ユーザのキーワードからその場で生成可能で、検索機能を併せたものになっている。
(3)ユーザが文献を一つ選択すると、実験システムは自動的に内容的に類似した文献を提案する。文献間の類似度は、共出現したそれぞれの専門用語の出現回数の合計である。これによってユーザは内容的に関連した文献を容易に収集することができる。
(4)概念ネットワークは、単にマップされるだけでなく、マップ上でKJ法によるブレーンストーミングを行うことができる。ノードやリンクの追加や削除、ノードのグルーピングなどが自由に行える。また、概念ネットワークにマップされたノードは、文献のキーワードインデックスにリンクされており、ノード上の専門用語が出現する文献や文章を確認することができる。
特定の領域の問題を考えると、文献の中で問題として認識されている用語は、その領域の専門用語であることが多い。そのため、文献のなかに表現されている問題とその構成要素の関連性を抽出するためには、専門用語を中心にそれらの関連性を抽出することが必要になる。そのため実験システムでは、概念ネットワークは文献から専門用語を抽出し、専門用語の組み合わせによって生成される。用語の抽出は専門用語の辞書をもちいて単純なパターンマッチングによって行っている。専門用語は大部分が名詞であるが、この中には、著者が相対的に高い頻度で利用した用語も自動的に取り入れることにしている。また、nグラム手法を参考にして、複数の単語によって構成される複合語(現在は3単語まで)も含めている。
概念ネットワークの生成手順は、次のように行っている。例えばある一つの文章から、A、B、C の3つの専門用語が抽出されたとすると、AーB,AーC,B−C という専門用語の組み合わせが生成される。これを文献のすべての文章に渡っておこない、組み合わせの出現頻度を求める。そして出現した同じ文字列を連結してネットワークを生成する。大規模で複雑なネットワークもこのような要素を連結して生成している。
また専門用語の組合せを、同じ文章上から抽出されたもので行うことで、組み合わされた専門用語の間には、何らかの関係が存在すると言える。例えば、広い意味での因果関係などもこのような組み合わせの中に含まれていることがある。地球環境問題の文献を対象に、このようにして生成した概念ネットワークを分析してみると次のようなことが言える。
(1)組み合わせの出現頻度の高い部分は、著者によって頻繁に利用された専門的な用語の組み合わせである。つまり、領域の専門家にとっては広く知られた専門用語のつながりであることが多い。
(2)逆に出現頻度の低い部分は、わずかな可能性を求めて、システムが組み合わせを生成したものが多く、著者が文献中で言及した回数が少ない部分であり、相対的に重要性の低い部分と言える。しかし、新たな着想のきっかけになるような部分は、この頻度の低い部分に含まれている可能性が高いと言える。
(1)単独の文献から生成する。
単独の文献をユーザが選択して概念ネットワークを生成すると、その著者の問題に対する見解が分析の中心となる。
(2)複数の文献を自由に組み合わせて生成する。
ユーザが複数の文献を組み合わせた場合、複数の著者のそれぞれの問題に対する視点からの見解が、分析結果として一つにマージされて生成される。これによってより多面的に問題の関連構造を可視化することを目的にしている。
(3)特定の表現を含む文章をもとにして、その中の専門用語に関係のあるものを中心に生成する。
特定の文章から専門用語を取り出す場合は、その領域や問題に特徴的な表現を含む文章を取り出し、さらにその中から専門用語を抽出し、その専門用語を使って知識ベース全体から概念ネットワークを生成する。そのためユーザが目にしていない文献からも概念ネットワークの構成要素が生成される。例えば、地球環境問題の場合は、因果関係を解明することが重要であるので、因果関係を強く表現した文章(causeなどを含む文章)を抽出して、知識ベース全体から関連構造を生成している。このようにすると、一つの文献を超えて、複数の文献にまたがる隠れた因果関係を発見する可能性がある[Swanson87]。
(4)ユーザのキーワードを中心に生成する。
ユーザの要望を概念ネットワークに取り入れるために、ユーザの指定したキーワードをもとに概念ネットワークを生成する。この場合も知識ベース全体から関連のある文章を抽出し、それに含まれている専門用語を取り出して概念ネットワークを生成する。
文献単位の場合は、ユーザが文献を選択することが前提であり、範囲がより限定されるのに対して、特定の表現を含む文章から専門用語を抽出する場合や、ユーザのキーワードを中心に生成する場合は、知識ベース全体の文献を対象としており、ユーザが選択していない文献からも専門用語を抽出して概念ネットワークを生成し、ユーザに提供する点が基本的に異なっている。これはより多くの組み合わせを生成することで、ユーザが新たな視点に気づくように、効果的に支援しようする試みである。
(1)単独の文献のマップ
単独の文献の場合は、生成された組合せのうち、出現頻度の高い部分のリンクを色分けし、重要な部分を強調するようにしている。
(2)複数の文献のマップ
複数の文献の場合は文献ごとにリンクの色分けを行い、さらに共通部分を分離できるように色分けを行っている。これによって文献間における専門用語の関連が、リンクの色の違いをとおして、明確に認識できる。
(3)キーワードのマップ
特定の表現を含む文章から専門用語を取り出してマップした場合と、ユーザのキーワードのマップの場合は、それぞれ専門用語や入力したキーワードに直接つながっているリンクを色分けし、重要な用語をユーザに明確に示し、関連構造を見やすくするようにしている。
本研究のアプローチの有効性とシステムの効果について、開発した実験システムを実際に試用してもらい、被験者に意見を求めた。被験者の意見は、システムが提供している概念ネットワークのマップを生成する視点を中心にアンケートによって求めた。被験者は、地球環境問題を中心に研究活動を行なっている大学院生6人と情報科学、情報工学および認知科学を中心に研究活動を行なっている大学院生15人の計21人で行なった。
実験の方法は、システムを使って指定した課題に回答してもらい、実際の問題解決を行なう上でシステムの評価を行なうようにした。課題に回答することをとおして、問題解決において仮説をまとめる作業を行ない、被験者の作業にどのような効果をシステムが与えたかを、できるだけ定量的に把握することが目的である。用意した課題は次のとおりである。
[課題1]地球温暖化(global warming, global warm)の原因とその対策について
ここで仮説というのは、被験者がこの課題を回答する際にシステム全体を利用して思ったことや考えたこと、自分の意見などを指しており、アンケートの説明に明記した。実験を行なう際には、システムの使用方法を簡単に説明し、実験中は基本的に被験者に対する干渉は行なわないようし、被験者の判断で実験を進めてもらうようにした。また被験者が実験にかける時間およびシステムを利用する回数などは、特に制限しないことにした。
以下の質問に対する回答は、被験者がシステムを利用しながら、アンケートの中の該当する選択肢を回答した結果をまとめたものである。実験から得られたこれらのデータは、被験者が実際にシステムを利用しながら課題に回答する作業をとおして得られたもので、ある程度被験者自身がシステムの効果を見極めた上で回答した結果であると言える。またアンケートへの回答に付随した意見も書いてもらい、ここではそのなかからシステムの効果と問題点について、重要な部分をまとめている。
・(1)テキストの内容が説明されているような印象を受ける。(10人)
(2)因果関係がわかりやすい。 ( 7人)
(3)気が付かなかった関係が表現されている。 (13人)
(4)読みにくい文献が読みやすくなる。 ( 5人)
(5)テキストの内容を要約したような感じを受ける。 (10人)
(6)問題とその構成要素の関係がわかりやすい。 (12人)
(7)考えをまとめるのに役に立つ。 (12人)
(8)忘れていた関連性を思い出した。 ( 8人)
(9)その他 ( 1人)
この質問の回答から、概念ネットワークをマップすると、被験者が気がつかなかった関係が表現されていることがあり、問題とその構成要素の関係がわかりやすくなったり、自分の考えをまとめるのに役立つことがあると言えそうである。またテキストの内容が説明されているような印象を受けたり、要約したような感じを受けるという被験者も全体の半数近くいることから、文献から専門用語を抽出するシステムの効果が現われていると考えてよいと思われる。そのほか因果関係がわかりやすい、忘れていた関係を思い出したという回答も発想支援の立場からは重要であると言える。このような点を考慮すると、開発したシステムは、問題とその構成要素の可視化をとおして、いくつかの視点から被験者に問題を考えさせるきっかけを与えており、問題解決へのアプローチを支援する効果があると言えそうである。このほか、被験者からシステムの効果を示す次のような意見をえることができた。
・*自分が注意していなかった単語が表示されので、とりあえずキーワードでそれを探してみようというように、自分の考えを振らせるのに役立つと思う。
*テキストでは、文章の中にキーワードが埋まっているが、マップだとキーワードが直接目につく。また、キーワードの関係を文章をとおしてでなく、リンクをのみで表示するため、そこに読み手の想像を入れる余地が十分にある。
*論文の内容を理解する有効な補助になる。
*自分の頭のなかでわかりかけてきている関係が、実際に形となって現われているのを見ることができ、確信を強められることがある。
*マップはテキストの内容が隠されている暗号のような印象を受ける。
これに対して次のようにシステムの問題点を指摘する意見もある。これらの意見は現在のシステムの限界を示しており、今後の検討課題となるものであろう。
・*キーワードとそのつながりがリンクされて示されるので、内容の要約的なものに見える。しかし、どうつながっているかという面で、不明確である。
*いくつか効果がある反面、機械的な作業でデータが生成されるので、文脈上のつながりや言い換えが反映されていない部分がある。分かるのは相関関係だけで因果関係については文章を読むか常識で判断することになってしまう。もしかすると簡単にビジュアルな図が作られてしまうということは、原文を読まないなど安易に流されることと合わせて、かなりミスリーディングなことかもしれない。
・(1)複数のドキュメントにまたがる問題の関連性がわかる。(13人)
(2)複数の著者の問題意識のつながりがわかる。 ( 2人)
(3)特定の問題に関連した知識の構造が見える。 (10人)
(4)異分野間の問題に対する概念のつながりが見える。 ( 5人)
(5)その他 ( 3人)
単独の文献が著者の考えを中心に概念ネットワークを生成するのに対して、複数の文献を自由に組合わせることで、より多面的に問題の構造をとらえるのがこの機能の目的である。複数の文献にまたがる問題の関連性がわかるという回答が多かったことは、システムの目的をかなり実現していると言えそうである。このことは問題を考える上で、考え方の幅を広げたり深めたりする効果があり、総合的な見方を支援することになっていると思われる。また複数の文献をマップして頻度による絞り込みを行なうと、常識的な知識のつながりが見えるという指摘もあったが、これは非専門家に対する支援効果が期待できる点である。逆にいえば専門の研究者に取っては、頻度の低い部分のデータをマップすることで、新たな知識を見いだす可能性があるといえる。また、概念ネットワークのマップを、それぞれの文献ごとに色分けすることで、ことなる論文間の概念の連続的なつながりを見いだせることが、問題の関連性をわかりやすくする効果があると言えそうである。このほか被験者から次のような意見が得られた。
・*単独の文献では取りこぼされてしまうような関連が、確実に見つけだされることに意義がある。多くの関連した文献をマップすることで、より関連のある用語が浮かび上がって来ると思う。
*ある程度特定の著者の見方に捕われず総合的、網羅的な見方ができる。
*論文の内容的な連続性が生まれてくると思う。ただ論文のリストを見せられるのでは、どの論文とどの論文が連続的なのか分からない。
*関係ある問題と無関係な問題の、それらに絡まる知識の様子がわかる。
・(1)問題の中で因果関係をたどっていける。 ( 5人)
(2)新しい知識の関連性を見いだす可能性がある。 ( 9人)
(3)現象の原因と結果がはっきりする。 ( 5人)
(4)問題の関連性を連想しやすい。 (10人)
(5)その他 ( 3人)
アンケートからは、因果関係のように特定の関連性を抽出して概念ネットワークを生成すると、問題の関連性を連想しやすいという回答が比較的多く得られた。これは概念ネットワークが、問題の関連性を表現するために、文脈を考慮した連想網の形成をめざしていることの効果の現われと言えると思う。しかし、機能的に今だ十分に文脈を反映した可視化が実現しているとは言えず、今後の研究課題となっている。また新しい知識の関連性を見いだす可能性を回答した被験者もいたが、これは因果関係推論の考え方を概念ネットワークの生成に取り入れている効果と言えるかも知れない。これらの因果関係のマップ上での表現は、3つ以上のノードが線形的にリンクされて表現される。被験者からは次のような意見が得られた。
・*因果関係の方向がわからない点は不便であるが、逆にどのような因果関係かを考えるきっかけにはなる。
*比較的知識が乏しい分野では、新しい知識を見いだす可能性があると思う。
*限定的ではあるが、問題の中で因果関係をたどって行ける。
*文字として、意味を考えずに因果関係に関連する単語でフィルターをかけて取ってくるのでも有効であるとは思う。
*マップがそのまま論理的な因果関係を示すわけではないが、やはりその論文において重要な点を示す可能性が強いといえるので、参考になった。
*現象の原因と結果がはっきりするが、ただし原文を確認する必要がある。
また機能的に不十分な点を指摘する意見もあり、今後の検討課題である。これらの意見として次のようなことが指摘される。
・*どちらの単語がどちらの単語に影響を及ぼすのかを、マップ上で理解するのは困難。因果関係を表示するのであれば、どちらが原因でどちらが結果かを有効グラフの形で表現すると、より原因を追及しやすい。例えば「reduce 」という用語がキーワードとして現われが、何が何をreduceさせているかがわかるとよい。
*はっきりした因果関係を示すというよりは、関連性を示す単語を示しているというところまでしか読み取れない。結局文献を読まねばならない。
*新しい知識の関連性を見いだす可能性があると思うが、認知的な負担が大きい。
*論文の中から抽出される因果関係の数行の文章が、あまりに短絡的に見えて、問題点を見落としそうな気がした。
・(1)入力したキーワード以外に関連した用語も取り出せるので、連想がわく。 (13人)
(2)入力したキーワードに関連した知識の構造が見える。 ( 6人)
(3)入力したキーワードに関連した問題の関連性がわかる。(14人)
(4)入力したキーワードに関連したもので、忘れていたことや新しいことに気がつきやすい。 (10人)
(5)その他 ( 5人)
キーワードによるマップの効果では、入力したキーワードに関連した問題の関連性がわかるという回答が最もおおく、システムの開発目的をかなり達成していると言えると思う。また連想がわくという回答も多く、システムは問題を考える上で被験者の連想的な探索を刺激していることを示している。このことは被験者が入力したキーワードに関連したもので、忘れていたことや新しいことに気がつくことにつながっており、一連の効果として評価できる点であると考えられる。そのほかの被験者の意見として、次のような意見が得られた。
・*基本的にはキーワードの検索という意味づけで使用した。
*関連した項目へ感心が向けられると言う点で効果がある。
*メリットしては選択肢のとおりであると思う。いわゆるブレインストーミング的な効果があり、役にたちそうである。
*文献によってそのキーワードがどういう文脈で用いられているかの違いが分かる。
以上のほか次のようにシステムの限界を指摘する意見もある。生成に時間がかかるなどの点についてはハードウエアなどの限界もあるが、アルゴリズムやシステム構成の見直しなどが必要であろう。
*選択肢の全てが当てはまる反面、もともとのデータベースが持つ限界を忘れてしまう危険性が感じられる。
*生成にかかった時間に比べて、Total MapやCausal Relation Mapより良い結果がでているとは思わない。
概念ネットワークを利用したKJ法について、被験者から多くの意見がよせられ、発想支援の観点からいくつかの重要な評価がなされていると言える。以下に得られた意見の重要な部分をまとめる。
・*マップ機能の一番の特徴は、自分で思考実験ができるところにある。マップで表示されたキーワードを自ら動かすことによって、いろいろな考えを巡らすことができる。文献を読むだけでは、情報に対して受け身であったのに対し、マップの操作によって、情報整理に能動的に参加し、考えをまとめて行けることにある。このシステムは人を受動的にする情報提供システムではなく、操作しながら一緒に思考に参加することができる。
*マップ機能はブレインストーミングに似ていて、文章をゼロから組み立てていくときには、極めて有用であるような印象を受けた。文章が出来上がっている場合には、文章に盛り込み損ねたタームや関係を記述するのに役立つ。
*タームを移動させて、マップを見栄えのする形にしていく作業自体、考えをまとめる作業そのものであると思う。不要なタームを削除していくと、問題の骨格が浮かび上がってくる。文献調査を行なう際にはマップのような作業をやれるにこしたことはないが、このようなやり方で手作業で考えをまとめるのは事実上不可能であるため、このようなことが現実的にできるようになると有り難い。
*ノードを移動することによって、関連のありそうなノードを集めることができるので、自分なりに問題の構造が明確化でき、問題の理解に役に立つ。また問題全体の構造を壊さない形で、簡潔にまとめることができるので分かりやすい。
*キーワードを画面上で移動し、見やすい場所に移動するだけでも、キーワードの適当な配置を考える時点でさまざまな想像がわいた。
*文献を読むのに加えて、手でマップを操作することによって、「なるほど」という強い気持を感じることができる。
*本を読みながら、重要なポイントをメモしておくように、重要なキーワードを関係付けて、メモしてく感じである。
以上はシステムの効果をかなり評価した意見であるが、問題点として次のような点が指摘される。
・*問題の中心となっていると予測される言葉とその他の関連する言葉の関連を視覚的に感じ取ることができる。文献の内容を構造化して見ることができるように感じる。しかし、間違って理解している可能性もあるので、文献を実際に読まないわけには行かない。文献を読む代わりにすることは現段階ではできない。
*概念ネットワークのグラフにもっと意味が表現されるとよい。
*できれば初期マップなどを単純化する機能が欲しい。
*作業の大半をキーワードのマップの整理で費やしてしまうので、自動的に見やすくマップしてくれる機能が必要。
・(1)自動翻訳機能。 (10人)
(2)自動要約機能。 ( 9人)
(3)自動的に知識の階層構造を生成するような機能。 (10人)
(4)図表からも分析データを抽出するような機能。 ( 5人)
(5)その他 ( 3人)
システムの試用実験をとおして、今後のシステムに必要な機能について意見を求めた。その結果自動的に知識の階層構造を生成するような機能が必要という意見が多かった。これは、現在の概念ネットワークが、関連性を全てリンクによって連結してしまうため、かえって認知的な負荷を被験者に与えてしまうことが原因である。システムが可能性のありそうなものを全て連結してしまう点に一つの問題点がある。マップの初期配置の時点から自動的な見やすい配置を行なうためにも、自動的な知識の階層構造の生成が必要であると考えられるが、今後の課題である。このほか自動翻訳機能を指摘する意見も或るが、これは現在知識ベースが英語のためである。そのほか被験者の意見として次のような点が指摘された。
・*初期空間配置でグルーピングが自動的に行なわれるような機能があれば見やすくなると思われる。
*個別に整理されたマップどうしをマージする機能が欲しい。
*キーワードではなく、センテンスをノードとするようなマップもあるとよい。
*自分で文章を作成してそれと他の文献の間にどれほどの共出現があるのかを計算する機能。文章でなくても単語の羅列でも役割を果たす。自分が書いた文章をマップする機能。
まず、ある被験者は、「情報を検索する場合に言えることは、欲しい情報がダイレクトに得られればよいと言うのではなく、検索の過程で接するなんらかの関連した情報が、問題解決のアプローチを決めるために重要であることが、このシステムを使ってみて気がついた」と指摘している。このことはシステムが情報を検索する過程において、発想を深めたり広げたりする効果があることを暗に示していると言える。問題解決に対して認知のきっかけを与えることは、思考の邪魔になることも想定され、この点は今後の研究が必要である。
また、被験者にとって、「現段階では文献は読まざるを得ないが、マップは文献の検索およびすでになんとなくわかっていることがらに対して、目に見える形の理解の促進として役立っている」ことが指摘されている。このことはシステムが目標とした問題の関連構造の可視化が効果をあげていると言えそうである。現段階でも、文章の構造をマップさせることはおおむね可能であると言えるが、それには多少の作業時間とこつが必要なのが現状での問題点である。
[長尾94]長尾真. 電子図書館(岩波科学ライブラリー15),pp.125,岩波書店(1994).
[堀94]堀浩一. 発想支援システムの効果を議論するための一仮説,情報処理学会論文誌,Vol. 35, No. 10, pp. 1998-2008 (1994).
[村上94]村上陽一郎. 科学者とは何か,新潮社,pp.186,1994.
[Hori94]Koichi, Hori. A system for aiding creative concept formation, IEEE Transactions on Systems, Man and Cybernetics, Vol. 24, No. 6, pp. 882-894 (1994).
[Swanson87]Swanson, Don R. Two Medical Literature that are Logically but not Bioliographically Connected, Journal of the American Society for Information Science, Vol. 38, No. 4, pp. 228-233 (1987).