図書館
中学生のころ図書室に行くのが好きだった。無限とも思える本に囲まれて手当たりしだいいろいろな本を眺めるのが好きだった。
司書の先生と仲良くなって整理の終わっていない新刊書をこっそり借りたりした。森鴎外の全集の外箱を貰ってきて自宅の本棚にかざったりした。
大学時代は論文を探すのに図書館を使いまくった。Citation Indexというのを先輩に教えてもらい、へー世の中こんな便利なものがあるのだなあと感心した。Citation Indexというのは科学技術系論文の表題、著者名等と引用文献の情報を収録している。分厚い電話帳みたいな索引であった。当時からオンラインでのサービスもやっていたかと思うが学生には公開されていなかったか、いたとしてもとてつもなく高額(学生にとっては)だったので利用した記憶がない。
ある論文を起点にそれが引用している論文(過去の論文)とそれを引用している論文(その論文にとっての未来の論文)を集めていく。論文には最後に引用している論文が記されているので、それを手繰っていけば過去の論文にどんどんたどり着ける。重複もあるので3世代くらい戻ってみた。
Citatin Indexを利用して、その論文を引用している論文も集める。例えばAという論文が1971年に書かれたとして、それを引用している1975年の論文などなどを集めていく。これはある論文を起点に未来へと行く道である。重要な論文は多くの論文から引用されている。これを手作業で、100件くらいやっていくと、研究の潮流というか、どのような研究が多くの研究者の注目を集め、どのような方向へ向かおうとしているかが論文を読まなくても見えてくる。
わたしは関係データベースを修論のテーマにしていて上記の方法で図書館で論文をせっせとコピーしては、模造紙にポストイットでどの論文がどれを引用し、どれに引用されているかの線を描いていた。関係データベースの理論的な提案はIBMのE.F. Coddの「A relational model of data for large shared data banks」Communications of the ACM, 1970から始まるわけであるが、上記のグラフと言うか樹木図を見ていると、それから始まった理論的研究(~正規形という提案)、実装の研究(IBMのSystem RとかUCBのIngres等)、データモデルなどなどの潮流がはっきりと見て取れる。
図書館でひたすらコピーをしまくったわけであるが、当然玉石混合というと語弊があるが自分の研究に直接関係ない論文も沢山含まれている。で100も200もコピーはしたが、実はほとんどコピーだけに終わっていて、その関連図をみていれば読まずに論文の重要性というのが浮き彫りになってくる。多くの論文はコピーしただけで読まずにすませるのである。
しかし、各論文の立ち位置は手書きの樹木図で理解しているので、読みもしていない論文(まあ、タイトルとアブストラクトくらいは目を通すが)についても知ったかぶったりできるようになる。
これって、まさにGoogleがWebでやっていることではないか。80年代初頭それを手作業でやって論文サーベイの効率化をはかっていたというお話である。
Google Scholar
http://scholar.google.com/




コメント