現在位置:
  1. asahi.com
  2. ニュース
  3. 特集
  4. 連載・ネットはいま
  5. 記事

〈ネットはいま〉第1部―5 ページの記憶

2008年11月10日14時19分

印刷

ソーシャルブックマーク このエントリをはてなブックマークに追加 Yahoo!ブックマークに登録 このエントリをdel.icio.usに登録 このエントリをlivedoorクリップに登録 このエントリをBuzzurlに登録

写真ソシオセンスの巨大ディスプレーが「ネットの地図」を映し出す=東京・駒場、谷沢隆撮影

 「検索サイトが切り取る情報は、ウェブという全体像の、ごく一部の断面に過ぎません」

 こう話すのは、東京大学生産技術研究所の喜連川優教授。1999年から現在までに公開された日本語のウェブページの大半を収集、規模は約100億ページに及ぶ。

 インターネットは常に変化している。いつの間にか消えるページもあれば、同じアドレスで内容が書き換えられるものもある。喜連川さんの研究室が運営するシステム「ソシオセンス」は、そんなページを含めて、日本語によるネットの過去を丸ごと記憶。過去から現在までの「ネット空間の地図」を、さかのぼったり再び戻ったりしながら、自在に再現できる。

 例えば「テロ」という言葉を使ったページは、2000年まではわずかだった。翌年、9・11米同時多発テロ。その数は爆発的に増加する。アフガニスタン問題、イラク戦争、自衛隊派遣。現実の推移に合わせて、「ネットの地図」もダイナミックに表情を変える。

 グーグルやヤフーなどの検索サイトが提供するのは、主に「今」のネットの姿だ。グーグルは今年7月、収集しているウェブページのアドレスが、1兆個を超えたと公表した。日々数十億の新しいページが増えているという。

 検索サイトのプログラムは、新しいページがないかとさがしながら、常にネット空間の中を動き回っている。見つけたページは、コピーを取って保存。そして後から調べやすいように、インデックス(索引)を作っておく。

 利用者が検索語を入力すると、検索サイトは、まずこの索引から関係のありそうなページの一覧を引き出してくる。そして、重要な順番に並べ替えて結果を表示する。

 グーグルの場合、ページに集まるリンクを他のページからの「投票」とみて、重要度を加味する。重要度の高いページからリンクされれば、そのページの重要度も上がる。「ページランク」という同社の基本技術だ。

 その精度を上げながら、「今」を索引化する検索サイト。一方、「現在のウェブがなぜこうなっているのか。それを理解するには、ウェブの過去を知ることが重要」と喜連川さん。

 新商品が消費者に浸透していく様子、流行語が生まれてから定着する過程。ソシオセンスを操作すると、「情報の生態」が目に見えてくる。「時間の流れを追うことで、人々の考えや振る舞いの成り立ちが、深く理解できる」

 喜連川さんはいう。「ウェブは、人々の営みを映す鏡、社会を知るセンサーなんです」(丹治吉順)

PR情報
検索フォーム
キーワード:


朝日新聞購読のご案内