メインメニューをとばして、このページの本文エリアへ

12月10日朝日新聞デジタル朝刊記事一覧へ(朝5時更新)

新着記事一覧へ

このエントリーをはてなブックマークに追加
mixiチェック

デジタルジャーナリズム

PRODUCED BY未来メディアプロジェクト

データジャーナリスト・インタビュー

プログラミング

2014-4-16

立薗理彦さん

候補者の発言を過去までさかのぼって調べられる
ポリタス制作の裏側と政治メディアとしての役割(1/2)
ネオローグ技術部 部長
立薗理彦さん

2013年の参院選と2014年の都知事選で候補者の発言データベースとして公開され、注目を集めた「ポリタス」は、ジャーナリストである津田大介さんが代表取締役をつとめるネオローグが制作している。多数の候補者の発言を過去までさかのぼって収集し、データベース化する作業はどのように行われ、ユーザーに何を提供しようとしたのだろうか。技術面から支える立薗理彦さんにうかがった。

政策などのキーワードで
候補者の発言を検索

ポリタスは、各選挙の候補者の発言を収集し、政策や政治スタンスに関する発言をキーワードで検索することができる発言データベースだ。2014年2月の都知事選では、有識者によるコラムが追加され、投票前に候補者を決めるために関心のある領域の発言を調べたり、有識者の意見を参考にすることができるようになっている。

「経済・産業」「外交」などのトピックがバブル表示される技術は、データをビジュアライズ化するための「d3.js」がネットで共有しているライブラリから採用した。これはニューヨーク・タイムズなども使っているものだ

バブル表示されるトピックは数十個ほどを設定した。画像はポリタスより

トップページから左側の「候補者の政策に関する発言をジャンルごとにチェック!」をクリックすると、上部にキーワードの「バブル」が現われ、バブルをクリックするとそのテーマに関する各候補の発言を時系列で見ることができる。バブルの中の数字とバブルの大きさは、ポリタスに掲載されている発言の数を示しており、どのような話題が争点となっているかがわかる。

立薗さんがデータジャーナリズムを紹介し始めた有料メルマガ「津田大介のメディアの現場」。あまりのボリュームと更新頻度に、読み切れない!と読者から悲鳴がでたという。

ポリタスの構想は、津田さんが2年前くらいに政治に関するメディアを立ち上げたいと考え、一緒にニュースサイト「ナタリー」を立ち上げた経験のある立薗さんに声をかけたことから始まったという。どのようなメディアを作るかを話し合っている中で、情報を可視化するデータジャーナリズムというものが欧米で注目されていることを知った立薗さんは、まず前段階として、津田さんの「メディアの現場」というメールマガジンでデータジャーナリズムの事例を海外中心に紹介し始めた。「40回くらいの連載でデータジャーナリズムを紹介し、1本の事例を紹介するために20本くらいの記事を読んでいるうち、10人に満たない小さな会社でデータを使ったジャーナリズムをやれたら面白いのではないか、と考えました」。

立薗さんたちネオローグが、ポリタスの前にリリースしたサービスには、「ゼゼヒヒ」というインターネット投票サイトがある。自分たちが考えるメディアを、軽い感じでリリースしてみたいと思って始めたそうだ。ニュースメディアなどでは記事に対してコメント欄が付いていることが多いが、関係ない話を延々と書き込む人も多く、データとしてはあまり実用的ではない。自由回答ではなく、意見を選んだ理由を聞く方が、人は語りやすい。ゼゼヒヒでは、意見を選んだ理由を聞くことで、社会問題に対するスタンスや考え方をデータ化して残せるはずだと、立薗さんは考えた。

なんとなく答えたくなる質問が数多く並んでいるゼゼヒヒ

162人の候補者の発言を
公示日から一気にデータベース化

ポリタスの企画は、ニューヨーク・タイムズの「At the National Conventions, the Words They Used」というコンテンツがキッカケとなっている。このコンテンツは、党大会でのオバマ候補とロムニー候補のスピーチをデータベース化し、政策や投票の判断になるような単語をピックアップして、どのような発言をしているかを検索できるようにしているものだ。「発言をバルーンにすることによって、たとえば、オバマ候補は福祉や医療保険制度改革の発言が多く、ロムニー候補はビジネス寄りの発言が多いということがわかり、見せ方として非常に面白いと思いました」。

2013年7月21日の参議院選挙に向けてその4カ月前にプロジェクトを立ち上げたネオローグでは、過去にどのような発言をしているかで候補者がどのような人かがわかるようなデータベースを作ろうと話し合った。「選挙に行く必要があると考えていても、実際には候補者がどのような人であるかはわかりづらい。たとえば、ある有名な候補が以前大臣を勤めていたことなどは知っていても、政策の細かなことまではわかりづらいので、有権者自身が過去の発言を調べてたどっていけるものを作ろうと考えました」。

バルーンとなるキーワードは、神戸大学法学部の品田裕教授から政治に関するチラシを分類した論文(日本政治研究〈第3巻第2号〉選挙公約政策データについて)を借りて、ネオローグで考えたキーワードを付けくわえ、参院選の場合は原発、景気・雇用などの31個のキーワードを設定している。これらのキーワードに沿って、新聞、雑誌、テレビ、書籍、国会発言データベースから各候補者の発言を抜き出し、収集、選別、タグ付け、テキスト整形の4つのプロセスをすべて手作業で行っていった。

しかし、企画自体は4カ月前から始めたものの、候補者は7月4日の公示日まで確定しない。参院選では比例区の候補者のみに絞り、立候補を宣言している候補から発言を集めたが、それでも最終的には162人の候補者が立候補しているため、集めた発言数は1000に及んだ。これらを投票日までの短い期間で一気にデータベース化するのは大変な作業だ。

1回目の参院選ではネットでボランティアを募った。100名くらいの応募があり、ソーシャルなどのオンラインでやり取りしながら作業を進めたが、2回目となる都知事選はボランティアではなく、学生などのアルバイトを雇って事務所で一緒に作業したと明かす。「タグや全体的な整合性などを取るには、顔を突き合わせて作業する必要がありました。人によって、どのタグを付けるかの感覚は微妙に違うため、参院選ではそれらを修正してコントロールするコストが高くなってしまったのです」。このため、都知事選はコアメンバー10名とアルバイト約20名のデータ収集チームで、メンバーごとに候補者を割り当てて、重複を避けて整合性を取りやすいようにした。

注目コンテンツ

  • 写真

    【&BAZAAR】ヒートショック対策に

    タニタの無線温湿度計〈PR〉

  • 写真

    【&TRAVEL】祇園の美しいおもたせ専門店

    京都ゆるり休日さんぽ

  • 写真

    【&M】ビール缶ごと収納できる

    スノーピークの保冷ボトル

  • 写真

    【&w】上間常正@モード

    D&G動画炎上騒動の問題とは

  • 写真

    好書好日滝沢カレンの物語の一歩先へ

    小林多喜二「蟹工船」を超解釈

  • 写真

    WEBRONZA奨学金延滞防ぐ仕組み作りを

    今日の編集長おすすめ記事

  • 写真

    アエラスタイルマガジン“女優”としての思いを語る

    篠原涼子インタビュー

  • 写真

    T JAPAN水田の中に立つデザインホテル

    山形庄内の魅力を五感で堪能!

  • 写真

    GLOBE+「ダバオ暗殺団」実在する?

    フィリピン麻薬対策の影

  • 写真

    sippo変わりやすい猫の気分は4つ

    生存のため切り替え早く?

  • 働き方・就活

  • 転職情報 朝日求人ウェブ