[PR]

 政治家は国会で何を語り、どこからお金を集めているのか――。こうした情報は一般に公開されているが、膨大すぎてわかりにくくなっている。朝日新聞はこれらの情報をデータ分析し、「見える化」した。

 対象としたのは、改選を迎える現職参院議員118人(定数121、欠員3)の国会会議録と政治資金収支報告書。

 会議録は、国立国会図書館の国会会議録検索システムに今年5月31日時点で収録されていた2013年7月21日以降のデータをダウンロードした。グーグルが提供するテキスト分析サービス「Natural Language API」を利用し、会議録から普通・固有名詞を抜き出した。

 分析は、自然言語処理を研究している東京工業大の岡崎直観(なおあき)教授(情報理工学)が考案した手法に基づき、各議員がそれぞれどのような単語(名詞)を顕著に多く用いたのかを調べた。

 例えば、A議員の「日本」という発言について調べる場合、全議員が発した総単語数から「日本」が使われる確率を求める。その確率とA議員が発した総単語数を掛け、A議員が「日本」と言う予測回数を算出する。

 次にA議員が実際に「日本」と発言した回数から、予測回数を差し引く。その差が大きいほど、他の議員より顕著に「日本」と発言したと言える。

 不出馬を表明したアントニオ猪木参院議員(76)の結果をみると、他の議員より顕著に使われていた単語は、日本▽北朝鮮▽話▽元気▽辺▽中国▽大統領▽アメリカ▽人▽ロシア▽世界▽問題▽中▽ブラジル▽次▽質問▽テレビ▽国連▽報道▽対話――だった。

 会議録に記されている会議名や日付、発言している議員本人の氏名、数字のほか、「もの」「ふう」「こと」「ところ」「ゆえ」「ほか」「それぞれ」はあらかじめ除外した。

 政治資金は、改選を迎える議員らが1年間を通して議員をしていた14~17年分の政治資金収支報告書を集計した。4年分の収入合計のほか、収入元を、個人▽法人▽ほか政治団体▽パーティーなど▽交付金▽その他――の六つに分類し、円グラフにした。

こんなニュースも