• TOP
  • 明治・大正データベース
130 朝日新聞
朝日新聞創刊130周年記念事業
- 朝日新聞 2008年3月10日掲載 -

明治・大正期の紙面を電子データベース化

 朝日新聞社は創刊130周年記念事業として、明治・大正期の朝日新聞紙面のデータベース化を進めています。完成すると、明治から現代までのすべての記事がパソコンを使って検索、閲覧できるようになります。今回の事業は、文明開化期の1879(明治12)年から、大正デモクラシー期の1926(大正15)年までの紙面が対象です。この半世紀、日本は急速な近代化の道を歩みました。日清、日露戦争、第1次世界大戦などを経て、やがて始まる日中戦争、第2次世界大戦に世の中が傾斜していく時代でもありました。新聞はそうした世の中の動きをたどり、人々の声を伝える記録の宝庫です。データベース事業に監修などで協力する東京大学明治新聞雑誌文庫の運営委員長、北岡伸一法学部教授に明治・大正期の新聞や事業の意義などについて聞きました。

歴史の「生」情報、瞬時に

キーワードを入力→紙面を表示

写真
明治12年(1879年)1月25日付の朝日新聞創刊号

 新聞のデータベース(DB)といっても、利用したことのある読者はまだ少数派かもしれない。
 記事を探す時、マイクロフィルムや縮刷版だと、時間がかかることがある。日付や索引を頼りに探しても、ページをいちいちめくらなければならないからだ。
 膨大な記事データを電子的に蓄積しているDBなら、記事を検索機能を使って即座にパソコンに表示できる。インターネットで情報ページを探す時に、グーグルなどの検索サイトを使う人が多いが、それと同じような使い方だ。
 朝日新聞は1926(昭和元)年以降、東京本社発行の本紙を中心にDB化されている。1985年以降の記事は文字テキスト(電子データ)になっている。それ以前はマイクロフィルムから電子画像化した紙面イメージで見られる。
 朝日新聞創刊130周年記念事業として2010年春までの完成をめざす明治・大正期の約12万3千ページのDBが完成すれば、創刊からの100万ページの記事と一部の広告が検索出来るようになる。

   ◇  ◇

 国内の多くの新聞社のDBは、紙面がコンピューター製作になった1980年代以降の記事を収録している。それ以前は、DBに使える文字テキストがなく、紙面の文字を人手で入力するか、OCR(光学式文字読み取り装置)でテキスト化するしかない。
 しかし、いずれもかなりコストがかかる。旧字体や変体仮名、旧仮名遣い、漢字のルビも障害になる。このため、朝日新聞は84年以前の紙面のDBは全文を電子データとする方法はとっていない。採用したのは、発行日や面数、見出しといった基本的なデータに加え、記事の中心となるテーマや事件名、人名などをキーワードとする方法だ。
 探したい記事で思いつく人名、地名や事件名、分類などを入力すると記事一覧が出る。その中から記事を指定すれば、その記事を含む1ページの紙面が画面に表示される。
 紙面を読んでキーワードなどを選ぶには、新聞や歴史の知識が必要なので、本社の記者OBらに協力を依頼した。150人近くが在宅でパソコンを使って編集している。

   ◇  ◇

 歴史を体系的に検索できるように、キーワードが文中にない記事も、関連記事として呼び出せる配慮もした。担当スタッフが歴史研究者の協力を得ながら、必要な記事に統一キーワードを付けるよう編集作業者に指示している。
 一例を挙げると、「明治14年の政変」「自由民権運動」などは、そうした言葉が記事中になくても、第一報から続報まで、ひとくくりに呼び出すことができる。
 この時期の新聞には、華盛頓(ワシントン)、波蘭(ポーランド)などの外国の地名国名や、代言人(弁護士)、訓導(教諭)といった今では使われない言葉が多い。これらを現代語でも検索できるようにしている。
 昭和以前の紙面DBは、読売新聞が明治から1970年までをCD―ROMやDVD版で刊行している。信濃毎日新聞や日本経済新聞も、主な出来事に限定はしているものの、検索可能な有料紙面DBを提供している。
 新聞は時代を伝える貴重な資料だ。明治・大正期の朝日新聞がDB化されれば、研究者や歴史に関心を持つ人が過去を読み解き、新たな発見や現代を考えるヒントを得る環境が格段に充実する。
 (汲田和久)

東大明治新聞雑誌文庫

写真
約2千タイトルの新聞、約7200タイトルの雑誌を収集する東大明治新聞雑誌文庫の書庫

 大正デモクラシーをリードした吉野作造や在野のジャーナリスト宮武外骨らによって1927(昭和2)年に創設された明治・大正期の新聞雑誌コレクション。特に明治前期の新聞や地方紙は貴重とされる。近代史学者には「宝の山」であり、E・H・ノーマンら外国人研究者や作家三島由紀夫らも利用した。植物学者牧野富太郎が残した植物標本の包み紙だった古新聞も保存されている。現在は東大大学院法学政治学研究科付属近代日本法政史料センターに所属。今回の明治・大正期の朝日新聞データベース事業に監修などで協力している。

有料記事データベースのお問い合わせ
朝日新聞社 法人営業部

電話でのお問い合わせ

03-5541-8689
(土日祝日・年末年始を除く月曜~金曜 10:00~18:00)

PAGE TOP