TOP>情報>情報のストック>紙面>テキスト

 新聞記事のストックはどうされていますか。パソコンやスキャナの性能が高くなった今でも、紙ベースの情報をデジタル化するのはやはり大変です。正直言って、わざわざデジタル化する必要はないのではと思っています。どうしてもデジタル化したいものだけにしておくべきでしょう。
 私の場合は、新聞スキャナ取りを使っています。画像だけでよいのであれば解像度を落としてスキャンすれば速いのですが、記事をテキスト化するためにはこのソフトだけでは出来ません。OCRソフトと併用しています。新聞の場合の問題点は、元の記事のレイアウト・段落によってA4スキャナにうまく収まらない場合があります。その場合は手間でもハサミでカットします。
 手順
  1.OCRの読んでココ!でスキャンする(モノクロ2値なので400DPIでも速い)
  2.OCR処理をする(瞬時に終わるが新聞記事の場合は校正が必要)
  3.スキャンした画像を新聞スキャナ取りに転送
  4.OCRした本文をメモ欄へペースト、表題・索引を入力



ハサミとクリアファイル
 ハサミとクリアファイルでOK。ちゃんと分類わけし、インデックスをつけておけるなら案外楽です。やっかいなのは、裏表に必要な記事があるときですが、そういう時はどちらかはコピーにしましょう。この方法は紙袋やファイルボックスが必要で場所もとりますが、PCに不慣れな方にはこの方法のほうが早いかも。
 この方法でも下記のようにデータを管理した方がいいでしょう。

表題のみをデータベース化する

 以前、私がやっていた方法ですが、新聞に目を通し重要だと思った記事に付箋紙を貼ります。目を通したあと、エクセルに付箋紙の付けた記事の表題と分類、媒体、日付、キーワードだけを入力します。これで完了です。新聞は一定期間はストックしますから、その間であればすぐに記事は引っぱりだせます。廃棄した古い新聞の場合は、縮小版を見ます。(日経新聞の縮小版は購入する方が良いと思います)
 エクセルのデータベースで、分類別の抽出や日付での並べ替えが出来ますので、案外役立つと思います。

結論
 新聞はインターネットよりも大量の記事(情報)があり、新聞はやはり大事な情報源です。ただ、新聞記事であれ、ネットの記事であれ、表題を見ればその内容はほぼ察しが付きます。何も本文が必要とは言えないのです。実際に表題だけんの提供を望む方もおられました。
 どうしても本文が必要な時は、ネットのデータベース入手すればよいのです。表題が分かっているからすぐに取り出せます。無駄な記事の本文に費用をかけることもありません。