どこまで情報を保存するか

いい加減、タブブラウザーで大量のページを開いておいて毎日F5を押して更新していたり、RSSリーダーを使うも流し読みしかしない記事が大量にあったり、ソーシャルブックマークを使わなかったり、Webページをスクラップしなかったり、そんなこんなで「どこかで見たことがあるような」というレベルの記事を探すのに時間をかけたりと、旧世代感が漂うような状況から脱するために、私が想像していたのと似ていたこの記事のOtune氏のを参考に環境を作ってみることにしました。
とりあえずの目標は「どこかで見たことがあるような」レベルのキーワードをすぐに、手軽に探せるようにすること。

「とりあえずググる」を卒業!TOPエンジニアの検索術/Tech総研
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s03600.jsp?p=000870&f=sn_rank&__r=1

書いてある通りOtsune氏はMixiやブログの情報をGmailに集約し、「『面白いけれど、常時巡回するほどじゃないかな』というページ」はdel.icio.usに登録しています。
私はソーシャルブックマークは別にブックマークを共有したいわけではないので見送り、ブックマークはブラウザの以外にタグ付けができるGoogleBookmarksを使用。ブックマーク以外にも、今までブックマークしていたのにもかかわらず、ページ自体が消えていたということが多々あったので、「あとで読む」でWebページをスクラップしたのをGmailに送るようにし、Plaggerをインストールして「Bloglines」での記事をGmailに送るように設定。そこまではよかったんです。そこで問題が。
Bloglines」にRSSを配信しているサイトやブログを登録しようとしたのですが、そこで思ったのが友人のブログを登録するか否か。ある友人のブログは主に自分のリアルの身辺のことしか書いてありませんでした。もし、「どこかで見たことがあるような」のレベルのキーワードを探せるようにするのならば、その友人のブログも登録しなければならない。ですが、リアルの身辺のことの情報の価値はほとんどなく、登録すれば検索の精度が下がる危険性もあるわけです。だからといって、その友人はたまに有益な情報を書くので登録しないわけにもいかない。まあ、検索の精度が下がるといっても、検索エンジンの性能はたいそうすばらしいのでたいした問題ではないのでどうでもいいんですけど、一番の問題は容量の問題。
Gmailは現在約2.7GBと大容量ですが、このレベルの内容を保存するには少なすぎます。Webページをスクラップしたり、記事を保存していけば数百MBはすぐいくでしょうし、まして自分のPCの文章までGmailに集約するとしたら、メッセンジャーのログなんかGB単位なのでこれを保存していたら数個のアカウントじゃ足りるわけがない。
そこで、どこまで情報を保存するか、ということになるんですよ。正確には、どこまで情報を蓄積し検索可能な状態にしておくか、ということかな。その辺は情報を取捨選択すればいいのかもしれませんが、その取捨選択する基準をどうするか。「どこかで見たことがあるような」と思うようなはっきりしないレベルだと結構広い範囲までアンテナを広げなければいけないわけで。
で、どうしようかと悩んでBloglinesには一つも登録しておらず、環境移行も中途半端な段階でとまっております。Gmailの容量がもっと増えればいいだけなんですけど。