[140] 2000年 9月16日(土)
「怠惰な完璧主義」
我輩は6年ほど前から文書の電子化を始めた。
それは、我輩の書斎の本が増殖を極め、もはや山積みの下敷きにされた本を開くことが出来ないという状況が背景にある。概して、取れない本ほど読みたい本である。これは「マーフィーの法則」の1つではないかと思う。
「もしパソコン上で本が読めるならば、物理的な制約にとらわれずに本を読むことが出来る。」
これは、我輩の長年の夢であった。
ところが、本をバカ正直に電子化しようとすると、かなりの労力が必要となる。試しに1冊データ化してみたが、半月ほど費やしてしまった。なぜかというと、文字はテキストファイル、写真は画像ファイルと、きちんと分けていたからだ。
文字の部分はOCR(文字認識)ソフトでテキスト化するのだが、誤認識のチェックがまた一苦労。スキャナ作業や文字と写真のレイアウト作業を含めると、膨大な作業量となる。ほとんど、新規に本を作っているのと同じだ。
なぜこのような事態に陥ったのか。それは、我輩の「怠惰な完璧主義」が原因である。
「怠惰な完璧主義」とは、楽をしたいという一心で、実現不可能なくらい完璧なシステムを造り上げようとするものである。この場合、本の電子化によって全文検索や条件検索を行い、迅速かつ正確に目的の文書を呼び出すことを目標にしていた。今まで、必要な本を探し出す苦労にうんざりしていたわけで、これは我輩にとって理想的なシステムとなる。
しかし、全文検索をするためには、文字は全てテキストデータ化しておかねばならない。スキャナで取り込んだだけでは、それは単なる画像に過ぎないからだ。
半月を費やして電子化したその1冊の本は、見事なハンドリングを示した。検索も自由自在であった。
しかし、もう同じような作業は二度とゴメンだ。後でいくら楽になろうとも、これほど労力が必要ならば意味が無い。しかも、本は日に日に増えてゆく。
そこで妥協策として、イメージファイリングをすることにした。イメージファイリングとは、文字も写真もまとめて画像ファイルとして管理すること。つまり、スキャンしたそのままを使うのである。これならば、スキャナ作業だけで済む。文字と写真のレイアウト作業も必要無い。
ただ、我慢しなければいけないのは、全文検索が出来ないことと、データ量が莫大になるということだった。これが妥協点である。
モノは考えようで、検索については書籍自体の目次を見ればなんとかなるし、キーワードを登録すれば書類単位の検索は出来る。フロッピーディスクへの記録をMOやCD−Rにすることでデータ量の問題も克服した。完璧とは言えないまでも、今まで何とかやっている。
さて現在、我輩は似たような状況に直面している。それは、「写真の電子化」である。
以前にも書いたが、写真の取り込みはかなり大変な作業だ。中でも「色の調整」や「ゴミ取り」は、完璧主義の我輩にとっては、いくら時間を掛けても足りない。後で調整しなくてもいいようにと考えれば考えるほど、どんどん時間は掛かってしまう。
これは、文書のテキスト化に似ている。写真は増える一方で、電子化は遅々として進まない。
一時期、フォトCDにするかとも考えた。怠惰な完璧主義であるから、電子化するならば全ての写真を電子化したい。そうすれば、後々便利になる。
しかし、あまりに膨大な写真に、フォトCDへの出費が追いつかないという現実がある。
それならば妥協策として、サムネイル的な画像のみを取り込み、管理だけを電子化するか。画像ファイルとして必要な写真は、使う時にその都度スキャンすることになる。残念だが、仕方がない。
せめて、本当に重要と思われる写真についてのみ、フォトCDにしようかとも思っている。
完璧を望めないというのは分かってはいるが・・・、妥協点を見出すのは、かなり難しい。
|