2025年2月25日火曜日

OCR【1】

副題:アクションウイザ一ド この正月、3日かけてアクションウイザ一ド処理をしました。 別に千冊ほどあったと思う。 そして、つまり、OCR化する前の画像データという素材が既に備わっていた。 リアル本ではなくデータとしての本という有益さはかなりある。机から動かなくていい。あの本のあそこの記述を確認したい…という症状で作業が中断する。いまはほとんどボタンを押せば画面に現れる。でも5年前は2階まで降りていってリアル本を手にしなければならなかった。その確認作業の時間が長いほど思考が固まらない。めんどうだまた今度にしようとしたあの気持ちの悪さが重なってきっとガンマなんとかの数値が異常値になったのだと思う。 データ本が読み取り可能になれば桁違いにスピードが速くなる。 そのために、夜な夜な別で自炊された本に対し、①まずファイルを開きます。②次にOCR化します。そして③保存してファイルを閉じます。 ②のOCR作業には約10分かかりますので、次のパソコンで①をはじめます。これを待ち時間なく操作し続けるにはパソコン5台必要になります。つまり①②③の操作に各2分かかるのでしょう。4分X5台ですから。 アクションウイザ一ドとは、この①一番アタマのファイルを開く、②OCR作業をする、③終了したら保存してファイルを閉じる、④次の次のファイルを開く、これをフォルダ内のファイルがされるまで繰り返す、という単純だが、ヒトでないとやれそうにない作業を自動でしてくれます。 パソコン万歳! 2分X千冊という時間が削減された。33時間。 2×1,000 =2,000 2,000÷60 =33.333333333333 3日間、72時間。 3×24 =72 72×60 =4,320 4,320÷10 =432 432冊という計算になる。千冊という記憶が疑わしい。 今度、1ペ―ジあたりのOCR時間を計測してみようと思う。

0 件のコメント:

コメントを投稿

OCR【1】

副題:アクションウイザ一ド この正月、3日かけてアクションウイザ一ド処理をしました。 別に千冊ほどあったと思う。 そして、つまり、OCR化する前の画像データという素材が既に備わっていた。 リアル本ではなくデータとしての本という有益さはかなりある。机から動かなくていい。あの本のあ...