2025年2月25日火曜日
OCR【1】
副題:アクションウイザ一ド
この正月、3日かけてアクションウイザ一ド処理をしました。
別に千冊ほどあったと思う。
そして、つまり、OCR化する前の画像データという素材が既に備わっていた。
リアル本ではなくデータとしての本という有益さはかなりある。机から動かなくていい。あの本のあそこの記述を確認したい…という症状で作業が中断する。いまはほとんどボタンを押せば画面に現れる。でも5年前は2階まで降りていってリアル本を手にしなければならなかった。その確認作業の時間が長いほど思考が固まらない。めんどうだまた今度にしようとしたあの気持ちの悪さが重なってきっとガンマなんとかの数値が異常値になったのだと思う。
データ本が読み取り可能になれば桁違いにスピードが速くなる。
そのために、夜な夜な別で自炊された本に対し、①まずファイルを開きます。②次にOCR化します。そして③保存してファイルを閉じます。
②のOCR作業には約10分かかりますので、次のパソコンで①をはじめます。これを待ち時間なく操作し続けるにはパソコン5台必要になります。つまり①②③の操作に各2分かかるのでしょう。4分X5台ですから。
アクションウイザ一ドとは、この①一番アタマのファイルを開く、②OCR作業をする、③終了したら保存してファイルを閉じる、④次の次のファイルを開く、これをフォルダ内のファイルがされるまで繰り返す、という単純だが、ヒトでないとやれそうにない作業を自動でしてくれます。
パソコン万歳!
2分X千冊という時間が削減された。33時間。
2×1,000
=2,000
2,000÷60
=33.333333333333
3日間、72時間。
3×24
=72
72×60
=4,320
4,320÷10
=432
432冊という計算になる。千冊という記憶が疑わしい。
今度、1ペ―ジあたりのOCR時間を計測してみようと思う。
登録:
コメントの投稿 (Atom)
OCR【1】
副題:アクションウイザ一ド この正月、3日かけてアクションウイザ一ド処理をしました。 別に千冊ほどあったと思う。 そして、つまり、OCR化する前の画像データという素材が既に備わっていた。 リアル本ではなくデータとしての本という有益さはかなりある。机から動かなくていい。あの本のあ...
-
filebrogと比較するために 【Inazuma Search】を導入。 filebrogと同様に 近接検索ができない。でも 、ぶちこんでおけばあるレベルの仕事をしてくれる。素材が明瞭であれば AIや近接検索がなくてもいいことになる。しかし、30万もある素材を加工するこ...
-
visitたるmskura@msoffice.bizの乱数表 足し算ができる程度で予測可能なシステムにしておく。非公開・機密秘密ではなく拡散や乱用を防止する措置。 1234 2345 3456 4567 5678 6789 機密情報ではないがゲー卜を設けています。 入室にI...
0 件のコメント:
コメントを投稿