OCR im batch?

Dieses Thema im Forum "Software" wurde erstellt von pietschker, 3. Dezember 2005.

  1. pietschker

    pietschker New Member

    Ich habe das Problem, ca. 80.000 gescannte Texte (mit jeweils sehr wenig Text, englisch oder numerisch) durch eine Texterkennung zu jagen. Meine Fragen:
    - Kennt jemand für MacOS 10.4 eine OCR-Software, die man aus Darwin oder per Applescript aufrufen kann, so dass ich mir eine batch-loop schreiben könnte? Ich brauche nichts weiter als "Erkenne Bilddatei... schreibe in Textdatei...", alles andere ist leicht hinzukriegen.
    - ABBYY FineReader 5 SprintXE kann angeblich per AppleScript aufgerufen werden (die scripting suite wird vom Skripteditor jedenfalls erkannt), aber ich kriege kein Skript zum Laufen. Hat jemand das schon mal geschafft? ABBYY leugnet alles :)

    Vielen Dank vorab!
    Lutz Pietschker
     
  2. mac123franz

    mac123franz New Member

    …

    OCR am Mac ist ein leidiges Thema.
    Schau Dir mal die Programme OMNIPAGE Pro und ReadIris an.
    Wenn die sauber unter 10.4 laufen, könnte man z.B. auch mit Automator
    einen gewissen Ablauf hinkriegen.
    In welchem Format sollen denn die Dateien anschließend
    vorliegen? Das zu wissen wäre das wichtigste Kriterium für
    eine konkretere Empfehlung.


    …
     
  3. mac123franz

    mac123franz New Member

  4. pietschker

    pietschker New Member

    Reiner Text ASCII-7bit genügt. Die von Dir angesprochenen Programme sind die, die ich bereits probiert bzw. im Text erwähnt habe. ReadIris 11 hat gar keine batch-Unterstützung, bei Omnipage ist auf den Produktinfoseiten auch nicht die Rede davon. ReadIris 11 ist auch interaktiv großer Mist, so wird z.B. ohne TextRahmen gar nichts erkannt. Der Automator bringt natürlich nichts, wenn die Erkennungsbefehle nicht skriptfähig sind.
     
  5. kringo

    kringo New Member


    ...Das ist ja nur für windoof...
     

Diese Seite empfehlen