PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Texterkennung unter Ubuntu



Lookbehind
23.04.2010, 13:40
Ich suche eine gute Texterkennung.
Also, ich will einen Text, der sich auf Papier befindet, einscannen, und dann mit OpenOffice bearbeiten können, als wäre er direkt darin geschrieben worden.
Nun gibt es hier (http://wiki.ubuntuusers.de/Texterkennung_(OCR)) einige zur Auswahl, allerdings scheinen sie alle unterschiedliche Qualitäten zu haben, und ich hab nicht die Zeit alle durch zu probieren. Hat einer Erfahrungen damit, und kann mir eine gute Texterkennung empfehlen?

TIA
Look

Chris
23.04.2010, 13:57
Cuneiform ist das Beste kostenlose der Genannten, aber eben nur Kommandozeile.
[edit] Sehe gerade, mit YAGF gibts mittlerweile sogar eine GUI dafür.

Lookbehind
23.04.2010, 14:52
Cuneiform ist das beste kostenlose der genannten, aber eben nur Kommandozeile.
[edit] Sehe gerade, mit YAGF gibts mitlerweile sogar eine GUI dafür.
Ok, danke!
Leider gibts weder cuneiform noch YAGF in den Repos. Und mit dem Wiki komm ich grad leider auch nicht so ganz weiter.

Das Archiv entpacken[2] und das Programm kompilieren. Dazu im Terminal[3] in den entstandenen Cuneiform-Linux-Ordner wechseln und dort


mkdir cuneiform-linux-x.x.x
cd cuneiform-linux-x.x.x
cmake -DCMAKE_BUILD_TYPE=relwithdebinfo .. ## Die Punkte und das Leerzeichen davor sind wichtig!

durchführen ("x.x.x" steht dabei für die verwendete Version). Das Programm wird damit mit Optimierungen und Debugging-Symbolen kompiliert, dann normal[4] erstellen und installieren.
Dann normal erstellen und installieren... Hehe... und wie!?
Ich arbeite mich grade durch den Artikel zum Thema kompilieren (http://wiki.ubuntuusers.de/Programme_kompilieren), habe aber das Gefühl, dass ich damit nicht sonderlich weiter kommen werde.

HELP :eek:

Chris
23.04.2010, 15:01
Das (http://www.auxnet.de/blog/blog-post/2009/04/02/cuneiform-und-hocr2pdf-unter-ubuntulinux-installieren-und-einsetzen.html) scheint eine bessere Erklärung zu sein.
Wenn du nicht gerade viele Seiten einscannst und schon irgendein anderes Programm hast das einscannen und das Ganze dann als Grafik ausgeben kann, dann brauchst du nicht unbedingt die GUI.

Lookbehind
23.04.2010, 15:17
Ja, war auch erstmal nur mit cuneiform zu gange... als GUI lässt sich angeblich auch XSane nutzen... das hab ich immerhin schon ;)

Frage zu "sudo make install" ich meine mal irgendwo was auf geschnappt zu haben, dass man da lieber einen anderen Befehl verwenden soll, damit man das später auch wieder sauber deinstallieren kann. Weiß aber nicht mehr welcher das gewesen sein soll, oder ob ich mich da überhaupt richtig erinnere.

Edit: Checkinstall war, was ich meinte. Is damit dann erledigt. Danke!

Edit2: Back to Toppic :)
Leider eignet sich Cuneiform nicht wirklich. Es erkennt lediglich einen einzigen Satz, auf ~2/3 Höhe des Textes, und diesen dann auch noch mit Fehlern ohne Ende. Sogar mit "Spell-Checking German". Das konnte GOCR schon besser. Der hatte zwar auch nicht wenige Fehler drin, konnte aber wenigstens das ganze Blatt erkennen.