OCR App wanted

  • 9 Antworten
  • Letztes Antwortdatum
N

Naddus

Fortgeschrittenes Mitglied
8
Hallo,

ich habe fürs' Studium (Fernuni Hagen) meine Skripte eingescannt, um sie mit dem ezPdf Reader bearbeiten zu können - sprich Highlights setzen und dann in eine Textdatei exportieren. Mit den Skripten die von Uni Seite aus schon im pdf Format vorliegen, funktioniert das auch wunderbar. Aber bei den Skripten, die ich eingescannt habe nur bedingt, um nicht zu sagen nur sehr sehr bescheiden.

Als ich die Skripte eingescannt habe, habe ich sie anschließend auf dem PC mit PDF Viewer bearbeit, also die OCR Texterkennung drüber laufen lassen. Dann habe ich mir die Skripte aufs Tablet geladen. Mein Problem ist, dass der Text zwar korrekt dargestellt, aber nicht korrekt erkannt wird. Wenn ich bspw. Wörter markiere, dann werden beim Export in die Textdatei einzelne Buchstaben "verschluckt", so dass diese teilweise keinen Sinn mehr ergeben.

Kennt jemand eine gute OCR App, die ich noch einmal über die PDFs' laufen lassen kann, so dass eventuell die Texterkennung verbessert werden kann?

Danke
 
OCR-Erkennungen haben nunmal Fehler. Ggf. müssten sie in einem Lernmodus auf die spezifische Textart angepasst werden; ich hab am PC mit Omnipage gelegentlich juristische Texte gescannt und die Fehlerquote war auch mit "Üben" noch ziemlich mies. Kann mir nicht vorstellen, dass es da auf Android-Basis wirklich etwas besseres gibt.

Du hast wahrscheinlich den graphischen Scan im Vordergrund (sichtbar) und den "erkannten" Text unsichtbar 'dahinter' - das ist zwar am Bildschirm schön lesbar, aber bei einem Textexport blöd (bis unbrauchbar).

Ggf. die Quelldaten nochmal durch eine bessere Texterkennung am PC laufen lassen und zwar nicht in einem vollautomatischen Verfahren, sondern mit manueller Fehlerbeseitigung. Anders kommt man da nicht auf er sehr gute Ergebnisse.
 
  • Danke
Reaktionen: Naddus
Welches Programm wäre denn für den PC empfehlenswert?
 
Naja, ich hatte Omnipage 16 (gab#s dann sogar später mal als Zeitschriftenbeilage) und war damit einigermaßen zufrieden. Normalen Text hat es sehr gut erkannt; Sonderzeichen eben nicht so. Gescannt wurde in reinem S/W mit 300 dpi.
 
  • Danke
Reaktionen: Naddus
Ich hatte schon Omnipage und Finereader. Kein von beiden war besser.
Es kommt noch auf die Fonts etwas an, einige sind wohl besser zu erkennen als andere, darum gibt es wohl auch ein spez OCR Font.

Aber wirklich brauchbar ohne Fehler war es nie. Habe probiert alle Variationen, also Graustufen (war besser) und 1bit schwarz-weiss (war schlechter) und diverse Auflösungen, aber es gab immer noch viele Fehler pro Seite.
 
Dann muss du aus deinen PDFs die Bilder extrahieren und sie durch die OCR der Apps, in dem genannten Thread, jagen ;)
Zum PDFs splitten/Bilder extrahieren müsste es auch Apps im Play Store geben.

Da gibt es nun mal keinen einfachen Weg, OCR ist auch nichts einfaches. Wenn du richtig gute Ergebnisse willst, musst du es schon mit einem gescheiten Programm am PC machen.
 
Ich habe jetzt auch noch Readiris Pro, neuste Version, ist kaum besser als Omnipage und Finereader. Ist etwas schneller, aber scheint noch mehr Fehler zu machen. Ohne intensive Nachbearbeitung nicht verwendbar. Und das bei dem ganzen Rechenpower eines heutigen PC. Auch hier scheint wichtig: Graustufen Scanns geben bessere Resultate als normale schwarz auf weiss Texte.
Kaum vorstellbar dass so was derzeit auf einem Android realisierbar wäre.
 
Es kommt halt immer auf die Vorlage und die Übung an.
Ein sehbeeinträchtigter Bekannter von mir schwört auf den Finereader. Er hat damit sein Studium gemacht, damals waren E-Books noch nicht so verbreitet, alles was es nicht als E-Book gab wurde eingescannt und durch die OCR gejagd. Er hat da natürlich auch die nötige Übung und die OCR Programme sind auch lernfähig, Ergebnisse werde mit der Zeit eben auch besser.
Aber auch dann ist es problematisch, wenn das Layout z.B. nicht einheitlich ist, unterschiedliche Schriftarten verwendet werden, Text und Bilder wildgemischt...
Die Android Apps haben noch einiges vor sich, wenn sie die Qualität eines PC Programms erreichen wollen.
 

Ähnliche Themen

D
  • Daniel Albert
Antworten
3
Aufrufe
447
Daniel Albert
D
S
Antworten
6
Aufrufe
220
hagex
hagex
Rookie19
  • Rookie19
Antworten
8
Aufrufe
430
Rookie19
Rookie19
Zurück
Oben Unten