holms
Inventar
- 12.777
Hallo, auf einen Tipp hatte ich mir mal Docutain angesehen, wirkt grundsätzlich nicht schlecht, obwohl mich einige Dinge in der Bedienung stören.
Hier würde ich gern den Blick ausschließlich auf die Qualität der OCR-Funktion richten, vielleicht kriegen wir einige Vergleiche zusammen? Ich fange mal an.
Um Verfälschung durch Kameras zu vermeiden, habe ich als Ausgangspunkt immer diese bewusst mittelgute Bilddatei hier verwendet:
Ich habe nun getestet mit Docutain und Adobe Scan, Ergebnisse hier im Anhang.
Der Text wird erkannt. Aber Probleme gibt es beim Versuch in einem PDF-Reader, exakt Text zu markieren. Versucht als Beispiel, den ersten Satz im langen Absatz zu markieren, also diesen:
"Texterkennung ist deshalb notwendig, weil optische Eingabegeräte (Scanner oder Digitalkameras, aber auch Faxempfänger) als Ergebnis ausschließlich Rastergrafiken liefern können, d. h. in Zeilen und Spalten angeordnete Punkte unterschiedlicher Färbung (Pixel)."
Bei der Datei von Adobe Scan gelingt mir das gut, bei der von Docutain erzeugten Datei nicht gut. Vor allem entspricht die Anzeige nicht überall exakt der Markierung (das merkt man nach dem Kopieren). In anderen Dokumenten hatte ich da noch mehr Probleme, die kann ich aber nicht öffentlich machen.
Ich erinnere mich an ähnliche Probleme mit Scanbot (jetzt: Scan Pro App).
Wie sind eure Erfahrungen - gerne auch mit anderen Apps?
Hier würde ich gern den Blick ausschließlich auf die Qualität der OCR-Funktion richten, vielleicht kriegen wir einige Vergleiche zusammen? Ich fange mal an.
Um Verfälschung durch Kameras zu vermeiden, habe ich als Ausgangspunkt immer diese bewusst mittelgute Bilddatei hier verwendet:
Ich habe nun getestet mit Docutain und Adobe Scan, Ergebnisse hier im Anhang.
Der Text wird erkannt. Aber Probleme gibt es beim Versuch in einem PDF-Reader, exakt Text zu markieren. Versucht als Beispiel, den ersten Satz im langen Absatz zu markieren, also diesen:
"Texterkennung ist deshalb notwendig, weil optische Eingabegeräte (Scanner oder Digitalkameras, aber auch Faxempfänger) als Ergebnis ausschließlich Rastergrafiken liefern können, d. h. in Zeilen und Spalten angeordnete Punkte unterschiedlicher Färbung (Pixel)."
Bei der Datei von Adobe Scan gelingt mir das gut, bei der von Docutain erzeugten Datei nicht gut. Vor allem entspricht die Anzeige nicht überall exakt der Markierung (das merkt man nach dem Kopieren). In anderen Dokumenten hatte ich da noch mehr Probleme, die kann ich aber nicht öffentlich machen.
Ich erinnere mich an ähnliche Probleme mit Scanbot (jetzt: Scan Pro App).
Wie sind eure Erfahrungen - gerne auch mit anderen Apps?