Kostenlos Dokumente zu PDFs scannen – einfach, kostenlos und lokal auf dem Gerät

  • 22 Antworten
  • Letztes Antwortdatum
Conena

Conena

Neues Mitglied
45
Hallo liebe Android Gemeinde,

seit geraumer Zeit stört es mich, dass es zwar eine Vielzahl an Dokumenten-Scan Apps für Android gibt, jedoch keine, die einfach, kostengünstig und ohne lästige Accounterstellung arbeitet und dabei sämtliche Verarbeitungsvorgänge lokal durchführt.
Nach der kürzlichen Erweiterung des Machine Learning Kits für Android, sah ich die Gelegenheit, eine App zu entwickeln, die genau diese Anforderungen erfüllt.

Warum solltet Ihr einen Blick auf die App werfen?
  • Kostenfrei
  • Benutzerfreundlich
  • Zeitgemäßes Design (Material 3/You)
  • Kein Account erforderlich
  • Keine Werbung
  • Keine fragwürdigen Berechtigungen
  • 100% lokale Verarbeitung auf dem Gerät
  • Nachbearbeitungsmöglichkeiten (z.B. Entfernen von Schatten)
  • Geringe Installationsgröße
Systemanforderungen
  • Android 5.1+
  • Mindestens 1,7 GB RAM
  • Aktuelle Google Play Dienste (für die Nutzung des ML-Kits)
Zielgruppe

Die App richtet sich an Gelegenheitsnutzer, und während es sicherlich Apps gibt, die bessere Ergebnisse liefern, verlangen sie in der Regel einen nicht unerheblichen Preis – sei es in Form von Geld oder Daten. Mein Ziel ist es nicht, mit diesen Apps zu konkurrieren, sondern eine Lösung für den durchschnittlichen Anwender (wie mich selbst) anzubieten.

Feedback

Ich bin offen für euer Feedback und Verbesserungsvorschläge. Beachtet bitte, dass ich am Scanverhalten und den Nachbearbeitungsoptionen nichts ändern werde, da ich hier vollständig auf das ML-Kit von Google setze. Andernfalls wären die Entwicklungskosten zu hoch, um die App kostenlos anzubieten.

Download

Die App kann hier heruntergeladen werden. Sie wurde erst vor zwei Tagen veröffentlicht, daher ist es durchaus möglich, dass noch der ein oder andere Bug vorhanden ist (ich konnte sie aufgrund der Hardwareanforderungen nur auf Android 7 und höher testen, da mir kein Gerät mit 1,7 GB RAM und einer älteren Android-Version zur Verfügung steht). Ich freue mich auf euer Feedback!

Bilder


images_0_30_resized.png
 
  • Danke
Reaktionen: Espressojunkie, Dustman, braindealer und 5 andere
Erster Eindruck:
Leicht zu bedienen und trackingfrei in der aktuellen Version 1.2.2 εxodus.
Wird weiter probiert 😉
Beiträge automatisch zusammengeführt:

In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?
 
Zuletzt bearbeitet:
  • Danke
Reaktionen: pueh, Conena und DOT2010
orgshooter schrieb:
In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?
Wenn du nur PDF wählst, erhält die App nur das fertige PDF. Die Umwandlung geschieht systemseitig (ebenfalls über das ML-Kit was auf allen aktuellen Geräten installiert ist). Wo der systemseitige Cache angesiedelt ist, ist ein Implementierung Detail welches nicht dokumentiert ist. Bei den anderen Optionen wird der Standard Cache Folder der App verwendet. Der App Cache wird von Zeit zu Zeit gelöscht, ich werde es in einem kommenden Update so umgestalten, dass er nach jedem Scan gelöscht wird. Wenn du auf die Bilder Zugriff haben möchtest, wähle „PDF & Image“.
 
  • Danke
Reaktionen: orgshooter
@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?
 
Conena schrieb:
Der App Cache wird von Zeit zu Zeit gelöscht,
Das ist die Antwort die ich hören wollte.
Bei bspw. Genious Scan (oder den früher verwendeten CamScanner) bläht sich mit der Zeit "der Cache" auf, was ich nervig finde.
 
@holms War da neulich nicht was von Google wegen OCR beim scannen, das man dies in der Cloud dann redy hat?
 
@DOT2010 Es gibt diverse Möglichkeiten für OCR. Wir haben sogar einen Thread dazu mit Vergleichen.

Meine Frage bezog sich auf die App, um die es hier im Thread geht.
 
  • Danke
Reaktionen: DOT2010
@holms nein, aktuell noch kein OCR an Board.
 
  • Danke
Reaktionen: holms
holms schrieb:
@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?
Ich verstehe deinen Punkt. Aktuell wird es nicht unterstützt und ich habe auch Zweifel inwieweit sich das technisch - mit vertretbarem Aufwand - On-Device umsetzen lässt ohne viele ältere/günstigere Geräte auszuschließen. Ich habe vor etwa zwei Jahren mal mit On-Device OCR experimentiert und war von den Ergebnissen nicht sonderlich angetan. Sollte mir mal langweilig sein und ich eine Herausforderung suchen, schaue ich mir das nochmal an ;)
 
  • Danke
Reaktionen: holms
@Conena Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).

Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.
 
Zuletzt bearbeitet:
Textbasierte PDF-Dateien sind schon gut, wenn es funktioniert.
Wenn nicht, dann gebe ich mich auch mit einem guten bildbasiertem PDF zufrieden.

@Conena
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?
 
Zuletzt bearbeitet:
@holms Kommt auf den Anwendungszweck drauf an. Nicht jeder braucht durchsuchbare Dateien.
 
Ich werde mir das mal in kombi mit Paperless-ngx anschauen.
 
  • Danke
Reaktionen: Conena
holms schrieb:
Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).
Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.
holms schrieb:
Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.
Wie @orgshooter und @DOT2010 zutreffend sagen, gibt es unterschiedliche Anwendungszwecke. Ich komme seit Jahren mit einem einfachen Scanner zu Recht. Ich werde mit der App nie alle glücklich machen können, das ist aber auch nicht mein Ziel. Soll immer eine minimalistische App für schnelle Scans sein, wenn man eben mal keinen Scanner zur Hand hat.
orgshooter schrieb:
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?
Aktuell bietet die App alles was das ML-Kit zur Dokumentenbearbeitung kann. Es ist noch im Beta Stadium und Google hat angedeutet, das weitere Funktionen nachgeliefert werden. Die Ergebnisse der Schattenentfernung und des Auto Filters finde ich bereits sehr gut. Ich will im Moment keine Nachbearbeitungsfunktionen selbst implementieren. Ausnahmen könnte ich mir vorstellen für Dinge wie PDF-Verschlüsselung oder OCR. Insgesamt will ich erstmal schauen wie gut die App allgemein ankommt und wie hoch das Interesse an einer minimalistischen Lösung in einem übersättigten Markt überhaupt ist.

Update 1.3.0 steht in Kürze zur Verfügung:
  • Neue Quick Settings Toggle über welche ein Scan gestartet werden kann (analog dem System QR Code Scanner)
  • Zwei neue Themes
  • Cache wird direkt nach der Dokumentenerstellung gelöscht
  • Diverse kleinere Anpassungen
 
  • Danke
Reaktionen: Observer, Espressojunkie, Dustman und 4 andere
Conena schrieb:
Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.
Ich will es gar nicht groß diskutieren, ist ja deine App und alles ok.

Es gibt diverse Apps, die eben z.B. Tesseract erfolgreich einsetzen mit relativ guten Ergebnissen. Natürlich sind Ergebnisse immer von der Qualität der Vorlage abhängig. Und bei dunklem Papier bearbeiten gute Apps natürlich auch Helligkeit und Kontrast, dann geht das mit OCR. Courier als Schriftart ist da kein Problem (wobei ich niemanden kenne, der diese Schriftart noch verwendet ;)).

Ich denke, es ist angekommen, was ich sagen wollte. Muss man nicht in die Länge ziehen. Wünsche viel Erfolg mit der App!
 
ist auch eine Veröffentlichung via F-Droid geplant?
 
Mal kurz angetestet, erster Eindruck:
- aufgeräumt, simpel
- akzeptable Größe der PDFs, auch in Farbe

Verbesserungsvorschläge:
- die Option ob die App mit "automatischer" oder "manueller" Aufnahme gestartet werden soll (momentan stellt sie sich immer auf "automatisch" zurück)
- der Weißabgleich funktioniert (bei mir) nicht so gut (Blaustich), mit der "automatischen" Verbesserung wird es dann besser, aber noch nicht 100%ig. Getestet an einer schwarz/weiß/grauen Vorlage mit drei farbigen Spots auf einem Holztisch.

v1.30
 
Zuletzt bearbeitet:
  • Danke
Reaktionen: Conena und DOT2010
pueh schrieb:
ist auch eine Veröffentlichung via F-Droid geplant?
Nein, macht außerhalb des Google Play Stores keinen Sinn, da das Google Machine Learning Kit auf dem Gerät vorhanden sein muss. Das ist bei Geräten ohne Google Mobile Services nicht der Fall. Daher stelle ich auch keine APK bereit.
Espressojunkie schrieb:
Mal kurz angetestet, erster Eindruck:
- aufgeräumt, simpel
- akzeptable Größe der PDFs, auch in Farbe
Danke! :)
Espressojunkie schrieb:
- die Option ob die App mit "automatischer" oder "manueller" Aufnahme gestartet werden soll (momentan stellt sie sich immer auf "automatisch" zurück)
An der Voreinstellung für den Aufnahmemodus kann ich aktuell leider nichts ändern. Du musst dir das so vorstellen, dass das Scanning an sich eine Systemkomponente ist, welche ich konfigurieren, aber nicht grundsätzlich verändern kann. Das Ganze steckt auch noch im Beta Stadium und diese App war - soweit ich weiß – die erste Nicht-Google App im Play Store die diese neue Komponente nutzt.
Espressojunkie schrieb:
- der Weißabgleich funktioniert (bei mir) nicht so gut (Blaustich), mit der "automatischen" Verbesserung wird es dann besser, aber noch nicht 100%ig. Getestet an einer schwarz/weiß/grauen Vorlage mit drei farbigen Spots auf einem Holztisch.
Im Grundsatz gilt das gleiche wie oben beschrieben. Nachbearbeitung ist aktuell rein ML-Kit und geräteabhängig. Finde es z.B. auf dem Pixel 6a deutlich besser als auf einem Galaxy A25. Ich gehe davon aus, dass Google hier in Zukunft weiter nachbessern wird, und die App dann automatisch davon profitiert.
 
  • Danke
Reaktionen: DOT2010 und orgshooter
Hier mal was zum Testen: wäre vielleicht für den ein oder anderen als Vergleich interessant. Der Druckerchannel testet mit diesen Vorlagen seit geraumer Zeit die Geräte.
Beiträge automatisch zusammengeführt:

Hab grad n Test mit einigen der Testseiten am PC-Bildschirm (hochkannt 22" 1050 x 1680) gemacht. Hierfür hab ich mal diese verwendet:
1714665566802.png

Was mir aufgefallen ist:

ein Foto vom Bildschirm bei der Bearbeitung: 2 Probleme
1714665850785.png
Der Scanner erkennt nicht sauber die Flächen (vor allem wenn diese, siehe oben rechts) schwarz auf schwarz (hard-mode) sind. Aber auch bei weiß abgegrenztem Bereich zu schwarz tut sich dieser immer wieder schwer bis sehr schwer.
Das Scannen erfolgt immer wieder auf "Automatisch" obwohl ich ihn wie hier grad auf Manuell umgestellt hab. Die nächste Seite im gleichen Dokument stellt wieder auf automatisch um, wieso? Statt sich auf das halten des Gerätes zu konzentrieren muss man rumfingern um es umzustellen. Wer flott genug ist kann aber auch mit der Automatik leben, muss aber unter Umständen je nach Glück mit nicht so sauber eingestellten Randgrenzen (siehe Punkt drüber) leben.
1714666043615.png

Dokument wird als "Dokument_02_05_2024_17_49.pdf" abgespeichert. Den Namen kann erst nachträglich geändert werden anstatt gleich beim Abspeichern diesen noch zumindest zu ergänzen wenn nicht ganz ab zu ändern.
1714666074726.png

Was immer wider auffällt und das ist absolutes KO Kriterium, obwohl eigentlich ziemlich mittig und diverse Scans gut zu gebrauchen waren, sind immer wieder Seiten obwohl diese eigentlich sauber aufgenommen wurden auf die Seite also schräg abgeändert als ob man schied drauf schaut. Das ist ein NO GO! Verstehe nicht warum dies so ist. Es sollte ehe umgekehrt verarbeitet werden, was schief aufgenommen soll über Trapezkorrektur wieder passen gemacht werden nicht verunstaltet.
1714666347016.png
Zumindest kann man direkt wenn die Seite Müll ist sie gleich löschen und neu Probieren.
1714666953476.png


Tipp bei dieser, zugegebenermaßen schwieriger Situation am Bildschirm mit fortlaufenden Seiten (oben + unten) das diese nicht erkannt werden: geht mit dem Handy näher ran, ideal im manuellen Modus, um die Grenzen der Seiten für die KI besser zu erzwingen. KI ist derzeit einfach noch viel zu unbeholfen hierbei.
Bei einem Bildschirm lässt sich auch ein kleiner Stativ nutzen (wenn man am Gerät selbst keine Screenshots machen kann). Bei Seiten auf dem Tisch braucht man ehe einen etwas anderen Aufbau um die Cam paralell zum Tisch auszurichten auf einer passenden Höhe (möglich mit etwas komplexere Stative mit Auslenkarme). Oder andere Bastellein wie n loch im Tisch/Kiste... teils mit extra Beleuchtung. Kommt wohl auf die Menge der Seiten die man so verarbeiten will/muss, unter Umständen lohnt gar ein Einzugsscanner (nicht bei Büchern da braucht man ein Flachbettscanner und auch da gibt es teils große Unterschiede).
1714667494071.png


Im erstellten Testdokument (siehe Anhang, PDF zum downloaden) von mir am Bildschirm aufgenommen war ordentliches Lesen eines Bildes (Seite 13) oben rechts im schwarzen Dreieck die "www.druckerchannel.de" bei "8 Punkt" schluss mit dem leserlichen. Vermute aber das dies bei einem ausgedruckter Variante noch besser geht um vielleich ganze 2 Punkte (also 6 Punkt???). Vielleicht macht mal wer den Test.
 

Anhänge

  • Dokument_02_05_2024_17_49.pdf
    35,7 MB · Aufrufe: 62
Zuletzt bearbeitet:
Ich freue mich über den frisch entdeckten minimalistischen Dokumenten Scanner ,vielen Dank Conena .

Leider habe ich Probleme beim "Datei benennen vor dem Scan" auf meinem Huawei P30 Pro ,die Tastatur wird dann verdeckt ,so das ich nicht sehe was ich benennen möchte ...

Ist sicher ne gerätespezifische Sache aber habt Ihr hier dennoch bitte einen Tip für mich ?

mfg renaldo
 

Anhänge

  • WhatsApp Image 2024-09-16 at 12.38.46 (1).jpeg
    WhatsApp Image 2024-09-16 at 12.38.46 (1).jpeg
    48,5 KB · Aufrufe: 27
  • WhatsApp Image 2024-09-16 at 12.38.46.jpeg
    WhatsApp Image 2024-09-16 at 12.38.46.jpeg
    61,2 KB · Aufrufe: 30

Ähnliche Themen

koje71
Antworten
0
Aufrufe
393
koje71
koje71
Appento
Antworten
2
Aufrufe
266
Fuhrmann
Fuhrmann
franz04
Antworten
73
Aufrufe
3.858
franz04
franz04
Zurück
Oben Unten