Kostenlos Dokumente zu PDFs scannen – einfach, kostenlos und lokal auf dem Gerät

Conena · 21.03.2024

Hallo liebe Android Gemeinde,

seit geraumer Zeit stört es mich, dass es zwar eine Vielzahl an Dokumenten-Scan Apps für Android gibt, jedoch keine, die einfach, kostengünstig und ohne lästige Accounterstellung arbeitet und dabei sämtliche Verarbeitungsvorgänge lokal durchführt.
Nach der kürzlichen Erweiterung des Machine Learning Kits für Android, sah ich die Gelegenheit, eine App zu entwickeln, die genau diese Anforderungen erfüllt.

Warum solltet Ihr einen Blick auf die App werfen?

Kostenfrei
Benutzerfreundlich
Zeitgemäßes Design (Material 3/You)
Kein Account erforderlich
Keine Werbung
Keine fragwürdigen Berechtigungen
100% lokale Verarbeitung auf dem Gerät
Nachbearbeitungsmöglichkeiten (z.B. Entfernen von Schatten)
Geringe Installationsgröße

Systemanforderungen

Android 5.1+
Mindestens 1,7 GB RAM
Aktuelle Google Play Dienste (für die Nutzung des ML-Kits)

Zielgruppe

Die App richtet sich an Gelegenheitsnutzer, und während es sicherlich Apps gibt, die bessere Ergebnisse liefern, verlangen sie in der Regel einen nicht unerheblichen Preis – sei es in Form von Geld oder Daten. Mein Ziel ist es nicht, mit diesen Apps zu konkurrieren, sondern eine Lösung für den durchschnittlichen Anwender (wie mich selbst) anzubieten.

Feedback

Ich bin offen für euer Feedback und Verbesserungsvorschläge. Beachtet bitte, dass ich am Scanverhalten und den Nachbearbeitungsoptionen nichts ändern werde, da ich hier vollständig auf das ML-Kit von Google setze. Andernfalls wären die Entwicklungskosten zu hoch, um die App kostenlos anzubieten.

Download

Die App kann hier heruntergeladen werden. Sie wurde erst vor zwei Tagen veröffentlicht, daher ist es durchaus möglich, dass noch der ein oder andere Bug vorhanden ist (ich konnte sie aufgrund der Hardwareanforderungen nur auf Android 7 und höher testen, da mir kein Gerät mit 1,7 GB RAM und einer älteren Android-Version zur Verfügung steht). Ich freue mich auf euer Feedback!

Bilder

orgshooter · 21.03.2024

Erster Eindruck:
Leicht zu bedienen und trackingfrei in der aktuellen Version 1.2.2 εxodus.
Wird weiter probiert

Beiträge automatisch zusammengeführt: 21.03.2024

In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?

Conena · 21.03.2024

orgshooter schrieb:
In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?

Wenn du nur PDF wählst, erhält die App nur das fertige PDF. Die Umwandlung geschieht systemseitig (ebenfalls über das ML-Kit was auf allen aktuellen Geräten installiert ist). Wo der systemseitige Cache angesiedelt ist, ist ein Implementierung Detail welches nicht dokumentiert ist. Bei den anderen Optionen wird der Standard Cache Folder der App verwendet. Der App Cache wird von Zeit zu Zeit gelöscht, ich werde es in einem kommenden Update so umgestalten, dass er nach jedem Scan gelöscht wird. Wenn du auf die Bilder Zugriff haben möchtest, wähle „PDF & Image“.

holms · 22.03.2024

@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?

orgshooter · 22.03.2024

Conena schrieb:
Der App Cache wird von Zeit zu Zeit gelöscht,

Das ist die Antwort die ich hören wollte.
Bei bspw. Genious Scan (oder den früher verwendeten CamScanner) bläht sich mit der Zeit "der Cache" auf, was ich nervig finde.

DOT2010 · 22.03.2024

@holms War da neulich nicht was von Google wegen OCR beim scannen, das man dies in der Cloud dann redy hat?

holms · 22.03.2024

@DOT2010 Es gibt diverse Möglichkeiten für OCR. Wir haben sogar einen Thread dazu mit Vergleichen.

Meine Frage bezog sich auf die App, um die es hier im Thread geht.

orgshooter · 22.03.2024

@holms nein, aktuell noch kein OCR an Board.

Conena · 22.03.2024

holms schrieb:
@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?

Ich verstehe deinen Punkt. Aktuell wird es nicht unterstützt und ich habe auch Zweifel inwieweit sich das technisch - mit vertretbarem Aufwand - On-Device umsetzen lässt ohne viele ältere/günstigere Geräte auszuschließen. Ich habe vor etwa zwei Jahren mal mit On-Device OCR experimentiert und war von den Ergebnissen nicht sonderlich angetan. Sollte mir mal langweilig sein und ich eine Herausforderung suchen, schaue ich mir das nochmal an

holms · 23.03.2024

@Conena Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).

Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.

orgshooter · 23.03.2024

Textbasierte PDF-Dateien sind schon gut, wenn es funktioniert.
Wenn nicht, dann gebe ich mich auch mit einem guten bildbasiertem PDF zufrieden.

@Conena
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?

DOT2010 · 23.03.2024

@holms Kommt auf den Anwendungszweck drauf an. Nicht jeder braucht durchsuchbare Dateien.

braindealer · 23.03.2024

Ich werde mir das mal in kombi mit Paperless-ngx anschauen.

Conena · 24.03.2024

holms schrieb:
Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).

Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.

holms schrieb:
Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.

Wie @orgshooter und @DOT2010 zutreffend sagen, gibt es unterschiedliche Anwendungszwecke. Ich komme seit Jahren mit einem einfachen Scanner zu Recht. Ich werde mit der App nie alle glücklich machen können, das ist aber auch nicht mein Ziel. Soll immer eine minimalistische App für schnelle Scans sein, wenn man eben mal keinen Scanner zur Hand hat.

orgshooter schrieb:
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?

Aktuell bietet die App alles was das ML-Kit zur Dokumentenbearbeitung kann. Es ist noch im Beta Stadium und Google hat angedeutet, das weitere Funktionen nachgeliefert werden. Die Ergebnisse der Schattenentfernung und des Auto Filters finde ich bereits sehr gut. Ich will im Moment keine Nachbearbeitungsfunktionen selbst implementieren. Ausnahmen könnte ich mir vorstellen für Dinge wie PDF-Verschlüsselung oder OCR. Insgesamt will ich erstmal schauen wie gut die App allgemein ankommt und wie hoch das Interesse an einer minimalistischen Lösung in einem übersättigten Markt überhaupt ist.

Update 1.3.0 steht in Kürze zur Verfügung:

Neue Quick Settings Toggle über welche ein Scan gestartet werden kann (analog dem System QR Code Scanner)
Zwei neue Themes
Cache wird direkt nach der Dokumentenerstellung gelöscht
Diverse kleinere Anpassungen

holms · 24.03.2024

Conena schrieb:
Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.

Ich will es gar nicht groß diskutieren, ist ja deine App und alles ok.

Es gibt diverse Apps, die eben z.B. Tesseract erfolgreich einsetzen mit relativ guten Ergebnissen. Natürlich sind Ergebnisse immer von der Qualität der Vorlage abhängig. Und bei dunklem Papier bearbeiten gute Apps natürlich auch Helligkeit und Kontrast, dann geht das mit OCR. Courier als Schriftart ist da kein Problem (wobei ich niemanden kenne, der diese Schriftart noch verwendet

).

Ich denke, es ist angekommen, was ich sagen wollte. Muss man nicht in die Länge ziehen. Wünsche viel Erfolg mit der App!

pueh · 25.04.2024

ist auch eine Veröffentlichung via F-Droid geplant?

Espressojunkie · 25.04.2024

Mal kurz angetestet, erster Eindruck:
- aufgeräumt, simpel
- akzeptable Größe der PDFs, auch in Farbe

Verbesserungsvorschläge:
- die Option ob die App mit "automatischer" oder "manueller" Aufnahme gestartet werden soll (momentan stellt sie sich immer auf "automatisch" zurück)
- der Weißabgleich funktioniert (bei mir) nicht so gut (Blaustich), mit der "automatischen" Verbesserung wird es dann besser, aber noch nicht 100%ig. Getestet an einer schwarz/weiß/grauen Vorlage mit drei farbigen Spots auf einem Holztisch.

v1.30

Conena · 01.05.2024

pueh schrieb:
ist auch eine Veröffentlichung via F-Droid geplant?

Nein, macht außerhalb des Google Play Stores keinen Sinn, da das Google Machine Learning Kit auf dem Gerät vorhanden sein muss. Das ist bei Geräten ohne Google Mobile Services nicht der Fall. Daher stelle ich auch keine APK bereit.

Espressojunkie schrieb:
Mal kurz angetestet, erster Eindruck:
- aufgeräumt, simpel
- akzeptable Größe der PDFs, auch in Farbe

Danke!

Espressojunkie schrieb:
- die Option ob die App mit "automatischer" oder "manueller" Aufnahme gestartet werden soll (momentan stellt sie sich immer auf "automatisch" zurück)

An der Voreinstellung für den Aufnahmemodus kann ich aktuell leider nichts ändern. Du musst dir das so vorstellen, dass das Scanning an sich eine Systemkomponente ist, welche ich konfigurieren, aber nicht grundsätzlich verändern kann. Das Ganze steckt auch noch im Beta Stadium und diese App war - soweit ich weiß – die erste Nicht-Google App im Play Store die diese neue Komponente nutzt.

Espressojunkie schrieb:
- der Weißabgleich funktioniert (bei mir) nicht so gut (Blaustich), mit der "automatischen" Verbesserung wird es dann besser, aber noch nicht 100%ig. Getestet an einer schwarz/weiß/grauen Vorlage mit drei farbigen Spots auf einem Holztisch.

Im Grundsatz gilt das gleiche wie oben beschrieben. Nachbearbeitung ist aktuell rein ML-Kit und geräteabhängig. Finde es z.B. auf dem Pixel 6a deutlich besser als auf einem Galaxy A25. Ich gehe davon aus, dass Google hier in Zukunft weiter nachbessern wird, und die App dann automatisch davon profitiert.

DOT2010 · 02.05.2024

Hier mal was zum Testen: wäre vielleicht für den ein oder anderen als Vergleich interessant. Der Druckerchannel testet mit diesen Vorlagen seit geraumer Zeit die Geräte.

Beiträge automatisch zusammengeführt: 02.05.2024

Hab grad n Test mit einigen der Testseiten am PC-Bildschirm (hochkannt 22" 1050 x 1680) gemacht. Hierfür hab ich mal diese verwendet:

Was mir aufgefallen ist:

ein Foto vom Bildschirm bei der Bearbeitung: 2 Probleme

Der Scanner erkennt nicht sauber die Flächen (vor allem wenn diese, siehe oben rechts) schwarz auf schwarz (hard-mode) sind. Aber auch bei weiß abgegrenztem Bereich zu schwarz tut sich dieser immer wieder schwer bis sehr schwer.
Das Scannen erfolgt immer wieder auf "Automatisch" obwohl ich ihn wie hier grad auf Manuell umgestellt hab. Die nächste Seite im gleichen Dokument stellt wieder auf automatisch um, wieso? Statt sich auf das halten des Gerätes zu konzentrieren muss man rumfingern um es umzustellen. Wer flott genug ist kann aber auch mit der Automatik leben, muss aber unter Umständen je nach Glück mit nicht so sauber eingestellten Randgrenzen (siehe Punkt drüber) leben.

Dokument wird als "Dokument_02_05_2024_17_49.pdf" abgespeichert. Den Namen kann erst nachträglich geändert werden anstatt gleich beim Abspeichern diesen noch zumindest zu ergänzen wenn nicht ganz ab zu ändern.

Was immer wider auffällt und das ist absolutes KO Kriterium, obwohl eigentlich ziemlich mittig und diverse Scans gut zu gebrauchen waren, sind immer wieder Seiten obwohl diese eigentlich sauber aufgenommen wurden auf die Seite also schräg abgeändert als ob man schied drauf schaut. Das ist ein NO GO! Verstehe nicht warum dies so ist. Es sollte ehe umgekehrt verarbeitet werden, was schief aufgenommen soll über Trapezkorrektur wieder passen gemacht werden nicht verunstaltet.

Zumindest kann man direkt wenn die Seite Müll ist sie gleich löschen und neu Probieren.

Tipp bei dieser, zugegebenermaßen schwieriger Situation am Bildschirm mit fortlaufenden Seiten (oben + unten) das diese nicht erkannt werden: geht mit dem Handy näher ran, ideal im manuellen Modus, um die Grenzen der Seiten für die KI besser zu erzwingen. KI ist derzeit einfach noch viel zu unbeholfen hierbei.
Bei einem Bildschirm lässt sich auch ein kleiner Stativ nutzen (wenn man am Gerät selbst keine Screenshots machen kann). Bei Seiten auf dem Tisch braucht man ehe einen etwas anderen Aufbau um die Cam paralell zum Tisch auszurichten auf einer passenden Höhe (möglich mit etwas komplexere Stative mit Auslenkarme). Oder andere Bastellein wie n loch im Tisch/Kiste... teils mit extra Beleuchtung. Kommt wohl auf die Menge der Seiten die man so verarbeiten will/muss, unter Umständen lohnt gar ein Einzugsscanner (nicht bei Büchern da braucht man ein Flachbettscanner und auch da gibt es teils große Unterschiede).

Im erstellten Testdokument (siehe Anhang, PDF zum downloaden) von mir am Bildschirm aufgenommen war ordentliches Lesen eines Bildes (Seite 13) oben rechts im schwarzen Dreieck die "www.druckerchannel.de" bei "8 Punkt" schluss mit dem leserlichen. Vermute aber das dies bei einem ausgedruckter Variante noch besser geht um vielleich ganze 2 Punkte (also 6 Punkt???). Vielleicht macht mal wer den Test.

renaldo · 16.09.2024

Ich freue mich über den frisch entdeckten minimalistischen Dokumenten Scanner ,vielen Dank Conena .

Leider habe ich Probleme beim "Datei benennen vor dem Scan" auf meinem Huawei P30 Pro ,die Tastatur wird dann verdeckt ,so das ich nicht sehe was ich benennen möchte ...

Ist sicher ne gerätespezifische Sache aber habt Ihr hier dennoch bitte einen Tip für mich ?

mfg renaldo

Kostenlos Dokumente zu PDFs scannen – einfach, kostenlos und lokal auf dem Gerät

Conena

Neues Mitglied

orgshooter

Philosoph

Conena

Neues Mitglied

holms

Inventar

orgshooter

Philosoph

DOT2010

Enthusiast

holms

Inventar

orgshooter

Philosoph

Conena

Neues Mitglied

holms

Inventar

orgshooter

Philosoph

DOT2010

Enthusiast

braindealer

Enthusiast

Conena

Neues Mitglied

holms

Inventar

pueh

Inventar

Espressojunkie

Philosoph

Conena

Neues Mitglied

DOT2010

Enthusiast

Anhänge

renaldo

Erfahrenes Mitglied

Anhänge

Ähnliche Themen