Hallo,
mich würde einmal interessieren, warum nach einer Umwandlung in bearbeitbaren Text (Durchsuchbares Bild) und "Speichern unter..." die neu erzeugte Datei weit über die doppelte Größe zu der Originaldatei hat.
Gibt es da eine technische Ursache, da kommt doch eigentlich nur der erkannte Text dazu?
(Ich habe das mit FineReader verglichen (da funktioniert die OCR zwar besser, aber geschenkt), da ist die neue PDF-Datei nachher sogar kleiner..)
Danke
Umwandeln in bearbeitbaren Text (OCR)
Re: Umwandeln in bearbeitbaren Text (OCR)
Könnten Sie uns bitte eine dieser Dateien (vorher und nachher) schicken? Danke.
Re: Umwandeln in bearbeitbaren Text (OCR)
Kein Problem, an welche Adresse kann ich die Dateien schicken?
Ich habe das mit meiner Strom-Preisinfo probiert, die ist zwar nicht geheim, muss nun aber auch nicht öffentlich sein..
Ich habe das mit meiner Strom-Preisinfo probiert, die ist zwar nicht geheim, muss nun aber auch nicht öffentlich sein..
Re: Umwandeln in bearbeitbaren Text (OCR)
Bitte senden Sie die Dateien an forum(at)softmaker.de
Re: Umwandeln in bearbeitbaren Text (OCR)
Ich konnte das Problem reproduzieren und habe es den Entwicklern gemeldet.
In der Zwischenzeit können Sie mit den folgenden Einstellungen speichern, um eine 900KB-Datei zu generieren:
In der Zwischenzeit können Sie mit den folgenden Einstellungen speichern, um eine 900KB-Datei zu generieren:
Re: Umwandeln in bearbeitbaren Text (OCR)
Ok danke, das bringt schon einiges, in den Resultaten sind so auch nur minimalste Unterschiede feststellbar.
So weit bin ich mit FlexiPDF ja noch nicht vertraut, schön zu wissen, wo man noch "dran drehen" kann.
So weit bin ich mit FlexiPDF ja noch nicht vertraut, schön zu wissen, wo man noch "dran drehen" kann.
-
raitis.veksejs
- SoftMaker Team

- Beiträge: 373
- Registriert: 15.09.2017 01:24:39
Re: Umwandeln in bearbeitbaren Text (OCR)
Das Problem:
Der OCR-Prozess von FlexiPDF führte bisher zu einer erheblichen Vergrößerung der Dateigröße. Die Konvertierungskette (PDF → TIFF → JPEG) verwendete standardmäßig eine hohe JPEG-Qualität (85–91), während Original-PDFs häufig stark komprimiert sind (20–30). Dadurch entstanden größere Dateien, ohne dass die visuelle Qualität entsprechend zunahm.
Die Lösung:
Wir haben dem OCR-Dialogfeld ein Feld „JPEG-Qualität” hinzugefügt, damit Benutzer das Verhältnis zwischen Komprimierung und Qualität selbst bestimmen können.
- Neuer Standardwert: 35 (entspricht meist den Originaldateigrößen gescannter Seiten).
- Anpassung: Nutzer können jeden Wert von 1–100 auswählen.
- Speicherung: Die Software merkt sich die zuletzt verwendete Einstellung auch über Sitzungen hinweg.
Die Verbesserung wird im nächsten Service Pack von FlexiPDF 2025 enthalten sein.
Der OCR-Prozess von FlexiPDF führte bisher zu einer erheblichen Vergrößerung der Dateigröße. Die Konvertierungskette (PDF → TIFF → JPEG) verwendete standardmäßig eine hohe JPEG-Qualität (85–91), während Original-PDFs häufig stark komprimiert sind (20–30). Dadurch entstanden größere Dateien, ohne dass die visuelle Qualität entsprechend zunahm.
Die Lösung:
Wir haben dem OCR-Dialogfeld ein Feld „JPEG-Qualität” hinzugefügt, damit Benutzer das Verhältnis zwischen Komprimierung und Qualität selbst bestimmen können.
- Neuer Standardwert: 35 (entspricht meist den Originaldateigrößen gescannter Seiten).
- Anpassung: Nutzer können jeden Wert von 1–100 auswählen.
- Speicherung: Die Software merkt sich die zuletzt verwendete Einstellung auch über Sitzungen hinweg.
Die Verbesserung wird im nächsten Service Pack von FlexiPDF 2025 enthalten sein.