Umwandeln in bearbeitbaren Text (OCR)

Antworten
BuRa
Beiträge: 33
Registriert: 13.10.2006 15:48:22

Umwandeln in bearbeitbaren Text (OCR)

Beitrag von BuRa »

Hallo,
mich würde einmal interessieren, warum nach einer Umwandlung in bearbeitbaren Text (Durchsuchbares Bild) und "Speichern unter..." die neu erzeugte Datei weit über die doppelte Größe zu der Originaldatei hat.
Gibt es da eine technische Ursache, da kommt doch eigentlich nur der erkannte Text dazu?

(Ich habe das mit FineReader verglichen (da funktioniert die OCR zwar besser, aber geschenkt), da ist die neue PDF-Datei nachher sogar kleiner..)

Danke
miguel-c
SoftMaker Team
SoftMaker Team
Beiträge: 1249
Registriert: 05.06.2019 12:04:28

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von miguel-c »

Könnten Sie uns bitte eine dieser Dateien (vorher und nachher) schicken? Danke.
BuRa
Beiträge: 33
Registriert: 13.10.2006 15:48:22

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von BuRa »

Kein Problem, an welche Adresse kann ich die Dateien schicken?
Ich habe das mit meiner Strom-Preisinfo probiert, die ist zwar nicht geheim, muss nun aber auch nicht öffentlich sein.. ;)
miguel-c
SoftMaker Team
SoftMaker Team
Beiträge: 1249
Registriert: 05.06.2019 12:04:28

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von miguel-c »

Bitte senden Sie die Dateien an forum(at)softmaker.de
miguel-c
SoftMaker Team
SoftMaker Team
Beiträge: 1249
Registriert: 05.06.2019 12:04:28

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von miguel-c »

Ich konnte das Problem reproduzieren und habe es den Entwicklern gemeldet.
In der Zwischenzeit können Sie mit den folgenden Einstellungen speichern, um eine 900KB-Datei zu generieren:
reduce_size.png
reduce_size.png (14.14 KiB) 6904 mal betrachtet
BuRa
Beiträge: 33
Registriert: 13.10.2006 15:48:22

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von BuRa »

Ok danke, das bringt schon einiges, in den Resultaten sind so auch nur minimalste Unterschiede feststellbar.
So weit bin ich mit FlexiPDF ja noch nicht vertraut, schön zu wissen, wo man noch "dran drehen" kann. :)
raitis.veksejs
SoftMaker Team
SoftMaker Team
Beiträge: 373
Registriert: 15.09.2017 01:24:39

Re: Umwandeln in bearbeitbaren Text (OCR)

Beitrag von raitis.veksejs »

Das Problem:
Der OCR-Prozess von FlexiPDF führte bisher zu einer erheblichen Vergrößerung der Dateigröße. Die Konvertierungskette (PDF → TIFF → JPEG) verwendete standardmäßig eine hohe JPEG-Qualität (85–91), während Original-PDFs häufig stark komprimiert sind (20–30). Dadurch entstanden größere Dateien, ohne dass die visuelle Qualität entsprechend zunahm.

Die Lösung:
Wir haben dem OCR-Dialogfeld ein Feld „JPEG-Qualität” hinzugefügt, damit Benutzer das Verhältnis zwischen Komprimierung und Qualität selbst bestimmen können.
- Neuer Standardwert: 35 (entspricht meist den Originaldateigrößen gescannter Seiten).
- Anpassung: Nutzer können jeden Wert von 1–100 auswählen.
- Speicherung: Die Software merkt sich die zuletzt verwendete Einstellung auch über Sitzungen hinweg.

Die Verbesserung wird im nächsten Service Pack von FlexiPDF 2025 enthalten sein.
Antworten

Zurück zu „FlexiPDF 2019 für Windows“