Probleme mit der OCR-Korrektur

Antworten
BuSchu
Beiträge: 24
Registriert: 10.01.2018 14:40:14
Wohnort: Raum Karlsruhe

Probleme mit der OCR-Korrektur

Beitrag von BuSchu »

Ich habe heute begonnen, ein altes Familienbuch zu scannen, so dass eine durchsuchbare PDF-Datei entsteht. Bei der OCR-Korrektur gibt es m.E. noch einiges zu verbessern. Ich habe in einem Absatz etwas zu viel gelöscht und wollte dann die Änderungen rückgängig machen, was aber nicht ganz gelang. Jetzt habe ich einen Zustand, der sehr kaputt aussieht und ich weiß nicht mehr weiter. Ich möchte auch nicht die bisherige Arbeit verlieren. Vielleicht zeigt der Screenshot, wie verfahren die Situation jetzt ist.
Nach "Ermittelten" geht es mit "Die äußere Einrichtung" weiter, aber dann steht nachfolgender Text auf einmal darüber.
Wie kann man denn diese Situation bereinigen?
Dateianhänge
Problem Fleixipdf.jpg
Problem Fleixipdf.jpg (78.32 KiB) 597 mal betrachtet
BuSchu
Beiträge: 24
Registriert: 10.01.2018 14:40:14
Wohnort: Raum Karlsruhe

Re: Probleme mit der OCR-Korrektur

Beitrag von BuSchu »

Ich habe jetzt noch ein bisschen experimentiert und eine Seite mit NAPS2 gescannt. Das Ergebnis habe ich mit Sumatra untersucht: Die OCR hat gute Arbeit geleistet. Aber wenn ich die Datei in FlexiPDF 2022 öffne und den Text bearbeiten will, wird er mir gar nicht angezeigt. Der Inhalt der Datei wird nach dem Starten des OCR-Modus verblasst angezeigt, aber der Text erscheint nicht. Schade!
BuSchu
Beiträge: 24
Registriert: 10.01.2018 14:40:14
Wohnort: Raum Karlsruhe

Re: Probleme mit der OCR-Korrektur

Beitrag von BuSchu »

Ich bin inzwischen davon abgekommen, möglichst viel in FlexiPDF zu machen. Ich mache jetzt nur noch die Korrektur in FlexiPDF. Das klappt einigermaßen, aber an einer Stelle habe ich mir jetzt die Zähne ausgebissen. In der angehängten Datei steht in der 3. Zeile "Pratane b/Wittenberg". Leider hat die OCR daraus "Pratane b/Wit tenberg" daraus gemacht, wobei mir nicht klar ist, warum das überflüssige Leerzeichen nicht dargestellt wird und nicht gelöscht werden kann. Ich habe es jetzt doch mit der Rechtschreibkorrektur geschafft: tenberg durch nichts ersetzt und dann Wit durch Wittenberg.
Der Editor ist aber sehr störrisch. Ich brauche immer etliche Anläufe, bis ich etwas löschen kann. Das sollte dringend verbessert werden. Sollte so rund laufen wie bei einem normalen Editor. Ich verstehe oft gar nicht, warum ich es nun geschafft habe, eine Korrektur anzubringen. Was gibt's denn da für Tricks?
Dateianhänge
Helene.pdf
(423.42 KiB) 55-mal heruntergeladen
BuSchu
Beiträge: 24
Registriert: 10.01.2018 14:40:14
Wohnort: Raum Karlsruhe

Re: Probleme mit der OCR-Korrektur

Beitrag von BuSchu »

Die Erfahrung mit dem Editor ist wirklich nicht schön. Mal kann man nach zweimal klicken in ein Textfeld Änderungen machen, manchmal braucht es 3 Klicks.
FFF
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2372
Registriert: 11.06.2013 22:30:18

Re: Probleme mit der OCR-Korrektur

Beitrag von FFF »

Habe das Dokument runtergeladen, mit Flexi V3.07 geöffnet. Beim Klicken im Text kam der Hinweis auf verborgenen OCR-Text, den man mit dem OCR-Korrekturwerkzeug bearbeiten solle. Das findet sich zwar unter "Seiten", nicht unter "Dokument" wie im Tipp angegeben, aber wenn ich damit die Zeile 3 anklicke, kann ich direkt das Leerzeichen entfernen...
Mit freundlichem Gruß
Karl
SM 2018 rev. 982/0109/64, klassisches Menu @ W8.1/64 /Deutsch/Deutsch // emC 7
SM 2024NX Nightly, klassisches Menu
16GB Ram; Core i5-3450 mit integriertem Intel HDGraphics 4000, Treiber 10.18.10.4276; Samsung SSD 840pro
2560x1440 Monitor 100% Darstellungsgröße /// LaserJet 1200 per USB via Fritzbox 6591.
Empfehlung für supereinfache Bildschirmvideos: https://www.screentogif.com/
Antworten

Zurück zu „FlexiPDF 2022 für Windows“