OCR zu TXT

Fehlerberichte, Hilfe und Anregungen für FlexiPDF 2017

Moderator: SoftMaker Team

Antworten
drahreg
Beiträge: 9
Registriert: 10.02.2019 02:38:06

OCR zu TXT

Beitrag von drahreg » 26.02.2019 02:22:40

Hi,

ich habe ein PDF Dokument, welches ich mit dem OCR Tool bearbeitet habe. Das Ergebnis würde ich gerne als txt Datei abspeichern, damit ich es in einem anderen Programm weiterbearbeiten kann.

Wenn ich auf „Dokument > Übersetzen > Exportieren“ gehe, kann ich zwar „txt“ auswählen, aber ich bekomme quasi einen Text für eine html Seite (diverse < > Elemente und Umlaute sind mit dem typischen HTML Umschreibungen), z.B.:
<S><P1><F0>&quot;m<S><P2><F0>Hier steht Text<S><S><S><P5><F1>
So ist das für mich unbrauchbar.

Daher meine Frage, was muss ich machen, um den Text, welcher mit dem OCR Tool von FlexiPDF 2017 Pro erkannt wurde, als simple Textdatei (ohne Steuerzeichen, mit Umlauten etc.) zu exportieren?

Wenn Ihr jetzt sagt, dass das nur als .doc oder .docx zu exportieren geht, nehme ich das auch. Hauptsache, es ist möglich.

In der Anwendung und im Handbuch bin ich noch nicht fündig geworden. So eine grundlegende Funktion kann in einem professionellen Tool ja nicht fehlen, oder?

Leider funktioniert [STRG] + [A] nicht. Sonst hätte ich den Text einfach kopiert. Es handelt sicht übrigens um 18 Seiten und es werden weitere, größere Dokumente folgen. Eine Lösung, bei der ich jede Seite einmal per Hand „anfassen“ muss, ist für mich keine Lösung.

Unter „Datei > Exportieren“ steht mit nur „HTML 3...“ zur Verfügung.
Unter „Datei > Speichern unter“ steht mir nur „*.pdf “ zur Verfügung.

Grüße,
Drahreg

Kuno
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2605
Registriert: 02.03.2004 12:31:01
Wohnort: Osnabrück

Re: OCR zu TXT

Beitrag von Kuno » 26.02.2019 09:56:42

War denn im Dialog Exportformat in den Reitern Text und Html auch alles ausgehakt und Bilder abgewählt?
Zumindest mit das Welcome-Pdf von Flexi lässt sich so als Textdatei ohne Steuerzeichen exportieren.
2019-02-26--1551171329_1680x1050_scrot.png
2019-02-26--1551171329_1680x1050_scrot.png (81.59 KiB) 290 mal betrachtet
EDIT: Ich seh gerade, die Frage bezieht sich auf FlexiPDF 2017. Mein Test aber auf Flexi 2019... :oops:
Sorry...

EDIT2: Bei mir klappts mit FlexiPDF2017 aber auch:
Flx2017_txt.png
Flx2017_txt.png (593.26 KiB) 283 mal betrachtet
Systeme
Home: Core2Duo T9600 @ 2.80GHz 4Gb Ram - Intel GM45 - Mesa 19.1.2-1
Debian Sid/Unstable Openbox - Linux 5.2.0-8.1-liquorix-amd64
--------------------------------------------------------
Office: Core2Duo P8700 @ 2.53GHz 4Gb Ram - Intel GM45 - Mesa 19.1.2-1
Debian Buster Openbox - Linux 5.2.0-8.1-liquorix-amd64

drahreg
Beiträge: 9
Registriert: 10.02.2019 02:38:06

Re: OCR zu TXT

Beitrag von drahreg » 26.02.2019 23:15:23

Hi,

danke, jetzt habe ich es auch gefunden :oops:
War wohl doch zu wenig Schlaf in letzter Zeit :) Ich habe diesem "Format" Button nicht gesehen. irgendwie hatte ich erwartet, dass das Format im Speichern-Dialog ausgewählt wird.

BR,
Drahreg

Antworten

Zurück zu „FlexiPDF 2017“