Bugs beim Übersetzen eines PDFs (war: Übersetzung eines PDFs)

msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Bugs beim Übersetzen eines PDFs (war: Übersetzung eines PDFs)

Beitrag von msteinborn »

Hallo zusammen,

Wir scheiteren leider darin, die Übersetzungsfunktion zu benutzen. Um eine Beispieldatei zu haben, habe ich extra die beigefügte Datei erstellt, damit tritt das Problem exakt genauso auf wie mit dem Dokument, um das es eigentlich geht.

Wir haben schon den OCR darauf gestartet, die Übersetzungsfunktion aufgerufen, erst einen Absatz zum Editieren markiert, die Übersetzungsfnktion aufgerufen und ähnliche Varianten.

Alles erfolglos.

Programm: FlexiPDF NX Universal für Windows Version 3.0.7
Dateianhänge
poem.scanned.2.pdf
(19.28 KiB) 82-mal heruntergeladen
Zuletzt geändert von msteinborn am 01.04.2023 21:33:24, insgesamt 1-mal geändert.
Jossi
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2991
Registriert: 05.12.2003 22:47:22
Wohnort: Lübeck-Travemünde

Re: Übersetzung eines PDFs

Beitrag von Jossi »

Was passiert denn, wenn die Übersetzungsfunktion aufgerufen wird? Ich habe es mehrmals probiert; bei manchen Versuchen klappte die Übersetzung problemlos, bei anderen kam die Fehlermeldung "Unable to get translation languages from the cloud (Couldn't connect to server)". Ich vermute, dass der DeepL-Server da gerade überlastet war. Dann muss man es so lange versuchen, bis es funktioniert.

Das Vorgehen war: Dokument öffnen, Überarbeiten > Automatisch übersetzen aufrufen und in der Dialogbox "German-Deutsch" als Zielsprache auswählen. Absatz markieren ist nicht notwendig, da immer ganze Seiten übersetzt werden. Störend ist, dass die Ebene mit dem übersetzten Text dann vor der Bildebene statt dahinter liegt. Um das zu korrigieren, muss man anschließend Seiten > OCR-Korrekturen > Gesamten Text verbergen aufrufen.
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Jossi hat geschrieben: 29.01.2023 15:25:05 Störend ist, dass die Ebene mit dem übersetzten Text dann vor der Bildebene statt dahinter liegt. Um das zu korrigieren, muss man anschließend Seiten > OCR-Korrekturen > Gesamten Text verbergen aufrufen.
Ich denke, dass ich genau darüber gestolpert bin, ich habe nämlich vom übersetzten Text nichts gesehen - außer gelegentlich mal im Tooltip.

Ich probiere das sofort aus - bei Misserfolg gehe ich Deine Fragen durch.
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Bei dem Dokument sehe ich, wenn ich Dein Vorgehen folge, nach dem Öffnen das Dokument. Ist ja klar und sollte auch so sein. Rufe ich dann direkt Seite üebrsetzen auf, so sehe ich über den Dokument drübergeschrieben den übersetzen Text (?), aber durch das drüberschreiben sehr unleserlich.

Wenn ich anschließend "Seiten > OCR-Korrekturen > Gesamten Text verbergen" aufrufe, ist der übersetzte Text weg und der englische bleibt da. :(
Jossi
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2991
Registriert: 05.12.2003 22:47:22
Wohnort: Lübeck-Travemünde

Re: Übersetzung eines PDFs

Beitrag von Jossi »

Versuch mal, im Ansicht-Ribbon "Platzhalter" auszuwählen. Dann siehst du nur den übersetzten Text (und kannst ihn im OCR-Korrekturmodus bearbeiten).
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Super. Der sieht schon mal vernünftig aus - auch wenn der eigentlich noch Luft hätte nach oben.

Also hat das übersetzen an sich geklappt. Das ist ja schon mal ein gutes Ergebnis.

Das eigentliche Dokument, welches wir übersetzen wollten, ist eine Bedienungsanleitung, die wir leider nicht deutschsprachig erhalten haben. Also sind Texte und Abbildungen gemischt drin. Man müsste jetzt also den gescannten Text genau an den Stellen wegbekommen, wo übersetzter Text ist. Und das Ergebnis wieder als PDF speichern. Allzu schön muss es nicht sein, nur das Ergebnis soll verständlich sein.

Edit: Kann man natürlich simulieren, auf dem PDF-Ausdruck ein Strichmännchen malen - mache ich vielleicht auch heute noch.
Jossi
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2991
Registriert: 05.12.2003 22:47:22
Wohnort: Lübeck-Travemünde

Re: Übersetzung eines PDFs

Beitrag von Jossi »

In welcher Form habt ihr denn das Original bekommen? Als Papierdokument, das ihr selbst eingescannt habt, als gescannte PDF-Datei oder als PDF-Datei, die als Druckvorlage diente? Das ist nämlich ein Riesenunterschied. Während die dritte Variante relativ problemlos wäre, sind gescannte Dokumente ein gewaltiges Problem, denn da liegt natürlich immer das Scanbild als Grafik auf der Seite und der OCR-Text in einer zweiten Ebene unsichtbar darunter. Die automatische Übersetzung in FlexiPDF ist eher für Dokumente gedacht, die mit einer Textverarbeitung wie TextMaker erstellt und von dort als PDF gespeichert wurden. Dort hast du nur die (entsprechend formatierte) Textebene, auf der du den Textinhalt relativ problemlos ändern (hier: übersetzen lassen) kannst, und zusätzlich die Illustrationen (soweit vorhanden) als einzelne Grafikobjekte. Bei einem gescannten Dokument dagegen ist im ungünstigsten (und häufigsten) Fall die gesamte Seite ein einziges Bild, und daran lässt sich nachträglich nicht mehr viel ändern. Die zweite, unsichtbare Textebene darunter braucht man nur für das Durchsuchen und Kopieren, beim Lesen des PDFs hilft die gar nichts.

Ich kenne für dieses Problem keine einfache und praktikable Lösung. Wenn man selbst scannt, könnte man das gescannte Dokument nicht nur als PDF, sondern auch noch als docx speichern (wobei in den OCR-Programmen, die ich kenne und die das können, die Wiedergabe des Layouts meistens sehr bescheiden ist), dann das gespeicherte PDF von FlexiPDF übersetzen lassen, den Text rauskopieren, im docx den Originaltext durch die Übersetzung ersetzen und dann zusehen, wie man das Layout wieder halbwegs hinbekommt. Aber das ist weder arbeitstechnisch noch vom Ergebnis her das Gelbe vom Ei. Alternativ könnte man das übersetzte PDF aus FlexiPDF heraus als TextMaker-Dokument exportieren, aber das bringt hinsichtlich des Layouts auch nur ein sehr unbefriedigendes Ergebnis; insbesondere dann, wenn keine Schriften im PDF eingebettet sind und FlexiPDF für die eigentlich verwendeten Schriften Standardfonts wie Times oder Arial substituieren muss. Und auch bei einfach strukturierten Dokumenten braucht es eine Menge manueller Nacharbeit, weil gerne mal Zeilenumbrüche oder Leerzeichen zwischen Wörtern verschwinden und Ähnliches.

Wenn man öfter vor solchen Aufgaben steht, ist es vermutlich sinnvoller, in ein Abonnement direkt bei DeepL zu investieren (oder, wenn man es nur einmal braucht, in die kostenlose 30-Tage-Testversion). Dort kann man sowohl PDF- als auch docx-Dokumente direkt übersetzen lassen, und soweit ich das mit der kostenlosen Version testen konnte, ist das Resultat optisch deutlich besser als bei der Übersetzung über FlexiPDF. Die kostenlose Version gibt aber nur geschützte PDFs aus, die man nicht bearbeiten kann; dafür benötigt man die Bezahlversion.
Zuletzt geändert von Jossi am 29.01.2023 18:47:11, insgesamt 2-mal geändert.
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Leider Papier. :-(

Und Du hast Recht: Mit einem PDF, welches TextMaker erzeugt hat (selber Inhalt, nur halt nicht ausgedruckt und eingescannt, um das echte Problem nachzumachen) geht es problemlos, so wie man es sich vorstellt.

Auf der anderen Seite hat doch FlexiPDF ein OCR und eine Bearbeitungsfunktion. Beide ergänzen sich ähnlich wie OCR und Übersetzen - nämlich ebenfalls mit dem Layerproblem.

Wenn man wenigstens den Hintergrundlayer in Teile schneiden könnte (achsenparallel für den Anfang wäre besser als gar nichts) und dann einzelne Teile selektiv entfernen. Das wäre doch mal ein Feature, was bei gescannten Dokumenten helfen würde.

Da es nicht schön sein muss, ist es vermutlich das Einfachste, absatzweise entweder den OCR Text per Copy & Paste nach TextMaker zu übernehmen oder halt eine Abbildung per Screenshot. Nicht wirklich schön, aber so müssten wir ja eine PDF erhalten, die üebrsetzbar ist mit FlexiPDF.
Jossi
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2991
Registriert: 05.12.2003 22:47:22
Wohnort: Lübeck-Travemünde

Re: Übersetzung eines PDFs

Beitrag von Jossi »

Das Einfachste wird wirklich sein, du aktivierst die 30-Tage-Testversion von DeepLPro (https://www.deepl.com/de/translator/files?) und wirfst ihnen das gescannte und mit OCR behandelte PDF vor. Alles andere gibt nur ein Gewürge.
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Nicht schlecht, wirklich nicht schlecht. Jedoch hat mir DeepL eine Zeichnung drin auch zerlegt... und Seiten mit nur 2 Zeilen Text eingefügt.

Mal abgesehen davon, dass man natürlich für andere Dokumente Wissen erüben will, ist das Dokument damit durch - die eine Zeichnung kann man schließlich im Original nachschauen.
Jossi
SoftMaker Volunteers
SoftMaker Volunteers
Beiträge: 2991
Registriert: 05.12.2003 22:47:22
Wohnort: Lübeck-Travemünde

Re: Übersetzung eines PDFs

Beitrag von Jossi »

:thumbsup:
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Wir habem jetzt nochmal Probleme mit der Übersetzungsfunktion. Diesmal mit "normalen" PDFs, also nicht gescannten.

Konkret haben wir eine englische Bedienungsanleitung zu einer Software ausschließlich für den Eigengebrauch übersetzen wollen. Das hat auch so weit geklappt, aber 3 Seiten konnten nicht übersetzt werden.

Von zwei Seiten konnte ich den Fehler nachstellen mit einem eigenen Dokument - siehe Anlage. Dazu habe ich mit TextMaker 2021 eine PDF erzeugt und die versucht (ich wollte ja den Fehler nachstellen, also ist die Hoffnung: Solle nicht gehen :-) ), die PDF per Flexipdf zu übersetzen. Das resultiert in einem XML Parsing Fehler.

Falls das - was ich denke - mit dem BEispieldateien perfekt reproduzierbar ist, braucht es nicht mehr allzuviel Erklärung, es scheit jedenfalls ein Problem zu sein, dass er Textinhalt mit XML-Tags verwechseln kann.

Auf einer Seite habe ich jedoch noch einen faszinierenden Fehler, es erscheint einfach eine Fehlermeldungsmessagebox mit leerem Inhalt.
Dateianhänge
fpdfbug.pdf
(81.64 KiB) 71-mal heruntergeladen
fpdfbug.docx
(12.15 KiB) 66-mal heruntergeladen
Zuletzt geändert von msteinborn am 01.04.2023 21:25:05, insgesamt 2-mal geändert.
Benutzeravatar
tobiasfichtner
Beiträge: 275
Registriert: 03.07.2019 16:10:14
Kontaktdaten:

Re: Übersetzung eines PDFs

Beitrag von tobiasfichtner »

Mojn,
msteinborn hat geschrieben: 01.04.2023 18:25:32 Falls das - was ich denke - mit dem BEispieldateien perfekt reproduzierbar ist, braucht es nicht mehr allzuviel Erklärung, es scheit jedenfalls ein Problem zu sein, dass er Textinhalt mit XML-Tags verwechseln kann.
Ein kapitaler Bug, den Sie da gefunden haben.
Wunderschön ;)
wahre kreativität kommt nicht von fleiß
Forum als Feed --> https://forum.softmaker.de/feed.php
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Übersetzung eines PDFs

Beitrag von msteinborn »

Ich bekomme jetzt das zweite Problem auch reproduziert - daher tut das originale PDF (welches ich hätte nur SoftMker geben können) keinen Zweck mehr. Siehe Anhang - einfach wieder übersetzen lassen und sich wundern über das Ergebnis.
Dateianhänge
fpdfbug2.pdf
(86.81 KiB) 72-mal heruntergeladen
fpdfbug2.docx
(12.2 KiB) 57-mal heruntergeladen
msteinborn
Beiträge: 429
Registriert: 28.02.2010 20:15:20

Re: Bugs beim Übersetzen eines PDFs (war: Übersetzung eines PDFs)

Beitrag von msteinborn »

Ich bin gerade etwas überrascht. Außer der Antwort von tobiasfichtner ist ja nichts zu sehen.

Darf ich mal fragen, ob meine Erwartung sich erfüllt und die beiden Probleme mit den Beispieldateien wirklich auch nachstellen lassen?
Antworten

Zurück zu „FlexiPDF 2022 für Windows“