fitforlife
Goto Top

OCR mit Adobe Acrobat geht nicht wegen Linien

Ich weiss meine Anfrage gehört nicht wirklich hier hin, aber ich fand keine passendere Kategorie. Mein Problem:

Ich erstelle ein Word Dokument mit einer Linie, speichere das Dokument als pdf und versuche mit Acrobat OCR Texterkennung zu machen. Dabei geht nicht und es kommt eine Fehlermeldung ohne Text.

Hab das Dokument auch schon als pdf gedruckt, oder die Linie als Grafik reingeholt...geht alles zusammen nicht.

Hat jemand eine Idee?

Content-Key: 240625

Url: https://administrator.de/contentid/240625

Printed on: April 19, 2024 at 18:04 o'clock

Mitglied: 108012
108012 Jun 11, 2014 at 19:32:59 (UTC)
Goto Top
Hallo,

Ich weiss meine Anfrage gehört nicht wirklich hier hin, aber ich fand keine passendere
Kategorie. Mein Problem:
Passt doch oder?

Ich erstelle ein Word Dokument mit einer Linie, speichere das Dokument als pdf
Bis hier hin ist für mich alles nachvollziehbar, aber bei dem was danach kommt ist mir
nicht klar was damit bezwecken willst bzw. möchtest.

und versuche mit Acrobat OCR Texterkennung zu machen.
Warum das? Reicht es nicht in Word ein Dokument zu erstellen und es dann als
PDF Datei ab zu speichern?


Dabei geht nicht und es kommt eine Fehlermeldung ohne Text.
Und dürfen wir auch wissen wie was dort steht!?

Hab das Dokument auch schon als pdf gedruckt,
Normaler weise erhalte ich eine ausgedruckte Datei und scanne diese dann
und dann benutze ich eben OCR dafür um den Text zu übersetzen und/oder
richtig darzustellen.

oder die Linie als Grafik reingeholt...geht alles zusammen nicht.
Was sillst Du denn mit der OCR Funktion erreichen?

Gruß
Dobby
Member: Lochkartenstanzer
Lochkartenstanzer Jun 11, 2014 at 20:24:44 (UTC)
Goto Top
Zitat von @FitforLife:

Ich erstelle ein Word Dokument mit einer Linie, speichere das Dokument als pdf und versuche mit Acrobat OCR Texterkennung zu
machen. Dabei geht nicht und es kommt eine Fehlermeldung ohne Text.

Vermutlich beschwert sich das Programm, daß es aus eenr Linie keinen Text machen kann. Oder wie soll man einen Text aus einer Linie edtrahieren?

lks
Member: FitforLife
FitforLife Jun 11, 2014 at 20:27:16 (UTC)
Goto Top
Entschuldige bitte, aber den Sinn brauchst echt nicht hinterfragen. Ich habe das Problem auf eine Linie eingeschränkt und dafür brauch ich eine Lösung. Wenn du dabei behilflich sein kannst, bin ich dir dankbar.
Member: Lochkartenstanzer
Lochkartenstanzer Jun 11, 2014 at 20:32:28 (UTC)
Goto Top
Zitat von @FitforLife:

Entschuldige bitte, aber den Sinn brauchst echt nicht hinterfragen. Ich habe das Problem auf eine Linie eingeschränkt und
dafür brauch ich eine Lösung. Wenn du dabei behilflich sein kannst, bin ich dir dankbar.


dan beschreib das Problem doch genauer. So wie du oben schreibst, hört sich das für mich so an, als ob du eine Linie in ein vermeintlich leeres Dokument mals, das als PDF speicherst udn dich dann wunderst, daß da kein text rauskommt.

  • Welcher Art ist diese Linie?
  • Ändert sich das verhalten, wenn Du diese Linie anders machst?
  • Was passiert, wenn Du ein frisches Dokument erstellt und dort eine Linie hineinmalst?
  • Wie erzeugst Du das PDF?
  • Hasrt Du mal versucht das PDF mit einem andern Programm zu erzeugen?
u.s.w.

lks
Mitglied: 108012
108012 Jun 11, 2014 at 20:40:25 (UTC)
Goto Top
Zitat von @FitforLife:

Entschuldige bitte, aber den Sinn brauchst echt nicht hinterfragen.
Das sehe ich anders und entschuldige das ich Dir helfen wollte!
Frechheit so etwas!

Ich habe das Problem auf eine Linie eingeschränkt und
dafür brauch ich eine Lösung. Wenn du dabei behilflich sein kannst, bin ich dir dankbar.
Dann noch viel Glück damit und viel Erfolg!

Ich klinke mich dann mal aus dem Beitrag hier aus, denn ich empfinde es als eine Frechheit
Informationen erst erfragen zu müssen und sich dafür dann auch noch "anpflaumen"lassen zu müssen.

Gruß
Dobby
Member: FitforLife
FitforLife Jun 12, 2014 at 06:33:44 (UTC)
Goto Top
Der Test: Ein Dokument mit ein paar Buchstaben und einer Linie.
Art der Linie: Es spielt keine Rolle ob es eine Linie aus Word ist oder eine Linie als Bild/jpg erstellt und als Grafik importiert. Hab auch schon ein jpg mit einer Grösse von 1x1 Pixel ausprobiert. Alles gleicher Effekt, sobald eine Linie auf der Seite ist, bricht es die Texterkennung ab.
Linie (oder Gekritzel) mit Freihandzeichnung in Word: Bricht ebenfalls ab.
Erzeugung des PDF: Mit PDF Creator, in Word gespeichert, mit Adobe Drucker...alles gleicher Effekt.

Ist schon klar, dass die OCR in der Linie keinen Buchstaben erkennen kann. Es sollte doch aber möglich sein, dass die Linie einfach übergangen wird und nicht die Texterkennung für die ganze Seite abgebrochen wird.
Member: colinardo
colinardo Jun 12, 2014 updated at 08:50:42 (UTC)
Goto Top
Moin zusammen,
Zitat von @FitforLife:
Der Test: Ein Dokument mit ein paar Buchstaben und einer Linie.
Art der Linie: Es spielt keine Rolle ob es eine Linie aus Word ist oder eine Linie als Bild/jpg erstellt und als Grafik
importiert. Hab auch schon ein jpg mit einer Grösse von 1x1 Pixel ausprobiert. Alles gleicher Effekt, sobald eine Linie auf
der Seite ist, bricht es die Texterkennung ab.
womit wird abgebrochen, wie sieht die Fehlermeldung aus (Screenshot)? Kann das ganze hier in keinster Weise nachstellen, und ich programmiere und mache sonst sehr viel mit Acrobat in dieser Hinsicht. Welche Acrobat Version wird verwendet, alle Updates für Acrobat eingespielt ? OS ?
Vermutlich ist die OCR-Bibliothek beschädigt oder Acrobat hat ein anderes Problem > Reparatur- oder Neuinstallation von Acrobat

Grüße Uwe

p.s. und beherzige doch beim nächsten mal unsere Netiquette. Merci.
Member: FitforLife
FitforLife Jun 12, 2014 at 10:19:14 (UTC)
Goto Top
Es erscheint ein Fenster "Acrobat konnte aus folgendem Grund keine Texterkennung (OCR) für diese Seite durchführen:
Nur steht dort kein Grund.
Mein System: Win 7/64, Acrobat 9, mit allen Updates.
Seh ich das richtig: Wenn du ein leeres Word-Dokument nimmst, ein paar Buchstaben reinschreibst und eine Linie (z.B. Rahmenlinie unter dem Text), daraus ein PDF erzeugst und danach in Acrobat OCR laufen lässt, dann bekommst du keine Fehlermeldung?
Member: colinardo
colinardo Jun 12, 2014 at 10:22:40 (UTC)
Goto Top
Zitat von @FitforLife:
Seh ich das richtig: Wenn du ein leeres Word-Dokument nimmst, ein paar Buchstaben reinschreibst und eine Linie (z.B. Rahmenlinie
unter dem Text), daraus ein PDF erzeugst und danach in Acrobat OCR laufen lässt, dann bekommst du keine Fehlermeldung?
Yip, auch wenn das Reinschreiben von Text Schwachsinn ist, denn dieser liegt nach der Umwandlung ins PDF bereits als Textlayer vor. Wenn, dann ein Bild in dem Text vorhanden ist einbinden ...
Member: FitforLife
FitforLife Jun 12, 2014 at 10:35:40 (UTC)
Goto Top
Ja klar, Bild mit Text und Linie wäre praxisgerechter, aber ändert nix an der Tatsache, dass die Linie den Abbruch verursacht. Dann scheint wirklich was mit meiner Installation nicht zu stimmen. Werde das prüfen. Soweit mal besten Dank.