Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Aus einer PDF den Textinhalt kopieren, um mit Textverarbeitung zu editieren

Frage Microsoft Microsoft Office

Mitglied: panguu

panguu (Level 2) - Jetzt verbinden

12.04.2013 um 10:17 Uhr, 3635 Aufrufe, 4 Kommentare

Hallo miteinander,

wie kann man aus einem eingescannten Dokument, das als PDF gespeichert wird, den Textinhalt auslesen und ihn so in Microsoft Word oder Libreoffice bearbeiten? Ich hab das mal live gesehen, dass jemand eine PDF eingescannt hatte, und als er sie in seinem Programm geöffnet hatte (ich weiß nicht mehr ob es Adobe Reader oder die Vollversion Adobe Professional war), konnte er mit gedrückter linker Maustaste den Text auswählen und kopieren. Diese Erkennung schien wirklich perfekt zu Laufen. Kann das Adobe Reader auch, oder braucht man dazu die Vollversion Adobe Professional? Wer weiß mehr und könnte mich in die richtige Richtung lenken?
Mitglied: nikoatit
12.04.2013, aktualisiert um 10:28 Uhr
Moin,

Adobe Reader kann das nicht.
Aber die Funktion OCR findet man in einigen (auch kostenfreien) Programmen.
Schau mal hier:
http://www.computerbild.de/downloads/office/ocr-software-40243
oder hier:
http://www.heise.de/download/rubrik_21

Gruß
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 10:31 Uhr
Hi Pangu,

Deine Frage ist technisch nicht ganz korrekt.
Aus einer PDF kann man üblicherweise den Text ganz einfach markieren und kopieren. Wenns geschützt ist, dann muss man den Umweg über pdf Creator gehen und ein zweites PDF erzeugen. Deine PDFs haben aber keine Zeichen mehr eingebettet, sondern sind eine Grafik.

Du suchtst aber eine OCR-Software. Optical Character Recognition
Optische Zeichenerkennung.
Dazu gibt es viel Software und vielen Preisklassen ab 0€ aufwärts. Diese erkennen wie ein Mensch die Zeichen aus der Grafik beim Lesen. Somit geht das dann auch mit Fotos ...

Viel Erfolg.
Netman
Bitte warten ..
Mitglied: panguu
12.04.2013 um 11:19 Uhr
@MrNetman: kann ich auch mit AdobeReader den Text rauskopieren aus einer PDF die aus einem eingescannten Dokument entstanden ist? Wenn ja, wie? Ich finde nichts diesbezüglich in der aktuellsten AdobeReader Version. Da gibts ne Möglichkeit Adobe PDFExport zu nutzen, dies ist aber wohl kostenpflichtig.

Gibts denn einen König unter den OCR-Erkenneungsprogrammen, die man sich anschauen sollte? Am liebsten etwas, was ich auch evaluieren/testen könnte. Ich möchte mir sichergehen, dass das auch akzeptabel funktioniert.
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 11:35 Uhr
Gescannte PDFs können keinen Text enthalten. Das sind reine Grafiken.
Aber das rauskopieren von Text kannst du mit anderen PDFs testen.

Es gibt freie OCR Software und etliche Testversionen. Wikipedia hat eine super Seite dazu. http://de.wikipedia.org/wiki/Texterkennung Da sind Grundlagen und Produkte erwähnt.
Bitte warten ..
Neuester Wissensbeitrag
Internet

Unbemerkt - Telekom Netzumschaltung! - BNG - Broadband Network Gateway

(3)

Erfahrungsbericht von ashnod zum Thema Internet ...

Ähnliche Inhalte
VB for Applications
gelöst VBA: Wert von einer Website (pdf-Dokument) auslesen und in Excel kopieren (16)

Frage von Stern123 zum Thema VB for Applications ...

Batch & Shell
Ordner erstellen ll Datei hinein kopieren (1)

Frage von heyalice zum Thema Batch & Shell ...

Sonstige Systeme
PDF-Formulare mit handschriftlicher Unterschrift (19)

Frage von FenjaW zum Thema Sonstige Systeme ...

Heiß diskutierte Inhalte
Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (17)

Frage von JayyyH zum Thema Switche und Hubs ...

Windows Server
Outlook Verbindungsversuch mit Exchange (15)

Frage von xbast1x zum Thema Windows Server ...

DSL, VDSL
DSL-Signal bewerten (14)

Frage von SarekHL zum Thema DSL, VDSL ...