Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Aus einer PDF den Textinhalt kopieren, um mit Textverarbeitung zu editieren

Frage Microsoft Microsoft Office

Mitglied: panguu

panguu (Level 2) - Jetzt verbinden

12.04.2013 um 10:17 Uhr, 3772 Aufrufe, 4 Kommentare

Hallo miteinander,

wie kann man aus einem eingescannten Dokument, das als PDF gespeichert wird, den Textinhalt auslesen und ihn so in Microsoft Word oder Libreoffice bearbeiten? Ich hab das mal live gesehen, dass jemand eine PDF eingescannt hatte, und als er sie in seinem Programm geöffnet hatte (ich weiß nicht mehr ob es Adobe Reader oder die Vollversion Adobe Professional war), konnte er mit gedrückter linker Maustaste den Text auswählen und kopieren. Diese Erkennung schien wirklich perfekt zu Laufen. Kann das Adobe Reader auch, oder braucht man dazu die Vollversion Adobe Professional? Wer weiß mehr und könnte mich in die richtige Richtung lenken?
Mitglied: nikoatit
12.04.2013, aktualisiert um 10:28 Uhr
Moin,

Adobe Reader kann das nicht.
Aber die Funktion OCR findet man in einigen (auch kostenfreien) Programmen.
Schau mal hier:
http://www.computerbild.de/downloads/office/ocr-software-40243
oder hier:
http://www.heise.de/download/rubrik_21

Gruß
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 10:31 Uhr
Hi Pangu,

Deine Frage ist technisch nicht ganz korrekt.
Aus einer PDF kann man üblicherweise den Text ganz einfach markieren und kopieren. Wenns geschützt ist, dann muss man den Umweg über pdf Creator gehen und ein zweites PDF erzeugen. Deine PDFs haben aber keine Zeichen mehr eingebettet, sondern sind eine Grafik.

Du suchtst aber eine OCR-Software. Optical Character Recognition
Optische Zeichenerkennung.
Dazu gibt es viel Software und vielen Preisklassen ab 0€ aufwärts. Diese erkennen wie ein Mensch die Zeichen aus der Grafik beim Lesen. Somit geht das dann auch mit Fotos ...

Viel Erfolg.
Netman
Bitte warten ..
Mitglied: panguu
12.04.2013 um 11:19 Uhr
@MrNetman: kann ich auch mit AdobeReader den Text rauskopieren aus einer PDF die aus einem eingescannten Dokument entstanden ist? Wenn ja, wie? Ich finde nichts diesbezüglich in der aktuellsten AdobeReader Version. Da gibts ne Möglichkeit Adobe PDFExport zu nutzen, dies ist aber wohl kostenpflichtig.

Gibts denn einen König unter den OCR-Erkenneungsprogrammen, die man sich anschauen sollte? Am liebsten etwas, was ich auch evaluieren/testen könnte. Ich möchte mir sichergehen, dass das auch akzeptabel funktioniert.
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 11:35 Uhr
Gescannte PDFs können keinen Text enthalten. Das sind reine Grafiken.
Aber das rauskopieren von Text kannst du mit anderen PDFs testen.

Es gibt freie OCR Software und etliche Testversionen. Wikipedia hat eine super Seite dazu. http://de.wikipedia.org/wiki/Texterkennung Da sind Grundlagen und Produkte erwähnt.
Bitte warten ..
Ähnliche Inhalte
Neue Wissensbeiträge
Batch & Shell

Batch - ein paar Basics die man kennen sollte

Tipp von Pedant zum Thema Batch & Shell ...

Microsoft

Restrictor: Profi-Schutz für jedes Window

(6)

Tipp von AlFalcone zum Thema Microsoft ...

Batch & Shell

Batch zum Zurücksetzen eines lokalen Profils

Tipp von Mr.Error zum Thema Batch & Shell ...

Heiß diskutierte Inhalte
Windows Server
gelöst Benutzer lässt sich nur an einem Clientcomputer anmelden (17)

Frage von Ammann zum Thema Windows Server ...

Vmware
gelöst Wie würdet Ihr eine ESXi Cluster Farm managen? (11)

Frage von AlFalcone zum Thema Vmware ...

Batch & Shell
gelöst Gruppenzugehörigkeit von AD Usern ermitteln - die Perfektion fehlt (11)

Frage von Stefan007 zum Thema Batch & Shell ...