Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Aus einer PDF den Textinhalt kopieren, um mit Textverarbeitung zu editieren

Frage Microsoft Microsoft Office

Mitglied: panguu

panguu (Level 2) - Jetzt verbinden

12.04.2013 um 10:17 Uhr, 3697 Aufrufe, 4 Kommentare

Hallo miteinander,

wie kann man aus einem eingescannten Dokument, das als PDF gespeichert wird, den Textinhalt auslesen und ihn so in Microsoft Word oder Libreoffice bearbeiten? Ich hab das mal live gesehen, dass jemand eine PDF eingescannt hatte, und als er sie in seinem Programm geöffnet hatte (ich weiß nicht mehr ob es Adobe Reader oder die Vollversion Adobe Professional war), konnte er mit gedrückter linker Maustaste den Text auswählen und kopieren. Diese Erkennung schien wirklich perfekt zu Laufen. Kann das Adobe Reader auch, oder braucht man dazu die Vollversion Adobe Professional? Wer weiß mehr und könnte mich in die richtige Richtung lenken?
Mitglied: nikoatit
12.04.2013, aktualisiert um 10:28 Uhr
Moin,

Adobe Reader kann das nicht.
Aber die Funktion OCR findet man in einigen (auch kostenfreien) Programmen.
Schau mal hier:
http://www.computerbild.de/downloads/office/ocr-software-40243
oder hier:
http://www.heise.de/download/rubrik_21

Gruß
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 10:31 Uhr
Hi Pangu,

Deine Frage ist technisch nicht ganz korrekt.
Aus einer PDF kann man üblicherweise den Text ganz einfach markieren und kopieren. Wenns geschützt ist, dann muss man den Umweg über pdf Creator gehen und ein zweites PDF erzeugen. Deine PDFs haben aber keine Zeichen mehr eingebettet, sondern sind eine Grafik.

Du suchtst aber eine OCR-Software. Optical Character Recognition
Optische Zeichenerkennung.
Dazu gibt es viel Software und vielen Preisklassen ab 0€ aufwärts. Diese erkennen wie ein Mensch die Zeichen aus der Grafik beim Lesen. Somit geht das dann auch mit Fotos ...

Viel Erfolg.
Netman
Bitte warten ..
Mitglied: panguu
12.04.2013 um 11:19 Uhr
@MrNetman: kann ich auch mit AdobeReader den Text rauskopieren aus einer PDF die aus einem eingescannten Dokument entstanden ist? Wenn ja, wie? Ich finde nichts diesbezüglich in der aktuellsten AdobeReader Version. Da gibts ne Möglichkeit Adobe PDFExport zu nutzen, dies ist aber wohl kostenpflichtig.

Gibts denn einen König unter den OCR-Erkenneungsprogrammen, die man sich anschauen sollte? Am liebsten etwas, was ich auch evaluieren/testen könnte. Ich möchte mir sichergehen, dass das auch akzeptabel funktioniert.
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 11:35 Uhr
Gescannte PDFs können keinen Text enthalten. Das sind reine Grafiken.
Aber das rauskopieren von Text kannst du mit anderen PDFs testen.

Es gibt freie OCR Software und etliche Testversionen. Wikipedia hat eine super Seite dazu. http://de.wikipedia.org/wiki/Texterkennung Da sind Grundlagen und Produkte erwähnt.
Bitte warten ..
Neuester Wissensbeitrag
Ähnliche Inhalte
VB for Applications
gelöst VBA: Wert von einer Website (pdf-Dokument) auslesen und in Excel kopieren (16)

Frage von Stern123 zum Thema VB for Applications ...

Batch & Shell
gelöst Nach bestimmten Ordner namen suchen und in einem anderem Pfad kopieren (8)

Frage von erdgnrft zum Thema Batch & Shell ...

Visual Studio
Herausfinden, ob PDF farbig oder sw ist (3)

Frage von ahstax zum Thema Visual Studio ...

Heiß diskutierte Inhalte
Switche und Hubs
LAG zwischen Cisco SG300 und Dlink DGS1100 herstellen - wie? (18)

Frage von White-Rabbit2 zum Thema Switche und Hubs ...

Grafikkarten & Monitore
Neue Graifkkarte - kein Bild (10)

Frage von bestelitt zum Thema Grafikkarten & Monitore ...

Linux
gelöst Boot failed: not a bootable disk (10)

Frage von Fleckmen zum Thema Linux ...

Multimedia & Zubehör
gelöst Iphone 6 prob (8)

Frage von jensgebken zum Thema Multimedia & Zubehör ...