Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Aus einer PDF den Textinhalt kopieren, um mit Textverarbeitung zu editieren

Mitglied: panguu

panguu (Level 2) - Jetzt verbinden

12.04.2013 um 10:17 Uhr, 3978 Aufrufe, 4 Kommentare

Hallo miteinander,

wie kann man aus einem eingescannten Dokument, das als PDF gespeichert wird, den Textinhalt auslesen und ihn so in Microsoft Word oder Libreoffice bearbeiten? Ich hab das mal live gesehen, dass jemand eine PDF eingescannt hatte, und als er sie in seinem Programm geöffnet hatte (ich weiß nicht mehr ob es Adobe Reader oder die Vollversion Adobe Professional war), konnte er mit gedrückter linker Maustaste den Text auswählen und kopieren. Diese Erkennung schien wirklich perfekt zu Laufen. Kann das Adobe Reader auch, oder braucht man dazu die Vollversion Adobe Professional? Wer weiß mehr und könnte mich in die richtige Richtung lenken?
Mitglied: nikoatit
12.04.2013, aktualisiert um 10:28 Uhr
Moin,

Adobe Reader kann das nicht.
Aber die Funktion OCR findet man in einigen (auch kostenfreien) Programmen.
Schau mal hier:
http://www.computerbild.de/downloads/office/ocr-software-40243
oder hier:
http://www.heise.de/download/rubrik_21

Gruß
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 10:31 Uhr
Hi Pangu,

Deine Frage ist technisch nicht ganz korrekt.
Aus einer PDF kann man üblicherweise den Text ganz einfach markieren und kopieren. Wenns geschützt ist, dann muss man den Umweg über pdf Creator gehen und ein zweites PDF erzeugen. Deine PDFs haben aber keine Zeichen mehr eingebettet, sondern sind eine Grafik.

Du suchtst aber eine OCR-Software. Optical Character Recognition
Optische Zeichenerkennung.
Dazu gibt es viel Software und vielen Preisklassen ab 0€ aufwärts. Diese erkennen wie ein Mensch die Zeichen aus der Grafik beim Lesen. Somit geht das dann auch mit Fotos ...

Viel Erfolg.
Netman
Bitte warten ..
Mitglied: panguu
12.04.2013 um 11:19 Uhr
@MrNetman: kann ich auch mit AdobeReader den Text rauskopieren aus einer PDF die aus einem eingescannten Dokument entstanden ist? Wenn ja, wie? Ich finde nichts diesbezüglich in der aktuellsten AdobeReader Version. Da gibts ne Möglichkeit Adobe PDFExport zu nutzen, dies ist aber wohl kostenpflichtig.

Gibts denn einen König unter den OCR-Erkenneungsprogrammen, die man sich anschauen sollte? Am liebsten etwas, was ich auch evaluieren/testen könnte. Ich möchte mir sichergehen, dass das auch akzeptabel funktioniert.
Bitte warten ..
Mitglied: MrNetman
12.04.2013 um 11:35 Uhr
Gescannte PDFs können keinen Text enthalten. Das sind reine Grafiken.
Aber das rauskopieren von Text kannst du mit anderen PDFs testen.

Es gibt freie OCR Software und etliche Testversionen. Wikipedia hat eine super Seite dazu. http://de.wikipedia.org/wiki/Texterkennung Da sind Grundlagen und Produkte erwähnt.
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
Batch zum Kopieren von PDF
gelöst Frage von karla123Batch & Shell19 Kommentare

Liebes Forum, ich benötige (als Anfänger) eure Hilfe und hoffe mir kann geholfen werden. Ich habe ein Hauptverzeichnis, ein ...

Microsoft Office

PDF Felder in Excel automatisch kopieren ?

gelöst Frage von mguenth83Microsoft Office1 Kommentar

Hi, ich habe an Euch Profis mal eine Frage da ich ein totale Newbie in Excel bin. Ich habe ...

Entwicklung

PDF-Dateien suchen und kopieren - Spezialfall

Frage von rbpnEntwicklung1 Kommentar

Hallo liebe Administratoren, Entwickler, Spezialisten, ich habe eine Anforderung, mit der ich nicht so wirklich weiß, wie ich damit ...

Windows 10

Win10, "All Apps" editieren

Frage von AtoAtoWindows 105 Kommentare

Hallo Zusammen Gibt es irgendeine Möglichkeit die Icons in „All Apps“ zu entfernen/editieren, die man nicht mehr braucht, weil ...

Neue Wissensbeiträge
Windows 10

Neue Sicherheitslücke in Windows 10 (Version 1709) durch Google öffentlich geworden

Information von kgborn vor 52 MinutenWindows 10

Vor ein paar Tagen haben Googles Sicherheitsforscher vom Projekt Zero eine Sicherheitslücke im Edge-Browser publiziert. Jetzt wurde eine weitere ...

iOS
IOS 11.2.6 verfügbar
Information von sabines vor 6 StundeniOS

Mit dem Update soll der Bug behoben werden, bei dem eine bestimmte Zeichenkette IOS zum Absturz gebracht hat.

Sicherheit
Sicherheitsrisiko: Die Krux mit 7-Zip
Information von kgborn vor 20 StundenSicherheit7 Kommentare

Bei vielen Anwendern ist das Tool 7-Zip zum Entpacken von Archivdateien im Einsatz. Die Software ist kostenlos und steht ...

Internet

Datendealing im WWW Tracking Methoden immer brutaler

Information von sabines vor 1 TagInternet

Interessanter Artikel zum Thema Tracking im WWW und die immer "besseren" Methoden des Trackings. Professor Arvind Narayanan (Princeton-Universität) betreibt ...

Heiß diskutierte Inhalte
Server
Route-Befehl Unterstützung (unter CMD)
gelöst Frage von FKRR56Server38 Kommentare

Guten Tag , i.M. habe ich Probleme über den CMD-Route-Befehl ein Routing auf einen entfernten Server zuzulassen. Der Server ...

Router & Routing
LANCOM VPN CLIENT einrichten
Frage von Finchen961988Router & Routing26 Kommentare

Hallo, ich habe ein Problem und hoffe ihr könnt mir helfen, wir haben einen Kunden der hat einen Speedport ...

LAN, WAN, Wireless
VPN Cisco ASA5505 PaloAlto PA-200
gelöst Frage von YannoschLAN, WAN, Wireless20 Kommentare

Hallo zusammen, ich würde gerne ein Site-to-Site VPN zwischen den beiden Standorten aufbauen. PaloAlto PA200 Internetanschluss Deutsche Telekom GK ...

Microsoft
TV-Tipp: Das Microsoft-Dilemma
Information von kgbornMicrosoft17 Kommentare

Aktuell gibt es in Behörden und in Firmen eine fatale Abhängigkeit von Microsoft und dessen Produkten. Planlos agieren die ...