Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

PDF Dokument auswerten bzw bearbeiten

Frage Entwicklung Batch & Shell

Mitglied: 103148

103148 (Level 1)

05.07.2012 um 09:35 Uhr, 3165 Aufrufe, 1 Kommentar

Hallo,

wir haben ein PDF Dokument, welches ich auf Einträge prüfen möchte.
Genau gesagt, gibt es einen Eintrag in einer Zeile, wenn nicht muss ein Zähler hochlaufen.

Also jede Zeile prüfen, kein Eintrag, merken und am Ende benötige ich wieviele Zeile da keinen Eintrag haben.
Dieser Wert muss von einer Zahl im Dokument abgezogen werden.

zb links oben steht 189 dann minus der geprüften "nicht Einträge"...

Mitglied: ratzla
16.07.2012 um 22:15 Uhr
Vorausgesetzt Dein Dokument ist nicht verschlüsselt, kannst Du in erster Stufe dein Dokument mit pdftotext (Bestandteil der XPDF-Utils [Linux!]) in ein Textdokument umwandeln. Dieses kannst Du dann weiter analysieren (z.b. mit grep).
Sicherlich gibt's auch für Win ähnliche Programme.
Notfalls kannst Du mit Libre/OpenOffice das PDF importieren und darin weiterverarbeiten.

Direkt im PDF gehts prinzipiell auch, aber das ist ziemlich hässlich, da im Minimalfall mindestens der Zeichensatz dekodiert werden müsste (meist noch mehr).

Grüße
Ratzla
Bitte warten ..
Neuester Wissensbeitrag
Router & Routing

192.168er Adresse im öffentlichen Netz

(2)

Erfahrungsbericht von visco-c zum Thema Router & Routing ...

Heiß diskutierte Inhalte
Zusammenarbeit
Als Administrator im Großraumbüro (29)

Frage von Dopamin85 zum Thema Zusammenarbeit ...

Exchange Server
Test-ActiveSyncConnectivity Error nach neuem Zertifikat (22)

Frage von Driphex zum Thema Exchange Server ...

Hyper-V
HYPER V und USB (16)

Frage von Hendrik2586 zum Thema Hyper-V ...

SAN, NAS, DAS
Backupserver für KMU (14)

Frage von Leo-le zum Thema SAN, NAS, DAS ...