Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

PDF Dokument auswerten bzw bearbeiten

Frage Entwicklung Batch & Shell

Mitglied: 103148

103148 (Level 1)

05.07.2012 um 09:35 Uhr, 3160 Aufrufe, 1 Kommentar

Hallo,

wir haben ein PDF Dokument, welches ich auf Einträge prüfen möchte.
Genau gesagt, gibt es einen Eintrag in einer Zeile, wenn nicht muss ein Zähler hochlaufen.

Also jede Zeile prüfen, kein Eintrag, merken und am Ende benötige ich wieviele Zeile da keinen Eintrag haben.
Dieser Wert muss von einer Zahl im Dokument abgezogen werden.

zb links oben steht 189 dann minus der geprüften "nicht Einträge"...

Mitglied: ratzla
16.07.2012 um 22:15 Uhr
Vorausgesetzt Dein Dokument ist nicht verschlüsselt, kannst Du in erster Stufe dein Dokument mit pdftotext (Bestandteil der XPDF-Utils [Linux!]) in ein Textdokument umwandeln. Dieses kannst Du dann weiter analysieren (z.b. mit grep).
Sicherlich gibt's auch für Win ähnliche Programme.
Notfalls kannst Du mit Libre/OpenOffice das PDF importieren und darin weiterverarbeiten.

Direkt im PDF gehts prinzipiell auch, aber das ist ziemlich hässlich, da im Minimalfall mindestens der Zeichensatz dekodiert werden müsste (meist noch mehr).

Grüße
Ratzla
Bitte warten ..
Neuester Wissensbeitrag
CPU, RAM, Mainboards

Angetestet: PC Engines APU 3a2 im Rack-Gehäuse

(1)

Erfahrungsbericht von ashnod zum Thema CPU, RAM, Mainboards ...

Ähnliche Inhalte
VB for Applications
gelöst VBA: Wert von einer Website (pdf-Dokument) auslesen und in Excel kopieren (16)

Frage von Stern123 zum Thema VB for Applications ...

Netzwerkgrundlagen
Dokument zum Bearbeiten gesperrt, wieso? (3)

Frage von McLion zum Thema Netzwerkgrundlagen ...

Heiß diskutierte Inhalte
DSL, VDSL
DSL-Signal bewerten (13)

Frage von SarekHL zum Thema DSL, VDSL ...

Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (9)

Frage von JayyyH zum Thema Switche und Hubs ...

Windows Server
Mailserver auf Windows Server 2012 (9)

Frage von StefanT81 zum Thema Windows Server ...

Backup
Clients als Server missbrauchen? (9)

Frage von 1410640014 zum Thema Backup ...