Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
Kommentar vom Moderator Biber am 19.11.2014 um 19:04:37 Uhr
Zitat von s0l1v3r:

PDF-Dateien auslesen und umbennen
.....
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen
Set /a rgc+=2
#898

PDF auslesen und umbennen

Frage Entwicklung Batch & Shell

Mitglied: s0l1v3r

s0l1v3r (Level 1) - Jetzt verbinden

17.11.2014 um 11:50 Uhr, 1122 Aufrufe, 7 Kommentare

Hallo,

ich bin neu in diesem Forum und hätte ein dringendes Anliegen.

Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen. Diese müssten nach objektiver Betrachtung immer an der gleichen Stelle liegen. Wenn ich jedoch diese in eine TXT Datei konvertiere haben diese immer unterschiedliche Abstände.
Die Kombination sieht immer nach einem bestimmte Schema aus , die Kombinationen sind auch immer einzigartig. Bsp. "E0Z D2.0 010"

Der sinn besteht daraus ,dass ich eine Excel Liste habe , dort sind die Schildnummern gespeichert und wenn ich die anklicke sollte sich die PDF
öffnen zu der das Schild gehört. Idee dabei ... alles in einzelne PDF Dateien zerteilen (ist eine große ) und mit den Schildernnummern als Namen speichern das die Excel Liste direkt als Hyperlink die Dateien öffnen kann.

Wäre jemand in der Lage mir zu helfen ich verzweifel hier ziemlich.

MFG



Mitglied: fisi-pjm
17.11.2014 um 11:57 Uhr
Hi,

wenn du es doch schon bis zur Textdatei geschafft hast müsstest du doch darin nach dem String suchen können. Da du uns leider nicht einweihst in welcher sprache das umgesetzt werden soll gibts hier auch keine weitere Hilfe, alle Glaskugeln sind gerade zum vorweihnachtlichen Checkup bei @keine-ahnung im Wartezimmer.

Gruß
PJM
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014 um 12:11 Uhr
Hey erstmal danke für die erste Antwort... So nun würde ich das gerne in batch umsetzten meine wissen ist bis auf grund Befehle beschränkt jedoch bin ich sehr bereitwillig dazu zu lernen.. Leider weiß ich nicht wie ich den string suchen soll da er immer wo anders zu stehen scheint und ja auch nicht immer der gleiche ist
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014, aktualisiert um 12:27 Uhr
Die Beiträge hatte ich gelesen, leiderhelfen sie nicht wirklich weiter. Das Exportieren in eine Tabelle funktioniert nicht da wird mir nur mist ausgegeben. Die Tabellen bzw Spalten und Zeilen zeigen keine Regelmäßigkeit, so das ich sagen könnte lese jedes 80 zigste spalte aus oder so was . Ich habe auch kein Ankündigungs String Bsp: LFDNR: "zu kopierender Text ". Die PDF sind alles Pläne so das unten Rechts eine Art Stückliste ist .
Daher denke ich, das dort auch in der PDF die Zahlen immer an der gleichen Stellen sind. Aber ich weis nicht wie ich diese dort rausbekomme.


Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
Bitte warten ..
Mitglied: 114757
17.11.2014, aktualisiert um 12:42 Uhr
Moin,
Zitat von s0l1v3r:
Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
dann mach mal ... ohne ein Muster von deiner Seite ist das definieren eines Regex-Pattern hier sonst schlichtweg unmöglich ...

Gruß jodel32
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014, aktualisiert um 13:46 Uhr
Also hier mal die Datei bzw der Link zu meinerDropbox

https://www.dropbox.com/s/pk9lekxi833bti3/Seiten%20aus%201MON3H3001----5 ...

Die hier genante Information die wichtig wäre ist diese "E0Z D2.0 010"


PS: was ist ein Regex Pattern
Bitte warten ..
Mitglied: 114757
17.11.2014, aktualisiert um 14:13 Uhr
Zitat von s0l1v3r:
PS: was ist ein Regex Pattern
hättest du die oben verlinkten Anleitungen von @colinardo mal richtig gelesen, wüsstest du wovon ich spreche ...

Hier der passende Regex-Pattern für dein Vorhaben: (und nein das ließt nicht die Lfd-Nr aus sondern die Zeile darunter !)
^Lfd-Nr.\s+.*\s+(.*)
Damit dieser Pattern funktioniert musst du dein PDF mit pdftotext so in eine Textdatei extrahieren
pdftotext.exe demo.pdf
dann kannst du den gewünschten String mit VBS aus der Textdatei extrahieren
01.
Set fso = CreateObject("Scripting.FileSystemObject")  
02.
SubjectString = fso.OpenTextFile("C:\demo.txt",1).ReadAll() 
03.
 
04.
Set myRegExp = New RegExp 
05.
myRegExp.IgnoreCase = True 
06.
myRegExp.MultiLine = True 
07.
myRegExp.Pattern = "^Lfd-Nr.\s+.*\s+(.*)" 
08.
Set myMatches = myRegExp.Execute(SubjectString) 
09.
If myMatches.Count > 0 Then 
10.
  msgbox "Der String lautet: " & Trim(myMatches(0).submatches(0)) 
11.
else 
12.
  msgbox "String wurde nicht gefunden" 
13.
End If
Den Rest findest du in den oben verlinkten Anleitungen.

Gruß jodel32
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
Adobe PDF, Custom Property (6)

Frage von DanielBodensee zum Thema Batch & Shell ...

Visual Studio
Herausfinden, ob PDF farbig oder sw ist (3)

Frage von ahstax zum Thema Visual Studio ...

Batch & Shell
Powershell, PDF (6)

Frage von AnkhMorpork zum Thema Batch & Shell ...

Neue Wissensbeiträge
Windows 10

Neues Win10 Funktionsupdate verbuggt RemoteApp

Information von thomasreischer zum Thema Windows 10 ...

Microsoft

Die neuen RSAT-Tools für Win10 1709 sind da

(1)

Information von DerWoWusste zum Thema Microsoft ...

Humor (lol)

Wohnt jemand in Belgien und kann nicht mehr ruhig ausschlafen?

(6)

Information von LordGurke zum Thema Humor (lol) ...

Heiß diskutierte Inhalte
Router & Routing
Allnet - VDSL2 Modem - SFP (mini-GBIC) (19)

Frage von Dobby zum Thema Router & Routing ...

Voice over IP
DeutschlandLAN IP Voice Data M Premium, Erfahrung mit Faxgeräte? (17)

Frage von liquidbase zum Thema Voice over IP ...

TK-Netze & Geräte
TK-Anlage VoIP - DECT Erweiterung (15)

Frage von Lynkon zum Thema TK-Netze & Geräte ...