Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
Kommentar vom Moderator Biber am 19.11.2014 um 19:04:37 Uhr
Zitat von s0l1v3r:

PDF-Dateien auslesen und umbennen
.....
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen
Set /a rgc+=2
#898

PDF auslesen und umbennen

Frage Entwicklung Batch & Shell

Mitglied: s0l1v3r

s0l1v3r (Level 1) - Jetzt verbinden

17.11.2014 um 11:50 Uhr, 1078 Aufrufe, 7 Kommentare

Hallo,

ich bin neu in diesem Forum und hätte ein dringendes Anliegen.

Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen. Diese müssten nach objektiver Betrachtung immer an der gleichen Stelle liegen. Wenn ich jedoch diese in eine TXT Datei konvertiere haben diese immer unterschiedliche Abstände.
Die Kombination sieht immer nach einem bestimmte Schema aus , die Kombinationen sind auch immer einzigartig. Bsp. "E0Z D2.0 010"

Der sinn besteht daraus ,dass ich eine Excel Liste habe , dort sind die Schildnummern gespeichert und wenn ich die anklicke sollte sich die PDF
öffnen zu der das Schild gehört. Idee dabei ... alles in einzelne PDF Dateien zerteilen (ist eine große ) und mit den Schildernnummern als Namen speichern das die Excel Liste direkt als Hyperlink die Dateien öffnen kann.

Wäre jemand in der Lage mir zu helfen ich verzweifel hier ziemlich.

MFG



Mitglied: fisi-pjm
17.11.2014 um 11:57 Uhr
Hi,

wenn du es doch schon bis zur Textdatei geschafft hast müsstest du doch darin nach dem String suchen können. Da du uns leider nicht einweihst in welcher sprache das umgesetzt werden soll gibts hier auch keine weitere Hilfe, alle Glaskugeln sind gerade zum vorweihnachtlichen Checkup bei @keine-ahnung im Wartezimmer.

Gruß
PJM
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014 um 12:11 Uhr
Hey erstmal danke für die erste Antwort... So nun würde ich das gerne in batch umsetzten meine wissen ist bis auf grund Befehle beschränkt jedoch bin ich sehr bereitwillig dazu zu lernen.. Leider weiß ich nicht wie ich den string suchen soll da er immer wo anders zu stehen scheint und ja auch nicht immer der gleiche ist
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014, aktualisiert um 12:27 Uhr
Die Beiträge hatte ich gelesen, leiderhelfen sie nicht wirklich weiter. Das Exportieren in eine Tabelle funktioniert nicht da wird mir nur mist ausgegeben. Die Tabellen bzw Spalten und Zeilen zeigen keine Regelmäßigkeit, so das ich sagen könnte lese jedes 80 zigste spalte aus oder so was . Ich habe auch kein Ankündigungs String Bsp: LFDNR: "zu kopierender Text ". Die PDF sind alles Pläne so das unten Rechts eine Art Stückliste ist .
Daher denke ich, das dort auch in der PDF die Zahlen immer an der gleichen Stellen sind. Aber ich weis nicht wie ich diese dort rausbekomme.


Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
Bitte warten ..
Mitglied: 114757
17.11.2014, aktualisiert um 12:42 Uhr
Moin,
Zitat von s0l1v3r:
Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
dann mach mal ... ohne ein Muster von deiner Seite ist das definieren eines Regex-Pattern hier sonst schlichtweg unmöglich ...

Gruß jodel32
Bitte warten ..
Mitglied: s0l1v3r
17.11.2014, aktualisiert um 13:46 Uhr
Also hier mal die Datei bzw der Link zu meinerDropbox

https://www.dropbox.com/s/pk9lekxi833bti3/Seiten%20aus%201MON3H3001----5 ...

Die hier genante Information die wichtig wäre ist diese "E0Z D2.0 010"


PS: was ist ein Regex Pattern
Bitte warten ..
Mitglied: 114757
17.11.2014, aktualisiert um 14:13 Uhr
Zitat von s0l1v3r:
PS: was ist ein Regex Pattern
hättest du die oben verlinkten Anleitungen von @colinardo mal richtig gelesen, wüsstest du wovon ich spreche ...

Hier der passende Regex-Pattern für dein Vorhaben: (und nein das ließt nicht die Lfd-Nr aus sondern die Zeile darunter !)
^Lfd-Nr.\s+.*\s+(.*)
Damit dieser Pattern funktioniert musst du dein PDF mit pdftotext so in eine Textdatei extrahieren
pdftotext.exe demo.pdf
dann kannst du den gewünschten String mit VBS aus der Textdatei extrahieren
01.
Set fso = CreateObject("Scripting.FileSystemObject")  
02.
SubjectString = fso.OpenTextFile("C:\demo.txt",1).ReadAll() 
03.
 
04.
Set myRegExp = New RegExp 
05.
myRegExp.IgnoreCase = True 
06.
myRegExp.MultiLine = True 
07.
myRegExp.Pattern = "^Lfd-Nr.\s+.*\s+(.*)" 
08.
Set myMatches = myRegExp.Execute(SubjectString) 
09.
If myMatches.Count > 0 Then 
10.
  msgbox "Der String lautet: " & Trim(myMatches(0).submatches(0)) 
11.
else 
12.
  msgbox "String wurde nicht gefunden" 
13.
End If
Den Rest findest du in den oben verlinkten Anleitungen.

Gruß jodel32
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(8)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Batch & Shell
2 String aus PDF auslesen und diesen zum Umbenamsen benutzen (8)

Frage von ingo101 zum Thema Batch & Shell ...

Batch & Shell
Dateien im Ordner auslesen und umbennen (10)

Frage von jocheng zum Thema Batch & Shell ...

VB for Applications
gelöst VBA: Wert von einer Website (pdf-Dokument) auslesen und in Excel kopieren (16)

Frage von Stern123 zum Thema VB for Applications ...

VB for Applications
gelöst PDF Datei auslesen und per VBA in Excel schreiben (3)

Frage von Julian8990 zum Thema VB for Applications ...

Heiß diskutierte Inhalte
Microsoft
Ordner mit LW-Buchstaben versehen und benennen (21)

Frage von Xaero1982 zum Thema Microsoft ...

Netzwerkmanagement
gelöst Anregungen, kleiner Betrieb, IT-Umgebung (18)

Frage von Unwichtig zum Thema Netzwerkmanagement ...

Windows Update
Treiberinstallation durch Windows Update läßt sich nicht verhindern (17)

Frage von liquidbase zum Thema Windows Update ...