Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Pdf nach inhalt splitten und benennen

Frage Entwicklung Batch & Shell

Mitglied: kkduke

kkduke (Level 1) - Jetzt verbinden

22.07.2014 um 10:48 Uhr, 1107 Aufrufe, 5 Kommentare

hallo,

ich habe eine pdf datei in der sagen wir mal 10000 rechnungen drin sind (gescannt) und ocr-indexiert. die rechnungen sind alle nach dem gleichen schema aufgebaut. es gibt in einem bestimmten bereich das wort "belegnummer" und dahinter ist eine 10stellige zahl.

ziel ist es aus der einen großen pdf viele kleine zu machen. und zwar soll jede rechnung eine pdf datei bekommen und die pdf soll so heissen wie die rechnungsnummer für die entsprechende seite/datei lautet.

kennt jemand eine möglichkeit dies relativ einfach zu realisieren? bin für jeden tip dankbar.

danke und gruss
kai


Mitglied: ko81ro
22.07.2014 um 11:08 Uhr
Hallo,

such mal nach pdf split and merge...

Grüße
veneue
Bitte warten ..
Mitglied: kkduke
22.07.2014 um 11:09 Uhr
das kann meines wissens nicht nach ocr-inhalt eine automatische trennung vornehmen. aber ich prüfe es nochmal.
Bitte warten ..
Mitglied: Lochkartenstanzer
22.07.2014 um 11:36 Uhr
Hat jede rechnung gelich viele Seiten oder sind diese unterschiedlich lang?

wenn die alle gleich sind, könnte man die einfgach durch die gängigen Splittools auseinanderdividieren udn dann nochmal OCR drüberjagen.

lks
Bitte warten ..
Mitglied: Nr60730
25.07.2014 um 11:13 Uhr
Salü LKS,

Theologisch ist deine Frage doch Jacke wie Hose?

Ich würd da auf jeder seite mittels findstr nach belegnummer suchen und eine Variable setzen - greift das ins leere (weil seite x von y) sollte die Variable noch die Belegnummer der vorherigen Seite verweisen

Irgendwo hatten wir das doch schonmal mit pdftoolkit gelöst?

Gruß
Bitte warten ..
Neuester Wissensbeitrag
Windows Update

Windows Update-Suche nach Win7 Neuinstallation wieder schneller

(1)

Erfahrungsbericht von the-buccaneer zum Thema Windows Update ...

Ähnliche Inhalte
Basic
gelöst Mit vb.net PDF in Word-Dok einfügen (10)

Frage von ahstax zum Thema Basic ...

Bibliotheken & Toolkits
Gesucht: Open Source bzw. Kostengünstige PDF SDK für Softwareentwicklung (7)

Frage von JanGarbers zum Thema Bibliotheken & Toolkits ...

Heiß diskutierte Inhalte
Exchange Server
Bestehende eMails autoamatisch weiterleiten (21)

Frage von metal-shot zum Thema Exchange Server ...

Hyper-V
gelöst Reiner Hyper- V Server oder lieber Rolle (21)

Frage von Winuser zum Thema Hyper-V ...

SAN, NAS, DAS
gelöst Synology Version 6.1 Probleme (18)

Frage von Hendrik2586 zum Thema SAN, NAS, DAS ...

Router & Routing
gelöst IP Kamera für drei unabhängige Netzwerke (16)

Frage von ProfessorZ zum Thema Router & Routing ...