Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Pdf nach inhalt splitten und benennen

Frage Entwicklung Batch & Shell

Mitglied: kkduke

kkduke (Level 1) - Jetzt verbinden

22.07.2014 um 10:48 Uhr, 1130 Aufrufe, 5 Kommentare

hallo,

ich habe eine pdf datei in der sagen wir mal 10000 rechnungen drin sind (gescannt) und ocr-indexiert. die rechnungen sind alle nach dem gleichen schema aufgebaut. es gibt in einem bestimmten bereich das wort "belegnummer" und dahinter ist eine 10stellige zahl.

ziel ist es aus der einen großen pdf viele kleine zu machen. und zwar soll jede rechnung eine pdf datei bekommen und die pdf soll so heissen wie die rechnungsnummer für die entsprechende seite/datei lautet.

kennt jemand eine möglichkeit dies relativ einfach zu realisieren? bin für jeden tip dankbar.

danke und gruss
kai


Mitglied: ko81ro
22.07.2014 um 11:08 Uhr
Hallo,

such mal nach pdf split and merge...

Grüße
veneue
Bitte warten ..
Mitglied: kkduke
22.07.2014 um 11:09 Uhr
das kann meines wissens nicht nach ocr-inhalt eine automatische trennung vornehmen. aber ich prüfe es nochmal.
Bitte warten ..
Mitglied: Lochkartenstanzer
22.07.2014 um 11:36 Uhr
Hat jede rechnung gelich viele Seiten oder sind diese unterschiedlich lang?

wenn die alle gleich sind, könnte man die einfgach durch die gängigen Splittools auseinanderdividieren udn dann nochmal OCR drüberjagen.

lks
Bitte warten ..
Mitglied: Nr60730
25.07.2014 um 11:13 Uhr
Salü LKS,

Theologisch ist deine Frage doch Jacke wie Hose?

Ich würd da auf jeder seite mittels findstr nach belegnummer suchen und eine Variable setzen - greift das ins leere (weil seite x von y) sollte die Variable noch die Belegnummer der vorherigen Seite verweisen

Irgendwo hatten wir das doch schonmal mit pdftoolkit gelöst?

Gruß
Bitte warten ..
Ähnliche Inhalte
Webentwicklung
Htaccess Inhalt kombinieren (Umschreibung www + https) (5)

Frage von dodo-r zum Thema Webentwicklung ...

Windows Tools
Adobe PDF Drucker Zahlen abgeschnitten (3)

Frage von lupita zum Thema Windows Tools ...

VB for Applications
gelöst Tool zur scriptbasierten PDF-Bearbeitung gesucht (VBS oder Batch) (6)

Frage von SarekHL zum Thema VB for Applications ...

Monitoring
Mehrere Monitore mit verschiedenem Inhalt darstellen (9)

Frage von Zelgius zum Thema Monitoring ...

Neue Wissensbeiträge
RedHat, CentOS, Fedora

Fedora, RedHat, Centos: DNS-Search Domain setzen

(13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...

Drucker und Scanner

Samsung SL-M4025ND, firmware update und (kompatible) Tonerkassetten

(1)

Erfahrungsbericht von markus-1969 zum Thema Drucker und Scanner ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
gelöst Komplett neues Netzwerk, Ubiquiti WLAN, Router, Switch (16)

Frage von Freak-On-Silicon zum Thema LAN, WAN, Wireless ...

CMS
Lokales Wordpress im LAN - wie aufsetzen? (15)

Frage von Static zum Thema CMS ...

LAN, WAN, Wireless
IP im privaten Netz nicht erreichbar (12)

Frage von guntis zum Thema LAN, WAN, Wireless ...

Windows Server
Druck wird nicht erlaubt (10)

Frage von daquick zum Thema Windows Server ...