Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Nach Upload von Dokument Wörter zählen (.doc, .txt, .pdf, .odt, .html)

Frage Entwicklung PHP

Mitglied: Kabularasa

Kabularasa (Level 1) - Jetzt verbinden

15.04.2008 um 19:34 Uhr, 6419 Aufrufe

Nach dem Upload eines Dokuments sollen die Wörter gezählt und die Summe angezeigt werden.

Hallo,

ich stehe im Moment vor der Aufgabe den Usern einer Website die möglichkeit zu bieten ein Dokument anzugeben (upzuloaden) und anschliessend die Anzahl der Wörter des Dokuments zu sehen.

Es soll sich hierbei um die Dateiformate .doc, .txt, .pdf, .odt, sowie .htm(l) handeln.

Als ersten Ansatz und direkten Angriff dachte ich mit einer simplen Zählung der leerzeichen ans Ziel zu kommen, jedoch sind die Ergebnisse nach der Berechnung alles nur nicht Korrekt. Sofern sich das Dokument wie .pdf überhaupt öffnen lässt.

Mittlerweile denke ich das der Weg folgender wäre (und hier bin ich mir nicht sicher, weder in der Theorie, noch in der Ausführung):
Dokument Uploaden --> Je nach Dateityp parsen --> Konvertieren nach text --> text "schrumpfen" (alle leerzeichen falls mehrere hintereinander folgen entfernen) --> endlich die Zählung (spaces od. wörter falls das auch gleich geht).

Kennt jemand eine "schlüsselfertige Lösung" für das Problem, bzw hat sonst eine Idee die mich dem Ziel näher bringen könnte.
Durchfaste seit ein paar Tagen alle mir bekannten scriptresourcen und ähnliches, aber entweder bin ich schon betriebsblind oder bewege mich überhaupt in die falschen Richtung.

Danke & LG Rob
Neuester Wissensbeitrag
Off Topic

"Ich habe nichts zu verbergen"

(4)

Erfahrungsbericht von FA-jka zum Thema Off Topic ...

Heiß diskutierte Inhalte
Erkennung und -Abwehr
Virenschutz - Meinungen (24)

Frage von honeybee zum Thema Erkennung und -Abwehr ...

Windows 10
Welches OS für Firmengeräte? (17)

Frage von MarkusVH zum Thema Windows 10 ...

Exchange Server
SBS2011: POP3-Connector 10 MB Grenze Email Benachrichtigung (13)

Frage von bogi1102 zum Thema Exchange Server ...

DNS
Brauche einen Nameserver (12)

Frage von leon123 zum Thema DNS ...