Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Nach Upload von Dokument Wörter zählen (.doc, .txt, .pdf, .odt, .html)

Frage Entwicklung PHP

Mitglied: Kabularasa

Kabularasa (Level 1) - Jetzt verbinden

15.04.2008 um 19:34 Uhr, 6413 Aufrufe

Nach dem Upload eines Dokuments sollen die Wörter gezählt und die Summe angezeigt werden.

Hallo,

ich stehe im Moment vor der Aufgabe den Usern einer Website die möglichkeit zu bieten ein Dokument anzugeben (upzuloaden) und anschliessend die Anzahl der Wörter des Dokuments zu sehen.

Es soll sich hierbei um die Dateiformate .doc, .txt, .pdf, .odt, sowie .htm(l) handeln.

Als ersten Ansatz und direkten Angriff dachte ich mit einer simplen Zählung der leerzeichen ans Ziel zu kommen, jedoch sind die Ergebnisse nach der Berechnung alles nur nicht Korrekt. Sofern sich das Dokument wie .pdf überhaupt öffnen lässt.

Mittlerweile denke ich das der Weg folgender wäre (und hier bin ich mir nicht sicher, weder in der Theorie, noch in der Ausführung):
Dokument Uploaden --> Je nach Dateityp parsen --> Konvertieren nach text --> text "schrumpfen" (alle leerzeichen falls mehrere hintereinander folgen entfernen) --> endlich die Zählung (spaces od. wörter falls das auch gleich geht).

Kennt jemand eine "schlüsselfertige Lösung" für das Problem, bzw hat sonst eine Idee die mich dem Ziel näher bringen könnte.
Durchfaste seit ein paar Tagen alle mir bekannten scriptresourcen und ähnliches, aber entweder bin ich schon betriebsblind oder bewege mich überhaupt in die falschen Richtung.

Danke & LG Rob
Neuester Wissensbeitrag
Heiß diskutierte Inhalte
LAN, WAN, Wireless
FritzBox, zwei Server, verschiedene Netze (18)

Frage von DavidGl zum Thema LAN, WAN, Wireless ...

Windows Netzwerk
Windows 10 RDP geht nicht (18)

Frage von Fiasko zum Thema Windows Netzwerk ...

Windows Server
Outlook Verbindungsversuch mit Exchange (15)

Frage von xbast1x zum Thema Windows Server ...