gutitm
Goto Top

Eigene Webseite überprüfen - nach Mailadressen

Hallo,

ich habe auf unser Webseite ein Problem mit Webcrawlern/Harvester, die wohl Mailadressen von der HP sammeln. Nun ist die seite recht gross und ich möchte nicht händisch alle Unterseiten nach Mailadressen durchgehen.

Gibt es ein Tool oder Webseite, welches meine Webseite nach erkennbaren Mailadressen durchsucht und die Seiten anzeigt. Dann könnte ich die Mailadressen entfernen. Habe sowas leider nicht im Web gefunden. Da gibt es vor allem Linkchecker und Codechecker.

Grüße gutit

Content-Key: 118471

Url: https://administrator.de/contentid/118471

Printed on: April 24, 2024 at 09:04 o'clock

Member: kimiko
kimiko Jun 18, 2009 at 09:39:41 (UTC)
Goto Top
egrep -r '.*@.*.' /var/www
wget -r -O - |egrep '.*@.*.'

Perl, Ruby...: www::mechanize

gruss
Member: Twlght667
Twlght667 Jun 18, 2009 at 09:40:09 (UTC)
Goto Top
Mit der Windows-Suche den Ordner nach *.* (oder *.htm, *.php, was auch immer...) durchsuchen. Als zu suchenden Inhalt "@" angeben. Sollte eigentlich funktionieren.
Member: gutitm
gutitm Jun 18, 2009 at 11:26:21 (UTC)
Goto Top
vielen Dank, mir geht es vor allem um die Suchmechanismen eines solchen Tools...z.Bsp. können die ja inzwischen auch @, [at], [@] und so weiter finden

@kimiko ...leider liegt die Webseite auf nem Host, wo ich keinen Zugriff per ssh habe bzw. Möglichkeiten grep auf der Kommandozeile zu benutzen...

@others

der Content der Webseite liegt in einer Datenbank (SQL, Webseite Typo3)...daher bin ich mir nicht sicher, ob ich das so einfach durchsuchen kann. daher auch die Frage nach einem Onlinedurchsuchen...

bis jetzt habe ich da nur halbwissen...
Member: kimiko
kimiko Jun 18, 2009 at 11:47:44 (UTC)
Goto Top
Vielleicht kann man ja nen cronjob laufen lassen.
Die regular expressions musst du dann natürlich anpassen.
andere Idee nimm die Waffen deiner Feinde, deine eigene Suchmaschiene:
yacy und indizier deine Site.
Damit kann man auch Dokumente pdf, zip... durchsuchen.
Das ist auch schnell und einfach installiert.
Member: gutitm
gutitm Jun 18, 2009 at 11:52:16 (UTC)
Goto Top
Cronjob müsste gehen.

Du meinst die eigene suchmaschine für die seite? Ist ja ne gute Idee....gibt das Ganze ja auch "powered by google" bzw. für Typo3 als plugin?

Und die Waffen meiner Feinde will ich mir anschauen face-smile
Mitglied: 60730
60730 Jun 18, 2009 at 13:36:04 (UTC)
Goto Top
Zitat von @gutitm:
Und die Waffen meiner Feinde will ich mir anschauen face-smile

Servus,

dazu müßtest du aber ins Lager der "Feinde" wechseln und sei dir sicher...

  • Die erkennen "Trojaner" sofort.. - du brauchst einen Leumund, um reinzukommen
  • Hier gibts keinen Link.

Gruß
Member: gutitm
gutitm Jun 22, 2009 at 13:13:29 (UTC)
Goto Top
So krass meinte ich das jetzt nicht. Habe mir erstmal Yacy installiert, scheint dafür gut geeignet zu sein. Muss nur noch eine Art Volltextsuche finden...