Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Kann Google SQL?

Frage Internet

Mitglied: Pedant

Pedant (Level 2) - Jetzt verbinden

17.07.2005, aktualisiert 18.07.2005, 6105 Aufrufe, 5 Kommentare

Wie werden Forumsartikel von Suchmaschinen gefunden?

Hallo,

bei der Kombination PHP (serverseitiges Skript), MySQL (kennwortgeschützte Datenbank) und allgemein zur Laufzeit generiertes HTML, ist es mir völlig unklar wie Suchmaschinen da was finden können.
Benutzt die Suchmaschine die Suchfunktion des Forums? Sicher nicht. Untersucht sie den Aufbau, also die "URL-Syntax" und fragt dann Beitrag für Beitrag ab, bis sie den letzten "gelesen" hat?
http://forumsseite.de/beitrag.php?nummer=1
http://forumsseite.de/beitrag.php?nummer=2
...
http://forumsseite.de/beitrag.php?nummer=n-1
http://forumsseite.de/beitrag.php?nummer=n

Anders kann ich's mir nicht erklären, aber das heißt nichts. Weiß einer wie's gemacht wird?

Hintergrund meiner Frage ist, dass ich eine PHP/MySQL-Seite ins Netz stellen möchte, die Daten wie z.B. private E-Mail-Adressen beinhaltet. Diese sollten nicht von Suchrobotern gefunden, um dann an Spammer verhökert zu werden. Diese Info's sollten auch nicht unbedingt in Google landen. Es sind keine hochsensiblen Daten, aber doch irgendwie nicht für jedermann gedacht.

Wie kann ich so eine Seite sinnvoll schützen?
htaccess und eine Startseite auf der das Kennwort in eine Grafik eingearbeitet ist, damit Besucher es lesen und benutzen können ist das einzige was mir bisher einfiel.

Gruß Frank
Mitglied: gemini
LÖSUNG 17.07.2005 um 15:38 Uhr
Du könntest eine robots.txt ins root legen und Bots vom Durchsuchen bestimmter Verzeichnisse abhalten.

~~~~~~~~~~~~~~~~~~~~~~~~~~
  1. robots.txt zu http://www.<<a>MeineDomain.tld<a>>/

User-agent: *
Disallow: /<<a>Verzeichnis1<a>>
Disallow: /<<a>Verzeichnis2<a>>
Disallow: /<<a>Verzeichnis3<a>>
~~~~~~~~~~~~~~~~~~~~~~~~~~
Bitte warten ..
Mitglied: Pedant
17.07.2005 um 16:53 Uhr
Hallo gemini,

schöne Idee, danke. Das kannte ich noch nicht, aber ich finde es nicht ausreichend, da es dem Roboter überlassen wird, ob er sich für diese Datei interessiert oder nicht. Und warum sollten Adressensammler für Spamlisten - da sie ohnehin Verbrecher sind - darauf Rücksicht nehmen?
Ist es nicht so, dass man sie damit vielleicht sogar erst auf Ideen bringt?

Eine gute Erklärung zu dem Thema habe ich hier gefunden:
http://www.bjoernsworld.de/suchmaschinen/robots-txt.html
Dann war ich neugierig ob und wie es auf dieser Seite eingesetzt wird
http://www.bjoernsworld.de/robots.txt
und wurde dadurch auf diese Seite aufmerksam gemacht:
http://www.bjoernsworld.de/css/bookmarks-download.html
Da es nur eine harmlose Linksammlung ist, die über die Hauptseite auch anklickbar zugänglich ist, scheue ich mich nicht es hier zu erwähnen.

Ein etwas besserer Schutz wäre mir lieber. Hat noch einer eine Alternative?
Weiß jemand wie Roboter mit PHP/SQL umgehen (siehe Ausgangsfrage)?

Gruß Frank
Bitte warten ..
Mitglied: Desperado
LÖSUNG 18.07.2005 um 06:24 Uhr
Hi,

wenn du den index auf follow hast, dann geht er jedem verfügbarem seiteninternen link nach und parst ihn für die suchmaschine. das hat nix mit mysql zu tun. also wenn du nen link "forum" hast, klickt der robot sozusagen da drauf, liest und dann auf die einzelnen threads usw...

deine persönliche emailadresse ist im internet NIE sicher. aber tipp: mach doch ein kleines gif aus deiner email und binde es ein, dann steht es nicht im quellcode und keiner findets

Grüsse, Desperado
Bitte warten ..
Mitglied: Pedant
18.07.2005 um 10:47 Uhr
Hallo Desperado,

danke für die Erklärung. Der Robot klickt also auf den ersten Link den er findet, das generiert HTML mit weiteren Links, die er dann auch verfolgt. Er simuliert also einfach nur das Surfverhalten eines fleissigen Lesers und bedient sich keiner misteriösen Tricks um direkt auf die Datenbank zuzugreifen.

Es geht bei mir nicht um meine eine Adresse, sondern um E-Mail- und Postadresse von meinem Abi-Jahrgang, anlässlich der Nachbereitung eines Abi-Treffens. Die Daten sollen also dauerhaft bereit stehen und gepflegt werden, für die und von denen, die es auch was angeht.

Wenn der Zugang zu diesen Seiten mit einem Kennwort belegt ist, dann denke ich jetzt, hat ein Roboter keinen Zutritt.
Falls ich das falsch verstanden habe, bitte ich um Nachricht.

Gruß Frank
Bitte warten ..
Mitglied: AdMac
LÖSUNG 18.07.2005 um 11:51 Uhr
Hallo Pedant!

Die obigen Erklärungen zur robots.txt dienen nur der Durchsuchung von Seiten. Eine Seite, die per PHP und MySQL erstellt wird, wird nicht direkt durchsucht.

Da die Daten in einer Datenbank liegen, werden diese auch daraus abgefragt und dann angezeigt. Das macht auch eine Suchmaschine so.

Falls Du nun deine Seite schützen willst, baust Du ein Login ein, d.h. nur bekannte User dürfen die Daten auch abrufen. Damit hast Du auch eine Suchmaschine, die auf deinen Seiten stöbern will, abgewürgt.

Mac
Bitte warten ..
Ähnliche Inhalte
Utilities
Google Earth - Google CrashHandler
Frage von ovu-p86Utilities

Hallo, bei der Google Earth Installation hab ich mir 2 GoogleCrashHandler Prozesse eingefangen. Da ich ein neues Win7-64bit System ...

Webbrowser
Google Chrome lädt Google Dienste nicht
Frage von r3volutionxxxWebbrowser3 Kommentare

Hallo Ich habe ein kleines Problem Zuhause benutze ich Google Chrome, wobei die Google Dienste nicht richtig funktionieren. OS: ...

PHP
Geolocation Google
Frage von vServerPHP5 Kommentare

Hallo, ich habe ein Problem, irgendwie Positioniert es mich immer in München, wie kann ich das auf meinen richtigen ...

Utilities
Googlen aus anderer Stadt
gelöst Frage von MakromanUtilities9 Kommentare

Hallo an alle, ich habe mal eine Frage: Ich möchte gerne eine Google Suche ausführen aber vorgeben in einer ...

Neue Wissensbeiträge
Internet

EU-DSGVO: WHOIS soll weniger Informationen liefern

Information von sabines vor 10 StundenInternet4 Kommentare

Wegen der europäische Datenschutzgrundverordnung stehen die Prozesse um die Registrierung von Domains auf dem Prüfstand. Sollte die Forderungen umgesetzt ...

Verschlüsselung & Zertifikate

19 Jahre alter Angriff auf TLS funktioniert immer noch

Information von BassFishFox vor 17 StundenVerschlüsselung & Zertifikate1 Kommentar

Interessant zu lesen. Der Bleichenbacher-Angriff gilt unter Kryptographen als Klassiker, trotzdem funktioniert er oft noch. Wie wir herausgefunden haben, ...

Windows 10

Windows 10 Fall Creators Update - Neue Funktion Hyper-V Standardswitch kann ggf. Fehler bei Proxy Configs verursachen

Erfahrungsbericht von rzlbrnft vor 1 TagWindows 104 Kommentare

Hallo Kollegen, Da wir die Gefahr lieben, haben wir bei einigen Usern nun mittlerweile das Creators Update drauf. Einige ...

Sicherheit

TLS-Zertifikat und privater Schlüssel von Microsofts Dynamics 365 geleakt

Information von Penny.Cilin vor 1 TagSicherheit

Microsoft hat versehentlich das TLS-Zertifikat inklusive dem privaten Schlüssel seiner Business-Anwendung Dynamics 365 geleakt. TLS-Zertifikat und privater Schlüssel von ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
Von rj11 auf rj45
Frage von jensgebkenLAN, WAN, Wireless19 Kommentare

Hallo Gemeinschaft, könnt ihr mir vielleicht bei der anfertigung eines Kabels helfen - habe ein rj 11 stecker und ...

Netzwerkmanagement
Firefox Profieles im Roaming
gelöst Frage von Hendrik2586Netzwerkmanagement17 Kommentare

Hallo liebe Leute. :) Ich hab da ein kleines Problem, welches anscheinend nicht unbekannt ist. Wir nutzen hier in ...

Netzwerkmanagement
NAS über zwei weitere Ethernet Anschlüsse verbinden
gelöst Frage von Sibelius001Netzwerkmanagement17 Kommentare

Sorry - ich bin hier wahrscheinlich als kompetter IT Trottel unterwegs. Aber eventuell kann mir jemand ganz einfach helfen: ...

LAN, WAN, Wireless
Häufig Probleme beim Anmelden in WLAN
Frage von mabue88LAN, WAN, Wireless15 Kommentare

Hallo zusammen, in einem Netzwerk gibt es relativ häufig (1-2 mal pro Woche) Probleme mit der WLAN-Verbindung. Zunächst mal ...