Dienstag, 7. Februar 2012
 
 
Haupt Menu
Home
Webspace
Reseller Webspace
Domain Reseller
Domains
Firmenhomepages 25,-EU
Website Backup
Hilfe
Forum
Downloads
Links
Domains for Sale
News
Profi Templates
cPanel BackupTool
Joomla Update Service
Internes
AGB
Kontakt
12 webmaster Forum
Willkommen, Gast
Bitte anmelden oder registrieren.    Passwort vergessen?
Aufbau der robots.txt Datein (1 Leser) (1) Gast
Zum Ende gehen Neues Thema Beliebt: 0
THEMA: Aufbau der robots.txt Datein
#18
admin (Admin)
Admin
Beiträge: 91
graph
Benutzer online Hier klicken, um das Profil dieses Benutzers zu sehen
Geschlecht: männlich reseller webspace
Aufbau der robots.txt Datein vor 3 Jahren, 11 Monaten Karma: 10  
Hier die Beschreibung eines Aufbaus der Robots.txt Datei.

Quelle: http://www.seo-ranking-tools.de
Hier finden Sie auch weiter hilfreiche Tools und Informationen..


Jede Zeile muss mit dem Wort "User-agent" und einem Doppelpunkt beginnen. Im Anschluss daran folgt dann der Robot-Name.

Beispiel:
User-agent: Googlebot

Wollen Sie eine globale Regel für alle Robots anlegen, schreiben Sie einfach einen Stern ("*&quot nach dem Wort "User-agent:".

Beispiel:
User-agent: *

Hinter der Angabe des Robots-Namen folgt nun die eigentliche Regel, nämlich die Auflistung der Ordner und Dateien, die nicht aufgenommen oder aufgenommen werden sollen. Dabei muss jeder Ordner, jede Datei in einer eigenen Zeile angegeben werden, angefangen mit Disallow oder Allow, dann folgt wieder ein Doppelpunkt und die Angabe der Datei oder des Ordners.

Beispiel:
Disallow: /ordner1/
Disallow: /ordner2/unterordner/
Disallow: /webseite.html
Allow: /ordner3/
# Alle gif-Bilder sperren
Disallow: /*.gif$

Achten Sie darauf, dass Sie den Pfad ohne Domain angeben und immer mit einem Slash ("/&quot beginnen. Ein kompletter Eintrag, der dem Googlebot erlaubt alles zu indizieren, würde dann z.B. so aussehen:

Beispiel:
User-agent: Googlebot
Allow: /

Wollen Sie einen Robot für Ihre komplette Domain aussperren, müssen Sie folgendes angeben:

Beispiel:
User-agent: Slurp
Disallow: /

Dieses Beispiel zeigt, wie Sie den Robot von Inktomi/Hotbot aussperren. Das ist zum Beispiel dann sinnvoll, wenn ein Robot ständig wiederkommt und Ihren Traffic unverhältnismäßig hoch belastet. Im Gegenzug kann man auch alle Verzeichnisse freigeben, dazu muss man einfach nichts angeben:

Beispiel:
User-Agent: Slurp
Disallow:

Zusätzlich zu den Suchmaschinen-Spidern gibt es noch spezielle Spider, die nach Email-Adressen suchen, um Beispielsweise SPAM zu verschicken. Wenn Sie verhindern wollen, dass solche Adressen-Sammler (E-Mail-Spider/Crawler) Ihre Adressen ausspionieren, müssen Sie als Robot-Namen z.B. den EmailCollector angeben. Allerdings halten sich viele Robots, Spider oder Crawler nicht daran. Deswegen erscheint es aus meiner Sicht als nicht wirklich nützlich.

Beispiel:
User-agent: EmailCollector
Disallow: /

User-Agent: Googlebot
Allow: /


Zum Schluss noch ein Beispiel, wie Sie allen Spidern erlauben Ihre Seiten unter dem Protokoll http zu spidern aber unter dem Protokoll https die Finger davon zu lassen.

Für Ihr http-Protokoll (http://IhrServer.de/robots.txt):
User-agent: *
Allow: /

Für Ihr https-Protokoll (https://IhrServer.de/robots.txt):
User-agent: *
Disallow: /
 
Moderator informieren   Gespeichert Gespeichert  
  Kein öffentlicher Schreibzugriff erlaubt, bitte erst registrieren!
      Themen Autor Datum
    thread link
Aufbau der robots.txt Datein
admin 23.02.2008 16:11
Zum Anfang gehen Neues Thema
Powered by FireBoarddie neusten Beiträge direkt auf Ihrem Desktop erhalten