|
| | Beschreibung der Seite mittels Metainformationen
Was sind eigentlich Metatags und wozu dienen Sie? In
Meta-Angaben können verschiedene nützliche Anweisungen für Web-Server,
Web-Browser und Suchmaschinen-Robots hinterlegt werden. Meta-Angaben können
Angaben zum Autor und zum Inhalt der Datei enthalten. Sie können aber auch
HTTP-Befehle zum Beispiel zum automatischen Weiterleiten des Web-Browsers zu
einer anderen Adresse beinhalten.
Grundsätzlich befinden sich die Metatags im Header
einer Webseite. Lesen Sie hier eine gute Einführung
in Metatags
Auch wenn die Meta-Tags für das Suchmaschinenranking
immer mehr an Bedeutung verlieren, da die Rankingalgorithmen mittlerweile so
clever sind, dass der Inhalt der Seite und auf die Seite weisenden Links einen
deutlich höheren Stellenwert für ein gutes Ranking der Webseite haben, sollten
die folgenden Informationen in den Meta-Tags hinterlegt werden:
| <head>
<title>Suchmaschinenoptimierung</title>
<meta name="Description"
content="Michael Schmarje - Zahna - Webtools -
Suchmaschinenoptimierung - PageRank - Link Popularity Check -
Suchbegriffe">
<meta name="Keywords" content="Webtools,
Suchmaschinenoptimierung, PageRank, Link Popularity Check, Suchbegriffe,
Linkpopularität">
<meta name="Language" content="de">
<meta http-equiv="Content-Type"
content="text/html; charset=windows-1252">
</head>
|
Besonders wichtig für das Ranking sind folgende
Informationen:
 | Zeichenkodierung: deutsch
<meta http-equiv="content-type"
content="text/html; charset=windows-1252"> oder
<meta http-equiv="content-type" content="text/html;
charset=ISO-8859-1">
=> ISO-8859-1: Albanisch, Dänisch, Deutsch, Englisch, Farörisch, Finnisch, Französisch, Galizisch, Irisch, Isländisch, Italienisch, Katalanisch, Niederländisch, Norwegisch, Portugiesisch, Schwedisch, Spanisch.
=> ISO-8859-2: Kroatisch, Polnisch, Rumänisch, Slowakisch, Slowenisch, Tschechisch, Ungarisch.
=> ISO-8859-3: Esperanto, Galizisch, Maltesisch, Türkisch (Türkisch s. auch ISO-8859-9).
=> ISO-8859-4: Estnisch, Lettisch, Litauisch.
=> ISO-8859-5: Bulgarisch, Mazedonisch, Russisch, Serbisch, Ukrainisch.
=> ISO-8859-6: Arabisch.
=> ISO-8859-7: Neugriechisch.
=> ISO-8859-8: Hebräisch.
=> ISO-8859-9: Türkisch.
=> ISO-8859-10: Grönländisch (Inuit), Lappisch (Sami).
Diese Angabe des Dateitypes und des korrekten Zeichncodes sollte am Anfang
der Meta-Tags stehen.
|
 | Titel (title)
<title>Webtools</title>
|
 | Datum der Erstellung/letzten Bearbeitung
|
 | Suchmaschinenspider steuern
meta name="robots" content="index,
follow" oder meta name="robots" content="all"
=> Spider dürfen diese Seite indizieren und den Links auf dieser
Seite folgen um Spidern das Indizieren bzw. Folgen der Links zu verbieten
setzen Sie das Attribut "noindex" oder "nofollow" bzw.
soll beides verboten werden anstelle von "all" "none"
|
 | Beschreibung (description)
<meta name="Description" content="Michael
Schmarje - Zahna - Webtools - Suchmaschinenoptimierung - PageRank - Link
Popularity Check - Suchbegriffe">
=> Es sollten nicht mehr as 2...3 Sätze mit 80....250
Zeichen verwendet werden. Die meisten Suchmaschinen indizieren die ersten
250 Zeichen, die dann oft auch als Kurzbeschreibung angezeigt werden.
=> Google nutzt dieses Tag nicht als Kurzbeschreibung, sondern zeigt in
der Trefferliste den Text rund um den Suchbegriff aus dem Text im Body der
Seite an.
|
 | Suchwörter (keywords)
<meta name="Keywords" content="Webtools,
Suchmaschinenoptimierung, PageRank, Link Popularity Check, Suchbegriffe,
Linkpopularität">
=> die Chance noch weitere Suchbegriffe zu dieser Seite zu hinterlegen;
einige Suchmaschinen (z.B. Lycos) ignorieren die Keywords bereits wieder, da
diese im Gegensatz zum Text der Webseite einfacher zu manipulieren sind
=> allerdings gilt auch hier nicht viel hilft viel! Es sollten nicht mehr
als 20 Wörter sein, die in der Regel auch im Text der Seite wieder
vorkommen sollten und die wichtigsten Schlüsselwörter sollten am Anfang
stehen
=> Einzelne Wörter sollten nur einmal genannt werden - in Kombination
mit anderen Wörtern sollte ein Wort auch nicht öfter als dreimal
erscheinen
=> Trennung der einzelnen Keywords durch Komma und Leerezeichen ist
üblich
|
 | Sprache (language)
<meta name="Language" content="de">
=> Google erkennt die Sprache der Seite anhand des Inhaltes; für einige
andere Suchmaschinen kann es insbesondere bei nicht englischen Seiten
sinnvoll sein, die Sprachinformation zu hinterlegen. Die zusätzliche Angabe
der Ländercodes für Österreich und die Schweiz bei deutschen Webseiten
wird kontrovers diskutiert, scheint aber keinen Effekt auf das Ranking der
Webseite zu haben - daher nutze ich die übliche Kennzeichnung DE für die
deutsche Sprache.
=> eine Landesspezifische Suchmaschinen erfassen z.B. nur Seiten der
Sprache "DE"
|
 | Autor (author)
<meta name="author" content="Michael
Schmarje, Zahna">
|
Eine Angabe folgender Information hilft nicht
unbedingt, stört aber auch nicht:
 | Suchmaschinen revisit
<meta name="revisit-after" content="14 days">
=> die Suchmaschine soll die Seite nach 14 Tagen wieder indizieren - in
der Regel folgen die Suchmaschinen dieser Metainformation nicht, sondern
besuchen die Seite nach einen Zeitraum wieder, der suchmaschinenindividuell
anhand verschiedener Kriterien wie z.B. Ranking der Seite, wie oft wird die
Seite aktualisiert, wie viele externe Links von relevanten Seiten zeigen auf
die Seite
|
Daneben gibt es eine Reihe weiterer Metainformationen,
die z.B. auf ein bestimmtes CMS verweisen, oder weitere Details zur Seite
verraten, die aber mangels Verbreitung und Standardisierung eher selten genutzt
werden.
Weitere Details sind übersichtlich zusammengestellt auf www.at-web.de
Robots.txt - Der Wegweiser für Suchmaschinen
Nicht immer soll der gesamte Inhalt eines Webservers in
Suchmaschinen aufgenommen werden. Häufig gibt es private Bereiche, die
Bildersammlung oder pdf-Dokumente, die nur über den Inhalt der Webseite
gefunden werden sollten.
Dann heißt das Tool der Wahl robots.txt. Diese
Textdatei im Rootverzeichnis des Webservers bei mir z.B. hier: www.schmarje.net/robots.txt.
Für meine Webseite habe ich folgende Regeln definiert:
User-agent: *
Disallow: /_borders/
Disallow: /_derived/
Disallow: /_fpdass/
Disallow: /_overlay/
Disallow: /_private/
Disallow: /_themes/
Disallow: /_vti_cnf/
Disallow: /_vti_pvt/
# Disallow: /images/
Disallow: /logs/
Disallow: /puretecgen_data/
Disallow: /thumb/
In diesem Fall bedeutet das, dass ich alle
Suchmaschinen bitte - meistens wird das auch befolgt - die mit disallow
gekennzeichneten Verzeichnisse nicht zu spidern. Damit werden z.B. Bilder im
Bereich /thumb/ nicht gespidert und können über externe Suchmaschinen nicht
gefunden werden. Den Bereich /_private/ habe ich natürlich nicht nur mit der
robots.txt "geschützt", sonder auch auf dem Webserver mit einem
entsprechenden Passwortschutz versehen.
Die robots.txt kann natürlich auch genutzt werden, um
suchmaschinenspezifische Regelungen zu treffen. So kann man z.B.
Massendownloader vom Grafikverzeichnis fernhalten:
User-agent: wget
User-agent: webzip
User-agent: webmirror
User-agent: webcopy
Disallow: /cgi-bin/
Und noch ein weiterer Hinweis zum Syntax in der
robots.txt:
User-agent: *
Disallow: /index => alle Dateien und Ordner, die mit index beginnen werden ausgelassen
Disallow: /index/ => alle Dateien im Ordner index werden ausgelassen
Hier kann man auch Toolgestützt eine robots.txt
erstellen und prüfen.
| |
|