WDF * IDF: Was bringt die neue Keyworddichte für die Texterstellung?

Kein anderes Thema wird derzeit in der SEO-Szene heißer diskutiert als eine Formel, die im Information Retrieval bereits seit den 1970er Jahren bekannt ist und als „neue“ Keyworddichte die Runde macht: WDF * IDF. Tools hierzu sprießen wie Pilze aus dem Boden und auch die ersten großen SEO-Suiten wie Xovi erweitern ihre Tools um entsprechende Funktionalität. Doch was verbirgt sich dahinter und wie kann man im Redaktionsalltag aus der Formel Nutzen für die Textoptimierung ziehen?

Kritikpunkte an der „alten“ Keyworddichte, die als Quotient aus der Anzahl eines bestimmten Keywords und der insgesamt in einem Dokument vorkommenden Wörter definiert wird, gibt es mannigfach:

  • Umwelt (=Konkurrenz) wird nicht berücksichtigt.
  • Keyworddichte steigt linear mit Vorkommen des Keywords in einem Text an.
  • Synonyme finden keine Berücksichtigung.
  • usw.

Bezogen auf die ersten beiden Punkte bietet WDF * IDF bereits eine bessere Abbildung der Realität: die sogenannte Gewichtung eines Terms in einem Dokument. Für jeden sinntragenden Begriff innerhalb eines Textes wird dieser Wert berechnet. Dadurch kann für jedes Dokument ein sogenannter „Fingerabdruck“ ermittelt und Dokumente untereinander verglichen werden. Da angenommen werden kann, dass die topplatzierten Wettbewerber zu einem Schlüsselbegriff in Sachen Content bereits einiges richtig gemacht haben müssen, orientiert man sich bei der Optimierung der eigenen Seite an diesen und versucht deren „Fingerabdruck“ so gut wie möglich nachzubilden (analog versucht man auch im Linkbuilding sich vom Linkprofil her an die Besten anzunähern).

WDF (Within-document Frequency) ist dabei grob gesagt nichts weiter als die „alte“ Keyworddichte, die durch den Logarithmus gestaucht wird; IDF (Inverse Document Frequency) setzt den Begriff in Relation zu allen anderen Dokumenten im Index einer Suchmaschine. Kommt ein Begriff insgesamt gesehen häufig vor (zum Beispiel Stoppwörter wie „und“, „oder“, „aber“ etc.), ist dieser Wert niedrig; bei geringem Vorkommen (zum Beispiel „Praxisausfallversicherung“) ist dieser Wert hoch.

Analyse der Topplatzierten

Ohne die Unterstützung durch (kostenpflichtige) Tools ist eine solche Analyse aber praktisch nicht möglich. Glücklicherweise existieren mittlerweile Tools mit WDF/IDF-Funktionalität, wie zum Beispiel Onpage.org oder Seolyze.com. Diese berechnen unter anderem den WDF/IDF-Wert für jedes Wort eines Dokuments und führen eine Analyse der Top-Mitbewerber zu dem angegebenen Schlüsselbegriff durch.

Im Folgenden wird gezeigt, welche Möglichkeiten Seolyze.com bietet, das als reines WDF/IDF-Tool konzeptioniert wurde. Als Referenz-Projekt wurde ein Herrenschuh-Shop gewählt, der hinsichtlich seiner Texte noch Optimierungsbedarf aufwies, da er für den Begriff „Herrenschuhe“ nur auf der fünften Suchergebnisse-Seite bei Google erscheint.

Weiter oben wurde bereits vom „Fingerabdruck“ geschrieben, den man mittels WDF/IDF-Berechnung für jedes Dokument ermitteln kann. Dieser wird in der nachfolgenden Tabelle für das Referenzprojekt und die Top10-Konkurrenz dargestellt. Aus dieser lässt sich ablesen, welche Wörter wie häufig auf der eigenen Seite und bei den Konkurrenten vorkommen und wo eventuell noch wichtige Wörter (mit hohem WDF/IDF-Wert) fehlen.

Tabelle Übersicht SEOlyze

Wie kann ein Text einer Suchmaschine beweisen ( = prove), dass sich bei ihm alles um „Herrenschuhe“ dreht und beispielsweise nicht um „Herrensocken“? Wie man an den „Proof-Keywords“ (nachfolgende Grafik), die das Tool anhand einer Analyse des Wettbewerbs zu dem entsprechenden Suchbegriff ableitet, sieht, müssen darin neben „Herrenschuhe“ auch die Wörter „Schuhe“, „Stiefel“, „Preis“, „Sneaker“, „Adidas“, „Marken“ und „Boots“ vorkommen. Eine solche Liste mit relevanten Keywords kann ein SEO dann einem Redakteur zukommen lassen, der mit der Erstellung eines Textes zum Thema „Herrenschuhe“ beauftragt wurde. Eine konkrete Angabe, wie häufig dieses oder jenes Schlüsselwort Verwendung finden sollte, liefern die Grafiken nicht. Mittels eines eingebauten WDF/IDF-Editors lassen sich allerdings die eigenen Texte immer weiter optimieren, bis sie sich an die „Idealkurve“ annähern.

Proof Keywords Herrenschuhe Seolyze.com

Selbstverständlich kann man es auch übertreiben und ein bestimmtes Keyword überdurchschnittlich häufig verwenden, Stichwort „Überoptimierung“. Spätestens seit letztem Jahr sollten die eigenen Seiten keinerlei Spam-Signale mehr an Suchmaschinen senden. Am untersuchten Herrenschuh-Shop wird deutlich, dass hier die Wörter „Herrenschuhe“, „Schuhe“ und „Converse“ im Vergleich zu allen anderen Projekten im Schnitt zu häufig im Dokument auftaucht (braune Linie, die über den maximalen WDF/IDF-Wert herausragt).

Herrenschuhe Spam Signal Suchmaschinen

Suchmaschinen wie Google scheinen auch Diversität in ihren Suchergebnissen zu fördern. Das bedeutet, dass neben dem Hauptthema einer Seite auch ein Nebenthema beleuchtet werden sollte, mit dem man sich von den Topplatzierten abhebt. Berichten diese in ihren Texten beispielsweise ausführlich über Farbe, Aussehen und Preis, aber kaum über den einzigartigen Tragekomfort oder Stylingmöglichkeiten, so kann es sich lohnen, bei der Texterstellung diese Nische zu besetzen.

Gesamtübersicht Seolyze

Fazit: Für Textersteller bietet sich dank WDF/IDF die Möglichkeit, noch unentdecktes Keyword-Potenzial zu erkennen und in den eigenen Texten zu berücksichtigen – auch wenn die entsprechenden Tools hier in einigen Bereichen in Sachen Usability sicherlich noch Nachholbedarf haben (insbesondere was die grafische Aufbereitung angeht). Ansonsten: Wer bisher schon Synonyme und themenverwandte Begriffe in seinen Texten verwendet hat, hat intuitiv auch ohne Kennntnis von WDF/IDF in Sachen Textoptimierung bereits einiges richtig gemacht. Außerdem muss nicht zuletzt betont werden, dass eine inhaltliche Optimierung nach einer Formel letztlich nur einen Rankingfaktor von vielen darstellt.

abgelegt unter: SEO

Tags: , , , , , , , , , , ,

6 Comments

Stef

Hallo,

danke für den Beitrag, er hat etwas Hell ins Dunkel gebracht. Was mir noch nicht ganz klar ist, ist die Interpretation des WDF*IDF Balkendiagramms (Vorletztes Bild). Sollte mein Text sich nun zwischen Durchschnitt und Maximum bewegen, um mich so als „besonders relevant“ einzustufen oder sollte ich mich für alle Proof Keywords genau im Durchschnitt befinden?
Ich spiele mit dem Gedanken mir ein eigenes kleines Tool zu basteln, das sollte mit C# eine relativ simple Angelegenheit sein.

Reply
Martin

Hallo Stef,
Es freut mich, dass mein Artikel bei dir etwas Licht ins WDF/IDF-Dunkel gebracht hat. Zu deiner Frage: Eine genaue Antwort darauf kann dir natürlich nur Google liefern ;). Nein, im Ernst: Wenn du mit deiner Kurve für die wirklich wichtigen Keywords (Very High bzw. High-Proof Keywords)zwischen Maximal- und Durchschnittswert (und niemals über der roten Maximalkurve) liegst, solltest du alles richtig machen – zumindest der Theorie nach. Probiere es einfach mal aus und berichte, ob es was gebracht hat! :) VG, Martin

Reply
Florian

Wir haben auf http://www.wdfidf-tool.com ein kostenloses Tool rausgebracht. Es ist keine Anmeldung oder Registrierung notwendig. Wer sich das mal ansehen möchte und uns Feedback gibt, ist gerne willkommen. Wir entwickeln und verfeinern das Ganze WDF*IDF Ding noch weiter :)

Reply
Karin Taiber

Guten Tag,
die neue Keyworddichte für die Texterstellung ist ein interessanter Artikel und vokalem sehr aufschlussreich. Vielen Dank für die neuen Eindrücke.

Beste Grüße
Karin Taiber

Reply

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *