WDF*IDF ist wertvoll für SEO – wenn man es einzusetzen weiß

Das Konzept des WDF*IDF hat das Potenzial, angehende SEO-Experten zum Verzweifeln zu bringen. Dabei macht es die Textoptimierung ganz einfach! Wir haben uns eingehender mit diesem Konzept zum Verbessern von Texten beschäftigt und beleuchten auch die Hintergründe.

WDF*IDF definiert

Grob gesagt, zeigt die Formel WDF*IDF, wie oft ein Keyword in einem Dokument genannt wird und setzt das Ergebnis in Verhältnis zur Häufigkeit des Keywords in anderen um dieses Keyword konkurrierenden Texten. Dabei kann es sich bei einem Keyword durchaus um einen Term aus mehreren Worten handeln.

Die Mathematik hinter dem Konzept

Rein mathematisch betrachtet, steht WDF für „within document frequency“.
Hier ist die Formel:

WDF(i,j) = log2 (Freq i,j +1) / log2 (L)

Dabei steht i für das Keyword (Das Keyword kann aus mehreren einzelnen Worten bestehen)
J bedeutet Dokument
L bedeutet Gesamtzahl der Wörter im Dokument j
Freq (i,j) bezeichnet die Häufigkeit des Wortes i im Dokument j

IDF steht für „inverse document frequency“.

IDFt = log(1+ ND / ft)

Dabei bedeutet ND die Anzahl der Dokumente
ft beschreibt die Anzahl der Dokumente das Keyword t enthalten

Die Ergebnisse beider Berechnungen werden multipliziert, also WDF*IDF. Das Verhältnis der Keyword-Gewichtung im betrachteten Text wird hiermit ins Verhältnis zur Gewichtung desselben Keywords in der Gesamtheit der betrachteten Texte gesetzt.

So lese ich die Ergebnisse eines WDF*IDF-Rechners

Ist der Wert hoch, kommt ein Keyword häufig in einem Dokument vor. Ist das Ergebnis jedoch niedrig und das Keyword wird oft in einem Text genannt, kann man davon ausgehen, dass es auch in den anderen Dokumenten oft vorkommt. Das ist bei Stoppwörtern der Fall. Aber auch bei allen anderen Wörtern, die nicht oder nur wenig dabei helfen, den Inhalt des Dokuments einzuordnen.

Diesen Wert für jedes Keyword zu errechnen ist mühselig. Daher haben SEO-Tools wie Semrush, Sistrix, Ryte und viele weitere einen WDF*IDF-Rechner. Kostenlos gibt es sowas natürlich auch, nämlich auf www.wdfidf-tool.com.

Screenshot wdfidf-tool
Screenshot wdfidf-tool

Gezeigt wird auf der x-Achse des genannten kostenfreien WDF*IDF-Tools der Maximalwert der Gesamtheit der Dokumente als blaue Säule. Praktischerweise wird anhand von einer gelben Linie der Wert der betrachteten Seite darübergelegt.

Dieser Wert wird auf der x-Achse nebeneinander für einzelne Keywords markiert, die in den betrachteten Dokumenten vorkommen. Ist die Linie für den betrachteten Text höher als der Balken, wurde das entsprechende Keyword häufiger als bei allen Dokumenten verwendet. Ist die Linie kürzer, wird das Keyword seltener oder sogar gar nicht erwähnt.

Diese Rückschlüsse ziehen Sie aus den Werten

Die entstehenden Werte zeigen auf, welche relevanten Synonyme zum Keyword im Text fehlen. Auch nennt es Begriffe, die in Konkurrenztexten öfters verwendet werden. Zusätzlich zeigt es an, wenn ein Begriff häufiger als bei den analysierten Texten auftaucht. Das kann für Suchmaschinen ein Signal für Keyword-Stuffing sein. In einem solchen Fall sollte der betroffene Term ersetzt werden. Befolgt ein Autor diese Hinweise, reagieren Suchmaschinen entsprechend: Der Text wird weiter vorn in den Suchmaschinenergebnissen angezeigt.

Die WDF*IDF-Analyse ist nur ein Teil der Onpage-Optimierung. Andere Aspekte, wie die Bounce-Rate, unique Content, die Verweildauer oder die Interaktionen für die Seite sind wichtig, um andere Aspekte der SEO zu beleuchten. Denn nach wie vor: Texte (und anderer Content) werden in erster Linie für Menschen erzeugt, nicht für Algorithmen von Suchmaschinen. Mehrwert für die Zielgruppe, Lesefluss und Emotionalisierung sind Aspekte, die daher auch berücksichtigt werden müssen. Folglich sollten Sie niemals nur ein einzelnes Tool für die alleinige Bewertung Ihres Contents heranziehen.

Wann funktioniert die WDF*IDF-Analyse – und wann nicht?

Die WDF*IDF-Analyse ist ein wertvolles Tool, um Texte zu optimieren. Denn diese Analyse macht den Content von Konkurrenten vergleichbar. Bereits vor dem Schreiben des Textes gibt es Hinweise zu aktuell genutzten Synonymen. Interessant ist, dass der Content auch für Keywords rankt, die im Text gar nicht explizit vorkommen. Das ist häufig bei Evergreen-Content der Fall, der etwas beschreibt, sich aber zwischenzeitlich die Begrifflichkeiten geändert haben. Ein Beispiel dafür wäre das „Seniorenhandy“ oder „Grosstastenhandy“.

Allerdings hat die WDF*IDF-Analyse auch Nachteile. Erst ab einer bestimmten Textlänge ist das Tool aussagekräftig. Daher ist es nicht auf kurze Shop-Texte anwendbar. Die Erfahrung zeigt, dass diese Analyse die wertvollsten Ergebnisse liefert, wenn die bewerteten Texte der Suchintention „Information“ zuzuordnen sind. Bei transaktionalen Keywords, wie „Bücher kaufen“ liefert das Tool weniger exakte Ergebnisse. Es macht wenig Sinn, die WDF*IDF-Analyse bei allgemeinen Begriffen einzusetzen. Auch bei hart umkämpften Keywords sind die Ergebnisse wenig hilfreich.

Quellen

https://www.verdure.de/magazin/…
www.eology.de/wiki/…
www.wdfidf-tool.com/
www.seo-kueche.de/lexikon/…
de.ryte.com/magazine/…
www.seobility.net/de/…