Textoptimierung für Suchmaschinen: WDF*IDF – WTF?

Wer bei Google gewinnen will, hat viel Arbeit vor sich. Das reicht von der Wahl eines schnellen und sicheren Servers über die passende Länge der Meta-Description bis zur korrekten Verwendung von Canonical-Tags.

Um einen der ersten Plätze zu belegen, müssen auch die Inhalte einer Seite passen. Schlüssel dazu, so in vielen Online-Marketing-Ratgebern zu lesen, ist Textoptimierung für Suchmaschinen, verbunden mit WDF*IDF. Dabei handelt es sich um einen mathematischen Schlüssel, der das Verhältnis von Keyword zur Textmenge in Relation zu den Inhalten auf den Top-Seiten in der Google-Suche setzt. Wenn bei Ihnen im Kopf jetzt WTF aufleuchtet und Sie nur noch Bahnhof verstehen: Wir haben uns an einer etwas leichtern Erklärung versucht. 

Was ist WDF*IDF? (komplizierte Erklärung)

Der Theorieteil gleich zu Beginn: WDF ist die Abkürzung für Within-document Frequenzy. Mit ihr wird die dokumentenspezifische Gewichtung von Termen errechnet. Der Wert wurde für die Informatik-Teildisziplin „Information Retrival“ erdacht und kommt deshalb auch mit einer hübschen Formel im Gepäck:

Mit der WDF wird errechnet, wie hoch die Vorkommensdichte eines Terms innerhalb eines Dokumentes ist. Dieser Wert dient als Referenz, um zu ermitteln, wie häufig ein Begriff in einem Text verwendet werden sollte, damit eine Suchmaschine ihn für relevant in Bezug auf ein bestimmtes Keyword hält.

Und IDF?

Die WDF wird multipliziert mit der IDF (Invers document frequency). Dieser Wert berechnet die Bedeutung eines Terms in Bezug auf einen Gesamtkorpus an Texten. Die These ist, dass Begriffe, die in vielen Dokumenten vorkommen, weit weniger relevant für ein Thema sind, als solche mit geringer Verbreitung. Worte wie „und“, „ist“ oder „das“ haben einen niedrigen Wert (meist nahe 1) und beeinflussen das Gesamtergebnis daher kaum. (WDF*1 =WDF; WDF*2= doppelter WDF)

Geht das auch unkomplizierter? (einfache Erklärung)

Versuchen wir’s. WDF verrät, wie häufig ein Wort in einem Dokument vorkommt. Da Texte nicht alle gleich lang sind, wird ein Wert berechnet, der das Verhältnis von Wort zu Textlänge beschreibt. Diesen nutzen wir als Orientierung für die Optimierung, um beispielsweise einen Blogartikel oder eine Landingpage für einen bestimmten Suchbegriff zu einem passenden Ergebnis zu erstellen.

Ein Beispiel: Wenn in einem Artikel, der für Sonnenblumen ranken soll, das Wort Sonnenblume ein einziges Mal auf 4.000 Wörtern vorkommt, weil sonst von Pflanzen die Rede ist, hält eine Suchmaschine diesen Text für wenig relevant in Bezug auf Sonnenblumen, allerdings für wichtiger, wenn es um Pflanzen geht. Wir wollen aber für Sonnenblumen ranken, nicht für Pflanzen. Wir müssen uns also als Erstes daran machen, öfter von Sonnenblumen zu schreiben.

Und was ist mit diesem IDF?

Doch wie oft soll ich denn von Sonnenblumen schreiben? An dieser Stelle hilft uns eine andere Zahl weiter. Der IDF-Wert (Invers document frequency) gibt uns Aufschluss darüber, wie relevant ein Wort in Bezug auf eine Gesamtmenge von Texten (in der Linguistik ist von einem Korpus die Rede) ist. Begriffe, die häufig vorkommen (und, ist) sind vermutlich weniger entscheidend, als Begriffe, die selten auftreten (wie Sonnenblume).

Was bringen mir denn nun diese ganzen Infos?

Wir wollen Texte verfassen, die von der Suchmaschine als relevant für ein bestimmtes Thema betrachtet werden. Problem: Die Bots und Algorithmen, die im Hintergrund arbeiten, lesen nicht. Sie verstehen nicht, was geschrieben wird, sondern wenden Formeln an, um zu ermitteln, was wichtiger oder unwichtiger ist. Um Inhalte zu verfassen, die möglichst weit oben auf den Suchergebnisseiten stehen, müssen wir deshalb so schreiben, dass wir diesen Anforderungen gerecht werden.

An dieser Stelle nutzen wir den Umstand, dass es bereits unzählige Texte zu dem Thema gibt, zu unserem Vorteil. Wir schauen uns an, was der Rest macht. Dazu nehmen wir uns die ersten 10, 20 oder 100 Suchergebnisse zu einem bestimmten Begriff und rechnen für jeden einzelnen den WDF-Wert aus. Mit dem Durchschnitt dieser Ergebnisse erhalten wir schließlich einen Wert, den wir als Orientierung für unsere weitere Arbeit nutzen können.

Okay, WDF macht Sinn. Was ist mit IDF?

Die für die IDF erhobenen Daten helfen uns dabei, unseren Text zu optimieren. Sie verraten uns, wie oft der Wettbewerb bestimmte Begriffe und Therme zu einem Thema einsetzt. An diesen können wir uns orientieren, um ebenfalls einen für Google relevanten Artikel zu verfassen.

Und weil wir die ganze Rechnerei natürlich nicht von Hand machen, nutzen wir praktische Tools, die diese Arbeit für uns erledigen. Sie sagen uns ganz genau, wie oft wir ein Wort scheiben sollten und ab wann es zu viel wird. Einen Text zu optimieren, ist im Grunde kein Hexenwerk. Die eingesetzten Tools übernehmen alle Arten von Messungen und machen genaue Angaben darüber, wie häufig bestimmte Begriffe verwendet werden müssen.

Passende Werkezeuge

WDF-Tools erleichtern uns die Arbeit erheblich. In erster Linie, weil wir nicht selbst rechnen müssen, aber auch, weil sie eine ganze Reihe weiterer Metriken aufweisen, die unsere Texte besser machen. Wie bei vielen Dingen gibt es auch hier eine riesige Auswahl. Die einfache Faustregel lautet: Qualität kostet Geld. Kostenfreie Programme leisten rudimentäre Arbeit, lassen nur beschränkte Längen zu oder haben ein Maximallimit an Texten pro Monat.

Wenn Sie eine Seite professionell WDF*IDF-optimieren wollen, benötigen Sie ein professionelles Tool. Eine gute Übersicht findet sich auf der Seite des OMT. Die Preise beginnen irgendwo zwischen 50 und 100 Euro pro Monat, können jedoch deutlich steigen.

Und damit werden Texte besser?

Zumindest für diesen Teil der Bewertung einer Seite. Google hat da leider noch ein paar mehr. So fließt zum Beispiel auch die Verweildauer eines Nutzers auf Ihrer Internetseite mit in die Bewertung ein. Verschwindet er bereits nach wenigen Sekunden wieder, kann das Plätze kosten. (Oder auch nicht. Über das Thema gibt es auch bei uns in der Agentur verschiedene Ansichten.) 

Um Texte zu verfassen, die Menschen auch wirklich interessieren und lesen wollen, ist es in aller Regel nicht ratsam, an jeder gerade passenden Stelle Keywörter einzusetzen. Nehmen Sie nur einmal folgenden Text:

Sonnenblumen (Helianthus) sind eine Gattung innerhalb der Familie der Korbblütler (Asteraceae). Bei der Sonnenblume handelt sich um ein- oder mehrjährige Pflanzen oder Gewächse mit Wuchshöhen zwischen 25 und 300 Zentimeter. Einige Arten der Sonnenblume bilden Rhizomknollen als Überdauerungsorgane. Die gelben Blüten der Sonnenblumen stehen einzeln oder in Gruppen und öffnen sich im Sommer.

Nur bis zum Ende durchgehalten, weil der Text extrem kurz ist? Kein Wunder, denn ein Leser merkt sehr schnell, dass dieser Inhalt nicht für ihn bestimmt ist. Dennoch sind solche und noch weitaus schlimmere Text nicht selten auf zahlreichen Seiten zu finden. Weil Sie noch immer funktionieren, zumindest bis zu einem gewissen Grad. In wenig umkämpften Nischen oder weiter entfernt von den Top-Platzierungen lassen sich so ohne großen Aufwand einige Plätze gutmachen. Wenn es allerdings Ihr Ziel ist, Menschen auf Ihre Seite zu holen, die sich auch für Ihre Inhalte, sprich Produkte und Dienstleistungen, interessieren, ist diese Methode sicher nicht die beste.

Ist das noch zeitgemäß?

Ein klares „Naja“. Denn es gibt, wie so oft, einen gewaltigen Unterschied zwischen dem, was Google erzählt, und dem, was Statistiken, Zahlen und die Erfahrung zeigen.

Google sagt, im Mittelpunkt einer Seite steht der Inhalt, der sich auf ihr befindet. Diesen zu erfassen, seinen Sinn zu erkennen und nachzuvollziehen, wieviel Mehrwert dieser in Bezug auf ein bestimmtes Thema legt, ist eine der Kernkompetenzen der Suchmaschine. Diese wird zudem mithilfe von regelmäßigen Updates angepasst und auch durch KI-Systeme optimiert. Metriken wie WDF*IDF oder TF*IDF (sehr ähnliche Methode) werden nicht mehr verwendet. Sie zur Optimierung zu nutzen, ist Zeitverschwendung. Die Arbeit sollte besser in guten, für den User aufbereiteten Content investiert werden.

Dennoch hilft es, sich mit dem Prinzip vertraut zu machen. Denn nach irgendwelchen Kriterien muss eine Seite nun mal bewertet werden, um ein Ranking aufzubauen. WDF*IDF kommt dem von Google verwendeten System sehr nahe. Eine entsprechende Optimierung durchzuführen, ist deshalb für SEO-Arbeiten – trotz aller Kritik – absolut sinnvoll.

Trotz allem sollten diese Arbeiten keinesfalls an erster Stelle stehen. Wir reden hier nicht von Low Hanging Fruits. Vernünftiges WDF*IDF ist zeitintensiv und den Spagat zwischen interessanten Inhalten und einer sinnvollen Optimierung zu schaffen, ist eine Herausforderung. Für die letzten ein oder zwei Plätze auf dem Weg in die Top 10 eines umkämpfen Keys ist es allerdings unerlässlich.