Co to jest TF IDF i jaki ma wpływ na SEO?

Poznaj tajniki algorytmu TF IDF i sprawdź jak można go wykorzystać do usprawnienia treści i w konsekwencji lepszego pozycjonowania strony.

Co to jest TF IDF?

TF IDF pochodzi od języka angielskiego. TF to skrót od term frequency (częstość wystąpienia słowa). IDF to skrót od inverse document frequency) – odwrotna częstość wystąpienia słowa w dokumentach. To metoda obliczania wagi słów w oparciu o liczbę ich wystąpień.

Upraszczając:

TF IDF informuje o częstości wystąpienia słowa i jego wadze w kontekście wszystkich badanych dokumentów (np. witryn internetowych).

Algorytm ten może być stosowany jako metoda oceny jakości treści przez wyszukiwarki internetowe.

Ciekawostka: TF IDF jest wykorzystywany w systemach typu antyplagiat.

Wzór i przykładowe obliczenia

Uproszczony wzór

TF IDF = TF * IDF

gdzie:

TF – to liczba wystąpień badanego słowa lub frazy w dokumencie (np. stronie internetowej), np. jeżeli słowo „fox” występuje w artykule 10 razy, a cały artykuł ma 500 słów to TF wynosi 10/500, czyli 0,02.

IDF – to logarytm z liczby dokumentów w korpusie podzielonej przez liczbę dokumentów z korpusu, które zawierają badane słowo kluczowe.

Korpus to zbiór wszystkich badanych dokumentów, np. jeżeli badamy strony w top 10 to nasz korpus wynosi 10.

Przykład obliczenia dla IDF. Jeżeli korpus wynosi 10, a badane słowo kluczowe występuje np. w trzech dokumentach w korpusie to IDF wynosi log (10/3), czyli 0.52.

Mając obliczone osobno TF oraz IDF można przejść do obliczenia całości TF IDF, czyli pomnożyć TF razy IDF. W naszym przykładzie będzie to 0,02*0,52 czyli 0.01.

Ciekawostka: Popularne słowa kluczowe, które występują w artykułach to tzw. słowa typu „stopwords”. Przykład: Jeżeli słowo z grupy „stopwords”, np. „aby” wystąpiło w dziesięciu dokumentach w korpusie składającym się z 10 dokumentów, to łatwo obliczyć IDF, czyli log(10/10) = 0. Dzięki temu najczęściej występujące słowa typu „stopwords” mają zerową lub bardzo niską wagę wyliczoną w algorytmie TF IDF.

Dlaczego TF IDF pomaga w SEO?

Obecnie Google w swoich wynikach wyszukiwania premiuje strony, które mają wysoką jakość treści, czyli między innymi dogłębnie opisują dane zagadnienie.

Prosty przykład:

Jeżeli artykuł używa wszystkich ściśle powiązanych słów kluczowych oraz ma odpowiednią długość, to istotny sygnał dla wyszukiwarki, że opisuje zagadnienie w sposób kompletny.

Nasuwa się pytanie jak odkryć słowa kluczowe, które Google traktuje jako istotne i powiązane z tematem artykułu. Aby odkryć słowa, które są powiązane z danym zagadnieniem można użyć algorytmu TF IDF do analizy stron, które już są w top 10. Dzięki temu odkryjesz słowa kluczowe, które są istotne do opisania i umieszczenia w treści.

Jak wykonać analizę TF IDF dla stron z top 10?

Nie ma sensu wykonywać obliczeń ręcznie, ponieważ danych jest bardzo dużo.

Aby zautomatyzować proces obliczeń i maksymalnie ułatwić analizę najlepiej skorzystać z narzędzia TF IDF. Jest ono banalne w obsłudze. Należy jedynie podać adresy stron z top 10 w Google dla danego zapytania, na które planujesz napisać artykuł. Narzędzie przeanalizuje wszystkie strony i wskaże posortowane słowa i frazy według najwyższych wag TF IDF.

Ważna kwestia:

Ale co jeśli Twój artykuł jest już napisany i opublikowany, a nie był optymalizowany pod kątem TF IDF? W narzędziu TF IDF w takim przypadku oprócz stron internetowych z top 10 wpisz także adres swojej strony internetowej. Uzyskasz dzięki temu informacje, jakich dokładnie słów brakuje na Twojej stronie internetowej. Gotową listę słów możesz wkleić w polu „related keywords” w narzędziu Edytor Treści – to ułatwi Ci proces tworzenia treści oraz finalne sprawdzenie, czy wszystkie niezbędne słowa kluczowe są już umieszczone w twoim zoptymalizowanym i usprawnionym artykule.

Podsumowanie

  • TF IDF ma praktyczne i bardzo istotne zastosowanie w SEO i jest szczególnie pomocne w optymalizacji i tworzeniu wysokiej jakości treści.
  • Warto wykonać analizę TF IDF dla stron konkurencji z top 10 wyników organicznych Google przed napisaniem artykułu. Dzięki temu odkryjesz słowa kluczowe, które powinny się znaleźć w artykule.
  • Analizę TF IDF należy wykonać szczególnie dla już opublikowanych artykułów, które nie wyświetlają się na najwyższych pozycjach. Dzięki temu można odkryć brakujące słowa kluczowe, które należy dodać do treści, aby artykuł dokładniej opisywał poruszaną tematykę (wyczerpał temat).
  • Bez optymalizacji pod kątem TF IDF narażasz się w przyszłości na utratę pozycji ze względu na możliwość sklasyfikowania Twojej treści jako niskiej jakości, czyli takiej, która jedynie pobieżnie opisuje zagadnienie.

Daj znać w komentarzu jakie efekty dała optymalizacja pod TF IDF na Twojej stronie?