TF-IDF

Nazwa

TF-IDF

Opis

TF-IDF (z ang. TF – term frequency, IDF – inverse document frequency) jest narzędziem podstawowym, które wykorzystywane jest w bardziej złożonych aplikacjach (np. w WebSty). Narzędzie to jest jedną z metod obliczania wagi słów w oparciu o liczbę ich wystąpień, należąca do grupy algorytmów obliczających statystyczne wagi terminów. Każdy dokument reprezentowany jest przez wektor, składający się z wag słów występujących w tym dokumencie. TF-IDF informuje o częstości wystąpienia termów uwzględniając jednocześnie odpowiednie wyważenie znaczenia lokalnego terminu i jego znaczenia w kontekście pełnej kolekcji dokumentów. Algorytm stosowany jako metoda oceny relewantności dokumentu. Kolejnym zastosowaniem jest ocena podobieństwa dokumentów w systemach grupowania wyników oraz systemach typu antyplagiat.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia TermoPL, prosimy o cytowanie tej publikacji):

Materiały pomocniczne:

Dostęp

Link do instrukcji

Przykładowe zastosowania