Cat

Nazwa

Cat – proste narzędzie do klasyfikacji tekstów

Opis

Narzędzie umożliwia dokonanie klasyfikacji (grupowania) tekstów według jednego z kryteriów: (1) klasyfikacja tematyczna wg modelu wyuczonego na pięciu kategoriach wikipedii, (2) klasyfikacja tematyczna wg modelu wyuczonego na tematyce prasowej, (3) klasyfikacja według podobieństwa stylu gramatycznego do stylu jednego ze znanych polskich pisarzy XIX i XX wieku, (4) wykrywanie udziału języka w całym korpusie. Analizie można poddać dowolny korpus spakowany do postaci archiwum .zip. Możliwe jest również wykonanie grupowanie zaawansowanego grupowanie według innych modeli lub dużych ilości tekstów – w tym celu prosimy o kontakt pod adresem: webserwisy@clarin-pl.eu

Materiały pomocniczne:

Link do instrukcji

Przykładowe zastosowania