Cat

Nazwa

Cat – proste narzędzie do klasyfikacji tekstów

Opis

Narzędzie umożliwia dokonanie klasyfikacji (grupowania) tekstów według jednego z kryteriów:  

(1) klasyfikacja tematyczna wg modelu wyuczonego na pięciu kategoriach grupowania Wikipedii 

(2) klasyfikacja tematyczna wg modelu wyuczonego na tematyce prasowej 

(3) klasyfikacja według podobieństwa stylu gramatycznego do stylu jednego ze znanych polskich pisarzy XIX i XX wieku 

(4) wykrywanie udziału języka w całym korpusie 

Analizie można poddać dowolny korpus spakowany do postaci archiwum .zip. Możliwe jest również wykonanie grupowania zaawansowanego, grupowanie według innych modeli lub dużych ilości tekstów – w tym celu prosimy o kontakt pod adresem: webserwisy@clarin-pl.eu