Topic

Nazwa

Topic – narzędzie do modelowania tematycznego (topic modeling)

Opis

Topic jest narzędziem umożliwiającym tworzenie analizy tematycznej zbiorów tekstów. Umożliwia ono wyznaczenie i ekstrakcję określonej przez użytkownika liczby tematów (topików) z korpusu tekstów. Program umożliwia wprowadzenie korpusu jako archiwum .zip lub linku do archiwum wgranego na platformę Clarin Cloud lub inne repozytoria danych. Wyniki analizy dostępne są do wglądu na stronie w postaci wizualizacji oraz jako pobieralne pliki z danymi (json, xslx). Możliwe jest również pobranie wizualizacji poszczególnych topików – plików z chmurami słów.

Czym jest analiza tematyczna? Jest to skomplikowane działanie na grupie tekstów, w wyniku którego program ustala charakterystyczne grupy słów warunkujących wzajemnie swoje występowanie w całym zbiorze tekstów. Często grupy te są spójne semantycznie – można wtedy mówić o wyodrębnieniu tematu/wątku w klasycznym rozumieniu tego terminu.

Przykładowe zastosowania

Grupowanie tekstów wg podobieństwa, analiza podobieństwa, analiza semantyczna tekstów, analiza genologiczna