Topic
Nazwa
Topic – narzędzie do modelowania tematycznego (topic modeling)
Opis
Topic jest narzędziem umożliwiającym tworzenie analizy tematycznej zbiorów tekstów. Umożliwia ono wyznaczenie i ekstrakcję określonej przez użytkownika liczby tematów (topików) z korpusu tekstów. Program umożliwia wprowadzenie korpusu jako archiwum .zip lub linku do archiwum wgranego na platformę Clarin Cloud lub inne repozytoria danych. Wyniki analizy dostępne są do wglądu na stronie w postaci wizualizacji oraz jako pobieralne pliki z danymi (json, xslx). Możliwe jest również pobranie wizualizacji poszczególnych topików – plików z chmurami słów.
Czym jest analiza tematyczna? Jest to skomplikowane działanie na grupie tekstów, w wyniku którego program ustala charakterystyczne grupy słów warunkujących wzajemnie swoje występowanie w całym zbiorze tekstów. Często grupy te są spójne semantycznie – można wtedy mówić o wyodrębnieniu tematu/wątku w klasycznym rozumieniu tego terminu.
Adres bibliograficzny publikacji przewodniej (w przypadku użycia TermoPL, prosimy o cytowanie tej publikacji):
Walkowiak, T.: Language Processing Modelling Notation – Orchestration of NLP Microservices. In: Advances in Dependability Engineering of Complex Systems: Proceedings of the Twelfth International Conference on Dependability and Complex Systems DepCoS-RELCOMEX, 2017, Springer International Publishing, pp. 464-473
Przykładowe zastosowania
Grupowanie tekstów wg podobieństwa, analiza podobieństwa, analiza semantyczna tekstów, analiza genologiczna