WiKNN

Nazwa

WiKNN – klasyfikator tematyczny dla tekstów polskich i angielskich

Opis

WiKNN (Wikipedia K-Nearest Neighbors) automatycznie przypisuje klasyfikatory tematyczne z Wikipedii do tekstów polskich i angielskich. Pozwala to indeksować kolekcje tekstów kategoriami z polskiej i angielskiej Wikipedii. Narzędzie posiada interfejs graficzny dostępny pod adresem http://pelcra.clarin-pl.eu/tools/classifier/# oraz API dostępny pod adresem: http://clarin.pelcra.pl/apidocs/wiknn. Zasada działania klasyfikatora została opisana w następującej publikacji: Dolf Trieschnigg, Piotr Pezik, Vivian Lee, Franciska de Jong, Wessel Kraaij, Dietrich Rebholz-Schuhmann, MeSH Up: effective MeSH text classification for improved document retrieval, Bioinformatics, Volume 25, Issue 11, 1 June 2009, Pages 1412–1418, https://doi.org/10.1093/bioinformatics/btp249.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia WiKNN, prosimy o cytowanie tej publikacji):

Przykładowe zastosowania

Klasyfikator został użyty do anotacji kategoriami Wikipedii korpusu NKJP: http://pelcra.clarin-pl.eu/NKJP/.