Korpus 1000 nowel

Nazwa

Korpus 1000 nowel

Opis

Korpus tysiąca tekstów literackich na otwartej licencji stworzony w celu ustanowienia zbioru porównawczego dla narzędzi do automatycznej klasyfikacji tekstów. Korpus zawiera teksty w języku polskim napisane przez polskich autorów. Każdy tekst umieszczony jest w osobnym pliku txt.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Korpusu 1000 nowel, prosimy o cytowanie tej publikacji):

W przypadku wykorzystania w publikacji, prosimy o przypis: Eder, Maciej; Rybicki, Jan; Młynarczyk, Ksenia; et al., 2016, 1000 Novels Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/312.

Przykładowe zastosowania

http://ws.clarin-pl.eu/websty.shtml – jeden z przykładowych zbiorów tekstów pochodzi z Korpusu 1000 nowel