Spacy

Nazwa

Spacy – prosty tager, parser i rozpoznawacz nazw własnych dla wielu języków

Opis

Jest to proste narzędzie rozpoznające części mowy, nazwy własne oraz dokonujące parsingu dla tekstów w różnych językach: polskim, angielskim, niemieckim i hiszpańskim. Tekst, dla którego chcemy dokonać tagowania, może być wprowadzony ręcznie lub poprzez wczytanie korpusu (archiwum .zip). Wynik otrzymujemy w formie pliku XML lub czystego tekstu (po najechaniu kursorem myszy na wyrazy, zobaczymy przypisane im tagi gramatyczne). Jeśli analizie poddano archiwum .zip, dostępna jest również możliwość pobrania paczki z dokumentami zawierającymi wyniki analizy dla poszczególnych tekstów.