Spacy
Nazwa
Spacy – prosty tager, parser i rozpoznawacz nazw własnych dla wielu języków
Opis
Jest to proste narzędzie rozpoznające części mowy, nazwy własne oraz dokonujące parsingu dla tekstów w różnych językach: polskim, angielskim, niemieckim i hiszpańskim. Tekst, dla którego chcemy dokonać tagowania, może być wprowadzony ręcznie lub poprzez wczytanie korpusu (archiwum .zip). Wynik otrzymujemy w formie pliku XML lub czystego tekstu (po najechaniu kursorem myszy na wyrazy, zobaczymy przypisane im tagi gramatyczne). Jeśli analizie poddano archiwum .zip, dostępna jest również możliwość pobrania paczki z dokumentami zawierającymi wyniki analizy dla poszczególnych tekstów.
Adres bibliograficzny publikacji przewodniej (w przypadku użycia Spacy, prosimy o cytowanie tej publikacji):
Walkowiak, T.: Language Processing Modelling Notation – Orchestration of NLP Microservices. In: Advances in Dependability Engineering of Complex Systems: Proceedings of the Twelfth International Conference on Dependability and Complex Systems DepCoS-RELCOMEX, 2017, Springer International Publishing, pp. 464-473