Parsowanie zależnościowe

Parser Zależnościowy

Nazwa

Parser zależnościowy – narzędzie analizy składniowej zdań w języku polskim

Opis

Narzędzie opierające się na algorytmach uczenia maszynowego, wykorzystujące model parsowania zależnościowego (czyli analizy składniowej) zbudowany na podstawie największego polskiego banku drzew zależnościowych (PDB, Polish Dependency Bank).

PDB został istotnie rozbudowany i udoskonalony w ramach projektu CLARIN-PL, co przyczyniło się do podniesienia jakości rozbiorów składniowych zwracanych przez parser. Analiza zależnościowa jest jednym ze wstępnych zadań przetwarzania języka naturalnego, poprzedzona segmentacją tekstu, analizą morfologiczną, lematyzacją oraz ujednoznacznieniem na poziomie morfoskładni.

Modele parsowania zależnościowego dostępne są na stronie Zespołu Inżynierii Lingwistycznej IPIPAN. Jakość parsowania zależnościowego polszczyzny można sprawdzić na stronie CLIP (zob. Dependency parsing). Współczesne systemy wstępnego przetwarzania języka łączą różne zadania (np. analizę morfologiczną, lematyzację, tagowanie) w jednym modelu, np. demo systemu COMBO (Rybak i Wróblewska, 2018), uczony na PDB oraz PDB-UD (drzewa PDB przekonwertowane do formatu Universal Dependencies w ramach projektu CLARIN-PL).

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Parsowania Zależnościowego, prosimy o cytowanie tej publikacji):

https://www.semanticscholar.org/paper/Extended-and-Enhanced-Polish-Dependency-Bank-in-Wróblewska/18fb8a653f8c9c5be8bd09487f855d639995a4c9 http://nlp.ipipan.waw.pl/Bib/wro:14.pdf

Materiały pomocniczne:

http://mozart.ipipan.waw.pl/~alina/clarin_2019/190925_Parsing.pdf

Dostęp

http://ws.clarin-pl.eu/parser.shtml

Przykładowe zastosowania

https://www.aclweb.org/anthology/2020.acl-demos.14/
https://link.springer.com/article/10.1007/s12144-020-00944-5
https://content.sciendo.com/view/journals/cait/18/1/article-p152.xml?tab_body=pdf-78589