Parser Zależnościowy

Nazwa

Parser zależnościowy – narzędzie analizy składniowej zdań w języku polskim

Opis

Narzędzie opierające się na algorytmach uczenia maszynowego, wykorzystujące model parsowania zależnościowego (czyli analizy składniowej) zbudowany na podstawie największego polskiego banku drzew zależnościowych (PDB, Polish Dependency Bank).  

PDB został istotnie rozbudowany i udoskonalony w ramach projektu CLARIN-PL, co przyczyniło się do podniesienia jakości rozbiorów składniowych zwracanych przez parser. Analiza zależnościowa jest jednym ze wstępnych zadań przetwarzania języka naturalnego, poprzedzona segmentacją tekstu, analizą morfologiczną, lematyzacją oraz ujednoznacznieniem na poziomie morfoskładni 

Modele parsowania zależnościowego dostępne są na stronie Zespołu Inżynierii Lingwistycznej IPIPANJakość parsowania zależnościowego polszczyzny można sprawdzić na stronie CLIP (zob. Dependency parsing). Współczesne systemy wstępnego przetwarzania języka łączą różne zadania (np. analizę morfologiczną, lematyzacjętagowanie) w jednym modelu, np. demo systemu COMBO (Rybak i Wróblewska, 2018), uczony na PDB oraz PDB-UD (drzewa PDB przekonwertowane do formatu Universal Dependencies w ramach projektu CLARIN-PL). 

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Parsowania Zależnościowego, prosimy o cytowanie tej publikacji):