Parser Zależnościowy

Nazwa

Parser zależnościowy – narzędzie analizy składniowej zdań w języku polskim

Opis

Narzędzie opierające się na algorytmach uczenia maszynowego, wykorzystujące model parsowania zależnościowego (czyli analizy składniowej) zbudowany na podstawie największego polskiego banku drzew zależnościowych (PDB, Polish Dependency Bank). PDB został istotnie rozbudowany i udoskonalony w ramach projektu CLARIN-PL, co przyczyniło się do podniesienia jakości rozbiorów składniowych zwracanych przez parser. Analiza zależnościowa jest jednym ze wstępnych zadań przetwarzania języka naturalnego, poprzedzona segmentacją tekstu, analizą morfologiczną, lematyzacją oraz ujednoznacznieniem na poziomie morfoskładni. Modele parsowania zależnościowego dostępne są pod adresem http://zil.ipipan.waw.pl/PDB/PDBparser. Jakość parsowania zależnościowego polszczyzny można sprawdzić na stronie http://clip.ipipan.waw.pl/benchmarks (zob. Dependency parsing).
Współczesne systemy wstępnego przetwarzania języka łączą różne zadania (np. analizę morfologiczną, lematyzację, tagowanie) w jednym modelu, np. demo systemu COMBO (Rybak i Wróblewska, 2018), uczony na PDB oraz PDB-UD (drzewa PDB przekonwertowane do formatu Universal Dependencies w ramach projektu CLARIN-PL).

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Parsowania Zależnościowego, prosimy o cytowanie tej publikacji):

Link do instrukcji