Parser Zależnościowy
Nazwa
Parser zależnościowy – narzędzie analizy składniowej zdań w języku polskim
Opis
Narzędzie opierające się na algorytmach uczenia maszynowego, wykorzystujące model parsowania zależnościowego (czyli analizy składniowej) zbudowany na podstawie największego polskiego banku drzew zależnościowych (PDB, Polish Dependency Bank).
PDB został istotnie rozbudowany i udoskonalony w ramach projektu CLARIN-PL, co przyczyniło się do podniesienia jakości rozbiorów składniowych zwracanych przez parser. Analiza zależnościowa jest jednym ze wstępnych zadań przetwarzania języka naturalnego, poprzedzona segmentacją tekstu, analizą morfologiczną, lematyzacją oraz ujednoznacznieniem na poziomie morfoskładni.
Modele parsowania zależnościowego dostępne są na stronie Zespołu Inżynierii Lingwistycznej IPIPAN. Jakość parsowania zależnościowego polszczyzny można sprawdzić na stronie CLIP (zob. Dependency parsing). Współczesne systemy wstępnego przetwarzania języka łączą różne zadania (np. analizę morfologiczną, lematyzację, tagowanie) w jednym modelu, np. demo systemu COMBO (Rybak i Wróblewska, 2018), uczony na PDB oraz PDB-UD (drzewa PDB przekonwertowane do formatu Universal Dependencies w ramach projektu CLARIN-PL).
Adres bibliograficzny publikacji przewodniej (w przypadku użycia Parsowania Zależnościowego, prosimy o cytowanie tej publikacji):
Materiały pomocniczne: