MeWeX

Nazwa

MeWeX – narzędzie do wydobywania z korpusów kolokacji wielowyrazowych oraz tworzenia słowników jednostek leksykalnych

Opis

MeWeX – narzędzie do wyodrębniania z korpusów kolokacji wielowyrazowych oraz tworzenia słowników jednostek leksykalnych 

MeWeX – z ang. Multi-Word Expressions – to narzędzie internetowe, służące do wydobywania z korpusów związków wielowyrazowych oraz tworzenia słowników jednostek leksykalnych w języku polskim. Ekstrakcja obejmuje takie pary części mowy, jak na przykład rzeczownik + przymiotnik (karta debetowa) czy rzeczownik + rzeczownik (zbyt nieruchomości). Aplikacja MeWeX do przetwarzania i analizy danych tekstowych korzysta zarówno z różnych algorytmów do obliczania funkcji dyspersji i obliczania miary ekstrakcji, jak i filtrów w postaci ograniczeń leksykalno-morfo-syntaktycznych.  

Aplikacja MeWeX może być stosowana np. w leksykografii czy w lingwistyce korpusowej – m.in. przy rozbudowie słowników leksykalnych jednostek wielowyrazowych. Może być również wykorzystywana jako narzędzie do analizy frazeologizmów i terminów, występujących w określonych zbiorach tekstów.