MeWeX

Nazwa

MeWeX – narzędzie do wydobywania z korpusów kolokacji wielowyrazowych oraz tworzenia słowników jednostek leksykalnych

Opis

MeWeX – z ang. Multi-Word Expressions – to narzędzie internetowe, służące do wydobywania z korpusów kolokacji wielowyrazowych oraz tworzenia słowników jednostek leksykalnych w języku polskim. Ekstrakcja obejmuje takie typy strukturalne, jak na przykład rzeczownik + przymiotnik (karta debetowa) czy rzeczownik + rzeczownik (zbyt nieruchomości). Aplikacja MeWeX może być stosowana np. w leksykografii czy w lingwistyce korpusowej – m.in. przy rozbudowie słowników leksykalnych jednostek wielowyrazowych. Może być również wykorzystywana jako narzędzie do analizy frazeologizmów i terminów, występujących w określonych zbiorach tekstów.

Aplikacja MeWeX do przetwarzania i analizy danych tekstowych korzysta zarówno z różnych algorytmów do obliczania funkcji dyspersji i obliczania miary ekstrakcji, jak i filtrów w postaci ograniczeń leksykalno-morfo-syntaktycznych.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia MeWeXa, prosimy o cytowanie tej publikacji):

Link do instrukcji

Przykładowe zastosowania