Słowosieć
Nazwa
Słowosieć – plWordNet – Wielki relacyjny słownik semantyczny języka polskiego
Opis
Słowosieć (z ang. wordnet) – to relacyjny słownik semantyczny, który odzwierciedla system leksykalny języka polskiego. Obecnie zawiera 191 tys. słów, 285 tys. znaczeń oraz ponad 600 tys. relacji. Jest największym istniejącym wordnetem na świecie i nieustannie się rozrasta.
Pojedyncze znaczenia w Słowosieci połączone są wzajemnymi relacjami, tworząc sieć semantyczną. Wyrazy definiowane są poprzez odniesienie do innych wyrazów, z którymi są połączone znaczeniowo, np. samochód to hiponim dla pojazdu drogowego i dwuśladu, hiperonim dla sedana czy kabrioletu oraz synonim dla fury i bryki, tworzy kolokację z przymiotnikiem terenowy, a jego meronimy to silnik, spryskiwacz czy podwozie.
Słowosieć może służyć także jako słownik polsko-angielski i angielsko-polski, ponieważ została połączona z pierwszym i przez lata największym wordnetem na świecie – Princeton WordNet. Jest także bardzo ważnym zasobem w komputerowym przetwarzaniu języka i badaniach nad sztuczną inteligencją, m.in. znajduje zastosowanie w automatycznych tłumaczeniach Google Translate. 80 tys. jednostek posiada anotację emocjonalną, dzięki czemu Słowosieć moze być bazą dla analizy wydźwięku.
Polski wordnet jest budowany wspólnym wysiłkiem leksykografów i informatyków z Grupy Technologii Językowych Politechniki Wrocławskiej. Decyzją władz uczelni Słowosieć jest dostępna bezpłatnie do powszechnego (również komercyjnego) użytku w oparciu o licencję wzorowaną na licencji Princeton WordNet. Użytkownicy mogą przeglądać Słowosieć również za pomocą aplikacji mobilnej oraz WordNetLoom-Viewera (aplikacji umożliwiającej podgląd siatki znaczeń Słowosieci), a także pobierać pliki źródłowe (link) Programiści mają także dostęp do Słowosieci na poziomie usługi sieciowej i programistycznego API.
Prace nad Słowosiecią realizowane są dzięki grantom Ministerstwa Nauki i Szkolnictwa Wyższego i Funduszom Unijnym, a obecnie – w ramach ogólnoeuropejskiej infrastruktury naukowej CLARIN oraz polskiego konsortium CLARIN-PL.
Adres bibliograficzny publikacji przewodniej (w przypadku użycia Słowosieci, prosimy o cytowanie tej publikacji):
Dziób, A., Piasecki, M., & Rudnicka, E. (2019). plWordNet 4.1–a Linguistically Motivated, Corpus-based Bilingual Resource. In: Fellbaum, C., Vossen, P., Rudnicka, E., Maziarz, M., & Piasecki, M. (Eds.), Proceedings of the 10th Global WordNet Conference: July 23-27, 2019, Wrocław (Poland). Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, pp. 353–362.
Dostęp
Baza Danych plWordNet (jeśli chcesz pobrać na dysk bazę danych i wykorzystywać ją dewelopersko)
Przykładowe zastosowania