Zasoby

Zasoby językowe są to zbiory danych i bazy danych w postaci sformalizowanych opisów wybranych aspektów języka naturalnego oraz ich użycia. Wśród zasobów językowych możemy wyróżnić następujące typy:

  • „Systemy do przeszukiwania zasobów CLARIN” – systemy do przeszukiwania zasobów i narzędzi językowych oraz określonych wzorców w zbiorach danych pochodzących z całościowo zgromadzonych zasobów CLARIN, których liczba jest tak ogromna, że dotarcie do pełnowymiarowego przeglądu bez tych narzędzi byłoby bardzo trudne bez dodatkowej pomocy technicznej; można tutaj również znaleźć przyjazny dla użytkownika przegląd dostępnych zasobów językowych w infrastrukturze CLARIN dla naukowców zajmujących się humanistyką cyfrową, naukami społecznymi i humanistycznych oraz szeroko rozumianymi technologiami języka naturalnego
  • „Systemy przechowywania i udostępniania danych CLARIN-PL” – systemy do tworzenia bezpiecznych archiwów, w których możliwe jest długoterminowe przechowywanie danych w postaci dokumentów tekstowych i zasobów multimedialnych; można tutaj również znaleźć narzędzia do tworzenia i przeszukiwania korpusów;
  • „Zasoby opracowane w ramach infrastruktury CLARIN-PL” – systemy sfinansowane i przygotowane w ramach zasobów kadrowych infrastruktury CLARIN-PL
  • „Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL” – zasoby stworzone na potrzeby użytkowników przy pomocy narzędzi oferowanych w ramach CLARIN-PL, ale kierownikami (i fundatorami) projektów byli interesariusze zewnętrzni

 

Systemy do przeszukiwania zasobów CLARIN:

Nazwa

Opis

Baza wiedzy o otwartych zasobach językowych CLARIN

Narzędzie do masowego przeszukiwania zawartości zasobów językowych

Narzędzie do wyszukiwania zasobów i narzędzi językowych

Systemy przechowywania i udostępniania danych CLARIN-PL:

Nazwa

Opis

Narzędzie do samodzielnego tworzenia korpusów

Platforma robocza zintegrowana z narzędziami CLARIN-PL

Narzędzie do chronologicznego przeszukiwania korpusów

Narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Repozytorium cyfrowe do deponowania i archiwizowania danych

Zasoby opracowane w ramach infrastruktury CLARIN-PL:

Nazwa

Opis

Korpus Języka Polskiego Politechniki Wrocławskiej

Zbiór tekstów z posiedzeń plenarnych Sejmu i Senatu RP

Dwujęzyczne korpusy równoległe tekstów współczesnych

Wyszukiwarka polsko-angielskich anotowanych korpusów równoległych

System do przeszukiwania źródeł leksykograficznych

Wielki relacyjny słownik semantyczny języka polskiego

Wyszukiwarka danych konwersacyjnych

Słownik walencyjny predykatów polskich

Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL:

Nazwa

Opis

Korpus tysiąca tekstów literackich na otwartej licencji

Dokumenty dotyczące polityki terytorialnej Unii Europejskiej