Zasoby

Zasoby językowe są to zbiory danych i bazy danych w postaci sformalizowanych opisów wybranych aspektów języka naturalnego oraz ich użycia. Wśród zasobów językowych możemy wyróżnić następujące typy:

  • „Systemy do przeszukiwania zasobów CLARIN” – systemy do przeszukiwania zasobów i narzędzi językowych oraz określonych wzorców w zbiorach danych pochodzących z całościowo zgromadzonych zasobów CLARIN, których liczba jest tak ogromna, że dotarcie do pełnowymiarowego przeglądu bez tych narzędzi byłoby bardzo trudne bez dodatkowej pomocy technicznej; można tutaj również znaleźć przyjazny dla użytkownika przegląd dostępnych zasobów językowych w infrastrukturze CLARIN dla naukowców zajmujących się humanistyką cyfrową, naukami społecznymi i humanistycznych oraz szeroko rozumianymi technologiami języka naturalnego
  • „Systemy przechowywania i udostępniania danych CLARIN-PL” – systemy do tworzenia bezpiecznych archiwów, w których możliwe jest długoterminowe przechowywanie danych w postaci dokumentów tekstowych i zasobów multimedialnych; można tutaj również znaleźć narzędzia do tworzenia i przeszukiwania korpusów;
  • „Zasoby opracowane w ramach infrastruktury CLARIN-PL” – systemy sfinansowane i przygotowane w ramach zasobów kadrowych infrastruktury CLARIN-PL
  • „Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL” – zasoby stworzone na potrzeby użytkowników przy pomocy narzędzi oferowanych w ramach CLARIN-PL, ale kierownikami (i fundatorami) projektów byli interesariusze zewnętrzni

 

Systemy do przeszukiwania zasobów CLARIN:

Nazwa

Opis

Baza wiedzy o otwartych zasobach językowych CLARIN

Narzędzie do masowego przeszukiwania zawartości zasobów językowych

Narzędzie do wyszukiwania zasobów i narzędzi językowych

Systemy przechowywania i udostępniania danych CLARIN-PL:

Nazwa

Opis

Repozytorium cyfrowe do deponowania i archiwizowania danych

Platforma robocza zintegrowana z narzędziami CLARIN-PL

Narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Narzędzie do chronologicznego przeszukiwania korpusów

Narzędzie do samodzielnego tworzenia korpusów

Zasoby opracowane w ramach infrastruktury CLARIN-PL:

Nazwa

Opis

Korpus Języka Polskiego Politechniki Wrocławskiej

Wyszukiwarka danych konwersacyjnych

Dwujęzyczne korpusy równoległe tekstów współczesnych

Zbiór tekstów z posiedzeń plenarnych Sejmu i Senatu RP

Wyszukiwarka polsko-angielskich anotowanych korpusów równoległych

Wielki relacyjny słownik semantyczny języka polskiego

Słownik walencyjny predykatów polskich

System do przeszukiwania źródeł leksykograficznych

Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL:

Nazwa

Opis

Korpus tysiąca tekstów literackich na otwartej licencji

Dokumenty dotyczące polityki terytorialnej Unii Europejskiej