Zasoby

Zasoby językowe są to zbiory danych i bazy danych w postaci sformalizowanych opisów wybranych aspektów języka naturalnego oraz ich użycia. Wśród zasobów językowych możemy wyróżnić następujące typy:

  • „Systemy do przeszukiwania zasobów CLARIN” – systemy do przeszukiwania zasobów i narzędzi językowych oraz określonych wzorców w zbiorach danych pochodzących z całościowo zgromadzonych zasobów CLARIN, których liczba jest tak ogromna, że dotarcie do pełnowymiarowego przeglądu bez tych narzędzi byłoby bardzo trudne bez dodatkowej pomocy technicznej; można tutaj również znaleźć przyjazny dla użytkownika przegląd dostępnych zasobów językowych w infrastrukturze CLARIN dla naukowców zajmujących się humanistyką cyfrową, naukami społecznymi i humanistycznych oraz szeroko rozumianymi technologiami języka naturalnego
  • „Systemy przechowywania i udostępniania danych CLARIN-PL” – systemy do tworzenia bezpiecznych archiwów, w których możliwe jest długoterminowe przechowywanie danych w postaci dokumentów tekstowych i zasobów multimedialnych; można tutaj również znaleźć narzędzia do tworzenia i przeszukiwania korpusów;
  • „Zasoby opracowane w ramach infrastruktury CLARIN-PL” – systemy sfinansowane i przygotowane w ramach zasobów kadrowych infrastruktury CLARIN-PL
  • „Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL” – zasoby stworzone na potrzeby użytkowników przy pomocy narzędzi oferowanych w ramach CLARIN-PL, ale kierownikami (i fundatorami) projektów byli interesariusze zewnętrzni

 

Systemy do przeszukiwania zasobów CLARIN:

Nazwa

Opis

Baza wiedzy o otwartych zasobach językowych CLARIN WIĘCEJ

Narzędzie do masowego przeszukiwania zawartości zasobów językowych WIĘCEJ

Narzędzie do wyszukiwania zasobów i narzędzi językowych WIĘCEJ

Systemy przechowywania i udostępniania danych CLARIN-PL:

Nazwa

Opis

Narzędzie do samodzielnego tworzenia korpusów WIĘCEJ

Platforma robocza zintegrowana z narzędziami CLARIN-PL WIĘCEJ

Narzędzie do chronologicznego przeszukiwania korpusów WIĘCEJ

Narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego WIĘCEJ

Repozytorium cyfrowe do deponowania i archiwizowania danych WIĘCEJ

Zasoby opracowane w ramach infrastruktury CLARIN-PL:

Nazwa

Opis

Korpus Języka Polskiego Politechniki Wrocławskiej WIĘCEJ

Zbiór tekstów z posiedzeń plenarnych Sejmu i Senatu RP WIĘCEJ

Korpusy Równoległe

Dwujęzyczne korpusy równoległe tekstów współczesnych WIĘCEJ

Wyszukiwarka polsko-angielskich anotowanych korpusów równoległych WIĘCEJ

System do przeszukiwania źródeł leksykograficznych WIĘCEJ

Wielki relacyjny słownik semantyczny języka polskiego WIĘCEJ

Wyszukiwarka danych konwersacyjnych WIĘCEJ

Słownik walencyjny predykatów polskich WIĘCEJ

Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL:

Nazwa

Opis

Korpus tysiąca tekstów literackich na otwartej licencji WIĘCEJ

Dokumenty dotyczące polityki terytorialnej Unii Europejskiej WIĘCEJ