Zasoby
Zasoby językowe są to zbiory danych i bazy danych w postaci sformalizowanych opisów wybranych aspektów języka naturalnego oraz ich użycia. Wśród zasobów językowych możemy wyróżnić następujące typy:
- „Systemy do przeszukiwania zasobów CLARIN” – systemy do przeszukiwania zasobów i narzędzi językowych oraz określonych wzorców w zbiorach danych pochodzących z całościowo zgromadzonych zasobów CLARIN, których liczba jest tak ogromna, że dotarcie do pełnowymiarowego przeglądu bez tych narzędzi byłoby bardzo trudne bez dodatkowej pomocy technicznej; można tutaj również znaleźć przyjazny dla użytkownika przegląd dostępnych zasobów językowych w infrastrukturze CLARIN dla naukowców zajmujących się humanistyką cyfrową, naukami społecznymi i humanistycznych oraz szeroko rozumianymi technologiami języka naturalnego
- „Systemy przechowywania i udostępniania danych CLARIN-PL” – systemy do tworzenia bezpiecznych archiwów, w których możliwe jest długoterminowe przechowywanie danych w postaci dokumentów tekstowych i zasobów multimedialnych; można tutaj również znaleźć narzędzia do tworzenia i przeszukiwania korpusów;
- „Zasoby opracowane w ramach infrastruktury CLARIN-PL” – systemy sfinansowane i przygotowane w ramach zasobów kadrowych infrastruktury CLARIN-PL
- „Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL” – zasoby stworzone na potrzeby użytkowników przy pomocy narzędzi oferowanych w ramach CLARIN-PL, ale kierownikami (i fundatorami) projektów byli interesariusze zewnętrzni
Systemy do przeszukiwania zasobów CLARIN:
Nazwa | Opis |
Baza wiedzy o otwartych zasobach językowych CLARIN | |
Narzędzie do masowego przeszukiwania zawartości zasobów językowych | |
Narzędzie do wyszukiwania zasobów i narzędzi językowych |
Systemy przechowywania i udostępniania danych CLARIN-PL:
Nazwa | Opis |
Repozytorium cyfrowe do deponowania i archiwizowania danych | |
Platforma robocza zintegrowana z narzędziami CLARIN-PL | |
Narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego | |
Narzędzie do chronologicznego przeszukiwania korpusów | |
Narzędzie do samodzielnego tworzenia korpusów |
Zasoby opracowane w ramach infrastruktury CLARIN-PL:
Nazwa | Opis |
Korpus Języka Polskiego Politechniki Wrocławskiej | |
Wyszukiwarka danych konwersacyjnych | |
Dwujęzyczne korpusy równoległe tekstów współczesnych | |
Zbiór tekstów z posiedzeń plenarnych Sejmu i Senatu RP | |
Wyszukiwarka polsko-angielskich anotowanych korpusów równoległych | |
Wielki relacyjny słownik semantyczny języka polskiego | |
Słownik walencyjny predykatów polskich | |
System do przeszukiwania źródeł leksykograficznych |
Przykładowe zasoby opracowane przez podmioty zewnętrzne przy pomocy CLARIN-PL:
Nazwa | Opis |
Korpus tysiąca tekstów literackich na otwartej licencji | |
Dokumenty dotyczące polityki terytorialnej Unii Europejskiej |