O projekcie

CLARIN (Common Language Resources & Technology Infrastructure) to ogólnoeuropejska infrastruktura naukowa. W jej ramach udostępniamy narzędzia badawcze, dzięki którym możliwa jest praca z bardzo dużymi zbiorami tekstów.

Inicjatywa budowy sieci CLARIN jest odpowiedzią na bariery hamujące wykorzystanie osiągnięć inżynierii języka w badaniach naukowych. Dotychczas badacz, który chciał skorzystać z powstających programów i korpusów, musiał łączyć w sobie wiedzę lingwisty i informatyka. Co więcej, usługi budowane w różnych ośrodkach były technicznie niespójne (różne formaty danych), a to znacznie utrudniało użycie kilku usług jednocześnie. Problemem było także nierówne opracowanie narzędzi dla poszczególnych języków europejskich.

Nad zniesieniem tych barier pracuje obecnie ponad 100 europejskich jednostek naukowych. Głównym celem jest budowa narzędzi, które umożliwią rozszerzony dostęp do dużych zbiorów dokumentów tekstowych, nagrań języka mówionego, zasobów multimedialnych oraz ich automatyczną analizę. Funkcjonalne aplikacje i przejrzysty interfejs mają przybliżyć naukowcom z dziedziny nauk humanistycznych i społecznych nowe możliwości prowadzenia badań na tekstach źródłowych. Ujednolicenie postaci narzędzi i zasobów (korpusów, archiwów cyfrowych) sprawi, że dzięki jednej rejestracji użytkownik będzie miał dostęp do wszystkich usług powstających w całej Europie.

CLARIN-PL to polska część infrastruktury CLARIN. Konsorcjum CLARIN-PL tworzą polskie uniwersytety i instytuty badawcze, w których powstają repozytoria tekstów pisanych i mówionych w języku polskim oraz tekstów równoległych w innych językach. Naszym celem jest wypełnienie braków w obszarze przystosowania technologii językowych dla języka polskiego.
Wierzymy, że możliwość dostępu do bogatych zasobów w języku polskim, widocznych z dowolnego punktu w Europie, zachęci do prowadzenia badań z uwzględnieniem polskojęzycznych materiałów oraz będzie promować język i kulturę Polski w Europie i na świecie.