Misja

Zasadniczy cel CLARIN to budowa narzędzi naukowych, które umożliwią rozszerzony dostęp do dużych zbiorów dokumentów tekstowych, nagrań języka mówionego i zasobów multimedialnych oraz ich zautomatyzowaną analizę. CLARIN pozwala także użytkownikom na przechowywanie źródeł pisanych i mówionych oraz dzielenie się nimi w ramach ogólnoeuropejskiej sieci naukowej. CLARIN dostarcza narzędzi, które umożliwiają wyszukiwanie zasobów i opisywanie ich za pomocą metadanych, a także zapewniają bezpieczny dostęp na prawach licencji określonej przez autora.

Usługi sieci CLARIN są dostępne na otwartych licencjach dla naukowców z krajów tworzących konsorcjum CLARIN ERIC. Usługi nastawione są szczególnie na badaczy z obszaru nauk humanistycznych i społecznych oraz wszystkich, którzy w swojej pracy posługują się dokumentami pisanymi oraz zapisem mowy w jakimkolwiek języku europejskim. CLARIN da im uniwersalne narzędzia do analizy języka naturalnego oraz otwarte, publiczne archiwum zasobów językowych i materiałów źródłowych.

Na bazie infrastruktury CLARIN opracowuje się obecnie sieciowe aplikacje użytkowe. Umożliwiają one pogłębioną, automatyczną analizę struktury tekstu i archiwów mowy oraz (w pewnym zakresie) znaczenia dokumentów i nagrań w języku naturalnym.

Inicjatywa budowy CLARIN ERIC zrodziła się w 2005 roku ze świadomości istnienia barier utrudniających powszechne wykorzystanie osiągnięć inżynierii języka naturalnego w badaniach naukowych.

  1. Spójność technologii językowych. W wyniku dynamicznego rozwoju technologii językowych powstała bardzo duża liczba standardów i formatów danych. Konieczne jest doprowadzenie do interoperacyjności powstałych programów i zasobów tak, żeby można było bez trudu z nich korzystać i dowolnie ze sobą łączyć.
  2. Techniczna i merytoryczna dostępność. Naukowcy z dziedziny technologii językowej funkcjonują zwykle w zamkniętym świecie o hermetycznym języku, a instalacja poszczególnych programów może być wyzwaniem nawet dla informatyka. Dzięki CLARIN zniknie konieczność kłopotliwych instalacji oraz posiadania dużej wiedzy specjalistycznej.
  3. Poziom wsparcia dla poszczególnych języków europejskich. Uprzywilejowana pozycja języka angielskiego sprawia, że bardzo wiele badań wykonuje się dla tekstów w tym języku. Konieczne jest rozbudowanie dostępnej technologii przynajmniej do minimalnego użytecznego poziomu, jaki umożliwi zastosowania technologii językowej także dla innych języków naturalnych.

Inicjatywa CLARIN cieszy się szerokim poparciem środowiska naukowego: dołączyło do niej już ponad 100 europejskich jednostek naukowych. Istnieją zatem duże szanse przezwyciężenia powyższych barier oraz wypracowania niezbędnych standardów.

Dowiedz się więcej