• Warsztaty CLARIN-PL w praktyce badawczej (UMCS LUBLIN, 25-26 IX 2019) - przedłużony termin

Witamy w CLARIN-PL!

CLARIN (Common Language Resources & Technology Infrastructure) – ogólnoeuropejska infrastruktura naukowa – umożliwia badaczom z dziedziny nauk humanistycznych i społecznych wygodną pracę z bardzo dużymi zbiorami tekstów.

DSA_2014_2015

Dostępne narzędzia i zasoby

Paralela

wyszukiwarka polsko-angielskich anotowanych korpusów równoległych

Przejdź do Paraleli

Słowa dnia

lista słów o wyższej frekwencji w dyskursie medialnym

Przejdź do Słów dnia

Słowosieć

wordnet języka polskiego - wielka sieć wyrazów i baza danych leksykalno-semantycznych

Przejdź do Słowosieci

CLARIN-PL w skrócie

Programy udostępniane w ramach sieci CLARIN pozwalają wykorzystać opracowane już zbiory archiwów cyfrowych i korpusów. W obrębie CLARIN tworzymy także, przechowujemy i udostępniamy nowe zasoby. Możliwa jest również praca na „surowych” tekstach publikowanych w Internecie, w postaci informacji prasowych, artykułów, blogów, dokumentów itp. W przyszłości powstaną narzędzia do analizy zarejestrowanej mowy (wideoblogów, transmisji czy audycji).

W odróżnieniu od komercyjnych wyszukiwarek internetowych, które najlepiej działają z małymi zestawami słów kluczowych, narzędzia CLARIN starają się w całości „zrozumieć” analizowane teksty i dlatego potrafią znaleźć w nich informacje związane z interesującym użytkownika tematem, nie wymagając wpisywania na chybił-trafił różnych kombinacji wyrazów. Jest to szczególnie przydatne, kiedy np. w bardzo dużym zbiorze tekstów źródłowych szukamy powiązań między wybranymi elementami (osobami, miejscami, instytucjami, przedsiębiorstwami itp.).

Narzędzia CLARIN będą wsparciem w takich zadaniach związanych z przetwarzaniem języka jak automatyczne streszczanie tekstów, wyszukiwanie w nich nazw własnych i słów kluczowych oraz analiza składniowa i morfologiczna. Tego rodzaju przetwarzanie pomoże badaczom np. w analizie dyskursu politycznego, społecznego czy reklamowego.

Usługi CLARIN są wyposażone w przyjazny interfejs użytkownika, a korzystanie z nich nie wymaga specjalistycznej wiedzy informatycznej. Dzięki wdrożonym standardom narzędzia opracowane dla języka polskiego (CLARIN-PL) są w pełni zgodne z usługami innych europejskich centrów CLARIN. Gwarantuje to łatwe łączenie poszczególnych narzędzi w jedno- lub wielojęzyczne ciągi przetwarzania tekstów i wydobywanie z nich maksimum informacji.

Współpraca

Obecnie wspieramy kilka projektów badawczych w naukach humanistycznych i społecznych. Oferujemy dostosowanie narzędzi CLARIN do indywidualnych potrzeb oraz pomoc w opracowaniu materiałów źródłowych. Badaczy zainteresowanych naszymi usługami prosimy o kontakt.

Partnerzy