Materials from the 1st series of lectures and workshops: CLARIN-PL in research practice

The Institute of Literary Research of the Polish Academy of Sciences, April 13-15 2015

workshop materials

Day I

CLARIN: Language Resources & Technology Infrastructure: depositing and disseminating resources and language tools for Polish
Maciej Piasecki, Tomasz Walkowiak, Centrum Technologii Językowych CLARIN-PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego

Collecting, annotating, and sharing corpora
Marcin Oleksy, Jan Kocoń, Gromadzenie, anotowanie i udostępnianie korpusów. Wykład
Marcin Oleksy, Jan Kocoń, Gromadzenie, anotowanie i udostępnianie korpusów. Warsztaty
Marcin Oleksy, Inforex. Instrukcja

Tools for automatic analysis of textual references
Michał Marcińczuk, Jan Kocoń, Narzędzia do automatycznej analizy odniesień w tekstach. Wykład
Michał Marcińczuk, Jan Kocoń, Narzędzia do automatycznej analizy odniesień w tekstach. Warsztaty
Michał Marcińczuk, Wytyczne KPWr: Rozszerzony schemat jednostek identyfikacyjnych
Jan Kocoń, Wytyczne KPWr: Wyrażenia temporalne

Advanced tool for rule-based corpus analysis
Michał Marcińczuk, Zaawansowane narzędzie do analizy korpusu w oparciu o reguły. Wykład
Michał Marcińczuk, Zaawansowane narzędzie do analizy korpusu w oparciu o reguły. Warsztaty
wccl-match-agr-subst-nam.txt
wccl-match-anotacje.txt
wccl-match-errors.txt
wccl-match-timex.txt

Day II

PlWordNet 3.0 – Polish lexical semantic network and its use in analysis of meaning
Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Piotr Pęzik, Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń
Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń. Część ćwiczeniowa

Bilingual WordNet – possibilities for application in translating
Ewa Rudnicka, Dwujęzyczna Słowosieć - możliwości wykorzystania w pracy tłumacza

Tools for automatic extraction of set phrase and term dictionaries
Marek Maziarz, Michał Wendelberger, Narzędzia do automatycznego wydobywania słowników związków frazeologicznych i terminów

Reference and parallel corpora in translation
Piotr Pęzik, Korpusy referencyjne, korpusy równoległe, ekwiwalencja frazeologiczna
Piotr Pęzik, Exploring Polish-English Parallel Corpora with Paralela

Day III

The use of CL-PL tools in work as a humanist. A review of tools, resources and apps and methods of application
Marcin Woliński, Anna Andrzejczuk, Narzędzia analizy fleksyjnej tekstów polskich

Text classification and stylometric analysis system
Maciej Eder, Maciej Piasecki, System do klasyfikacji tekstu i analizy stylometrycznej

Conversational register – a look on reality and style in data obtained from Spokes
Piotr Pęzik, Rejestr nieformalny-konwersacyjny polszczyzny. Dane korpusowe a stylizacja

Syntactic parsing and its application
Alina Wróblewska, Parsowanie składniowe i jego zastosowania.
Alina Wróblewska, Parsowanie składniowe i jego zastosowania. Warsztaty

Tutorials