Materials from the 2nd series of lectures and workshops: CLARIN-PL in research practice

Wrocław University of Technology, May 18-20, 2015

workshop materials

Survey for participants

Workshop program

Day I

CLARIN-PL: Language Resources & Technology Infrastructure: depositing and disseminating resources and language tools for Polish
Maciej Piasecki, Tomasz Walkowiak, Centrum Technologii Językowych CLARIN-PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego. Introductory lecture

Collecting, annotating, and sharing corpora
Jan Kocoń, Marcin Oleksy, Gromadzenie korpusów, anotowanie i udostępnianie. Instruction
Jan Kocoń, Marcin Oleksy, Gromadzenie korpusów, anotowanie i udostępnianie. Lecture
Corpus

Tools for automatic analysis of textual references
Jan Kocoń, Michał Marcińczuk, Narzędzia do automatycznej analizy odniesień w tekstach. Lecture
Jan Kocoń, Michał Marcińczuk, Narzędzia do automatycznej analizy odniesień w tekstach. Instruction
WytyczneKPWr-TIMEXTemporalExpressions
KPWrGuidelines-Idunits

Speech corpora and tools for their processing
Danijel Korzinek, Krzysztof Marasek, Korpusy mowy i narzędzia do ich przetwarzania. Lecture

Day II

ChronoPress (Chronological Corpus for Polish Press) and its application in research

PlWordNet 3.0 – Polish lexical semantic network and its use in analysis of meaning
Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Piotr Pęzik, Słowosieć 3.0-leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń. Lecture
Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Słowosieć 3.0-leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń. Workshop

Bilingual WordNet – possibilities for application in translating
Ewa Rudnicka, Dwujęzyczna Słowosieć – możliwości wykorzystania w pracy tłumacza. Lecture and workshop

Tools for automatic extraction of collocation dictionaries and for assessment of collocations
Marek Maziarz, Maciej Piasecki, Michał Wendelberger, Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny połączeń wyrazowych. Lecture

Reference and parallel corpora in translation
Piotr Pęzik, Korpusy referencyjne i równoległe w warsztacie tłumacza. Lecture
Piotr Pęzik, Exploring Polish-English Parallel Corpora with Paralela. Lecture

Day III

Morfeusz 2 – analyser and inflection generator for Polish. Building domain dictionaries for Morfeusz 2
Marcin Woliński, Anna Andrzejczuk, Morfeusz 2 - analizator i generator fleksyjny dla języka polskiego. Lecture
Anna Andrzejczuk, Marcin Woliński, Kuźnia. Program do tworzenia polskich słowników fleksyjnych. Lecture
Anna Andrzejczuk, Kuźnia. User manual
Go to Morfeusz
Go to System Kuźnia (click to register)

A Polish Valence Dictionary
Elżbieta Hajnicz, Agnieszka Patejuk, Adam Przepiórkowski, Marcin Woliński, Walenty. Elektroniczny słownik walencyjny języka polskiego. Lecture
Walenty

LFG syntactic parsing and its application
Agnieszka Patejuk, Adam Przepiórkowski, Parsowanie składniowe LFG i jego zastosowania. Lecture
INESS – IPI PAN local installation

Conversational register of Polish, i.e., real-time discourse based on data obtained from Spokes
Piotr Pęzik, Rejestr nieformalny-konwersacyjny polszczyzny. Dane korpusowe a stylizacja. Lecture

Text classification and stylometric analysis system
Maciej Eder, Maciej Piasecki, System do klasyfikacji tekstu i analizy stylometrycznej. Lecture