VIII Cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej (Wrocław)

 

Centrum Technologii Językowych CLARIN-PL pragnie poinformować o kolejnej edycji Cyklu wykładów i warsztatów: CLARIN-PL w praktyce badawczej, która będzie miała miejsce

19-20 czerwca 2018 roku na Politechnice Wrocławskiej

 

Serdecznie zapraszamy do wzięcia udziału w warsztatach wszystkich naukowców, dydaktyków, doktorantów i studentów zainteresowanych wykorzystaniem metod maszynowego przetwarzania języka naturalnego w badaniach humanistycznych i społecznych.

Warunkiem wzięcia udziału w warsztatach jest wypełnienie formularza rejestracyjnego (adres internetowy w dalszej części ogłoszenia). Warsztaty mają charakter bezpłatny, nie jest wymagane wcześniejsze doświadczenie w pracy z narzędziami służącymi do przetwarzania języka.

Na warsztaty zapraszamy przede wszystkim osoby, które chciałyby w swoich badaniach wykorzystać aplikacje i zasoby oferowane przez konsorcjum CLARIN-PL. By dostosować program do Państwa potrzeb, w formularzu rejestracyjnym znajdują się pytania dotyczące zagadnień, którymi się Państwo zajmują. Prosimy o syntetyczne odpowiedzi:

Tematyka zajęć warsztatowych będzie dotyczyła między innymi:

   • tworzenia, udostępniania i zarządzania korpusami tekstowymi (repozytorium DSpace, platforma Next Cloud, system Inforex, Korpusomat)
   • charakterystyki oraz sposobu wykorzystania cyfrowych zasobów leksykalnych (wielki słownik relacyjny Słowosieć, Słowosieć dwujęzyczna, słownik walencyjny Walenty)
   • zagadnień związanych z korpusami równoległymi i konwersacyjnymi (Spokes, Paralela, wielojęzyczne korpusy równoległe)
   • wykorzystania cyfrowych narzędzi służących do wydobywania informacji z tekstu, tworzenia analiz stylometrycznych, grupowania tekstów, ustalania autorstwa, przygotowywania prostych statystyk (LEM, WebSty, Liner2)
   • narzędzi i zasobów do przetwarzania mowy; korpusów, segmentacji, rozpoznawania, analizy i transkrypcji mowy
   • planowania badań z obszaru nauk humanistycznych i społecznych wykorzystujących przetwarzanie języka naturalnego
   • innych aspektów przetwarzania języka naturalnego, które zostaną zgłoszone w formularzach rejestracyjnych przez uczestników

Ostateczny termin rejestracji to 13 czerwca 2018 roku. Po tym czasie organizatorzy przeprowadzą kwalifikację zgłoszeń (jeśli osób zgłoszonych będzie więcej niż miejsc), której wyniki zostaną przekazane zainteresowanym osobom najpóźniej 14 czerwca.

Organizatorami warsztatów są:

   • Centrum Technologii Językowych CLARIN-PL
   • Politechnika Wrocławska, Wydział Informatyki i Zarządzania

Więcej informacji na temat działalności CLARIN-PL znajdą Państwo na stronie www.clarin-pl.eu. W zakładce „mediateka” dostępne są materiały z dotychczasowych warsztatów. Zachęcamy do zapoznania się z nimi.

 

 

Warsztaty CLARIN-PL w Poznaniu 2018 – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL w Poznaniu:

 

Program warsztatów: tabela z programem

Czym jest CLARIN-PL – wprowadzenie

Tworzenie, przeglądanie i anotacja korpusów tekstów:

Narzędzia i zasoby do przetwarzania mowy:

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk, stylometria, grupowanie, ustalanie autorstwa, wydobywanie terminów, ustalanie nazw własnych:

Zasoby leksykalne CLARIN-PL: wielki relacyjny słownik semantyczny – Słowosieć, Słowosieć polsko-angielska, Słownik znakowany wydźwiękiem emocjonalnym, Walenty – słownik walencyjny:

Korzystanie z korpusów konwersacyjnych i równoległych: Spokes i Paralela:

Wywiad z prof. Adamem Pawłowskim z Uniwersytetu Wrocławskiego

Zapraszamy do lektury wywiadu z prof. Adamem Pawłowskim. Profesor koordynuje prace konsorcjum CLARIN-PL na Uniwersytecie Wrocławskim, jest inicjatorem i autorem portalu Chronopress. Najważniejszy element portalu stanowi przeglądarka umożliwiająca przeszukiwanie oraz wykonywanie prostych obliczeń dla wyboru polskich tekstów prasowych z lat 1945 – 1962.

Zapraszamy do lektury wywiadu dostępnego TUTAJ.

Tekst ukazał się elektronicznej oraz tradycyjnej wersji Przeglądu Uniwersyteckiego.

Opublikowaliśmy materiały z warsztatów przeprowadzonych w IPI PAN

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas V cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały
Zapraszamy do korzystania z udostępnionych prezentacji!

Materiały z warsztatów w Łodzi (3-4 lutego 2017)

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas IV cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały

Prezentacja o CLARIN-PL dla firmy Samsung

17 stycznia 2017 roku dr Maciej Piasecki przeprowadził prezentację dotyczącą celów, struktury i efektów działania konsorcjum CLARIN-PL. Wykład był skierowany do pracowników firmy Samsung. Zachęcamy do zapoznania się z materiałami prezentacyjnymi:

G4.19 Language Technology and Computational Linguistics Research Group and CLARIN-PL Research Infrastructure in brief

(Podstawowe informacje na temat CLARIN-PL oraz CLARIN-EU): link

Basic language resources for Polish

(Podstawowe zasoby dla języka polskiego): link

Systems supporting development of resources

(Systemy wspierające rozwój zasobów): link

Morpho-syntactic processing of Polish

(Przetwarzanie morfo-syntaktyczne języka polskiego): link

Lexical semantics tools

(Narzędzia leksykalno-semantyczne): link

Text structure analysis

(Analiza struktury tekstu): link

Research applications in Humanities and Social Sciences

(Zastosowania badawcze w naukach humanistycznych i społecznych): link

IV cykl wykładów i warsztatów CLARIN-PL

IV cykl wykładów i warsztatów CLARIN-PL

CLARIN-PL w praktyce badawczej.

Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

Łódź, 3 – 4 lutego 2017

Organizatorzy: 

CLARIN-PL (www.clarin-pl.eu / www.clarin.eu)

Instytut Anglistyki Uniwersytetu Łódzkiego

miejsce: 

Wydział Filologiczny,
Uniwersytet Łódzki,
ul. Pomorska 171/173 Łódź

 

Organizatorzy cyklu zapraszają na warsztaty z praktycznego wykorzystania cyfrowych narzędzi do ilościowej i jakościowej analizy języka, przeznaczone dla badaczy z obszaru nauk humanistycznych i społecznych oraz dla tłumaczy

Wykładowcami będą pracownicy naukowi Politechniki Wrocławskiej, Uniwersytetu Łódzkiego, Instytutu Podstaw Informatyki PAN, Polsko-Japońskiej Wyższej Szkoły Technik Komputerowych, Uniwersytetu Wrocławskiego, Instytutu Języka Polskiego PAN:

mgr Agnieszka Dziob, dr hab. Maciej Eder, dr hab. Elżbieta Hajnicz, mgr inż. Paweł Kędzia, dr inż. Łukasz Kobyliński, mgr inż. Jan Kocoń, mgr inż. Danijel Korzinek,  dr hab. Małgorzata Marciniak, dr inż. Michał Marcińczuk, dr Marek Maziarz, dr Maciej Ogrodniczuk, dr Marcin Oleksy, dr Agnieszka Patejuk, prof. dr hab. Adam Pawłowski, dr Piotr Pęzik, dr inż. Maciej Piasecki, dr hab. Adam Przepiórkowski prof. IPI PAN, mgr inż. Marcin Pol, dr Ewa Rudnicka, dr Piotr Rychlik, dr inż. Tomasz Walkowiak, dr Marcin Woliński

Program warsztatów

CLARIN-PL to polskie konsorcjum naukowe będące częścią ogólnoeuropejskiej infrastruktury badawczej CLARIN (Common Language Resources & Technology Infrastructure), udostępniającej zasoby językowe oraz elektroniczne narzędzia do automatycznego przetwarzania języka, które mogą znaleźć zastosowanie w badaniach opartych na gromadzeniu i analizie dużych ilości tekstowych materiałów źródłowych.

Główna część warsztatów będzie poświęcona wykorzystaniu narzędzi i zasobów językowych w pracach badawczych z zakresu nauk humanistycznych i społecznych. Zapraszamy pracowników naukowych oraz doktorantów do udziału w zajęciach, podczas których będą mogli zapoznać się m.in. z systemami do analizy stylometrycznej i klasyfikacji tekstu, wspomagającymi tworzenie słowników dziedzinowych na podstawie tekstów oraz do badań związanych z nazwami własnymi i indeksami, które stanowią pomoc w pracach leksykograficznych. W zakres warsztatów wejdą takie zagadnienia, jak: gromadzenie i udostępnianie korpusów oraz możliwość wykorzystania narzędzi CLARIN-PL w pracy naukowej w różnych dziedzinach nauk humanistycznych i społecznych (przegląd narzędzi, zasobów i aplikacji – potencjalne zastosowania).

Serdecznie zapraszamy wszystkich naukowców, których interesuje wykorzystanie nowych metod, technik i narzędzi w praktyce badawczej. Nie jest wymagana wcześniejsza znajomość zagadnień z zakresu lingwistyki korpusowej. Dostęp do opracowanych narzędzi i zasobów językowych oraz wykorzystanie technologii językowych w naukach humanistycznych otwierają nowe ścieżki działań w badaniach z zakresu nauk humanistycznych i społecznych.

Osoby zainteresowane udziałem w warsztatach prosimy o przesłanie zgłoszenia za pośrednictwem formularza zgłoszeniowego do dnia 15 stycznia 2017. Informujemy, że ze względów technicznych liczba miejsc jest ograniczona. Warsztaty będą miały charakter praktyczny, niezbędne zatem będzie przyniesienie własnych laptopów. Jeżeli chcą Państwo uczestniczyć tylko w wybranych dniach warsztatów, proszę je wskazać w zgłoszeniu. Udział w warsztatach jest bezpłatny. Jesteśmy otwarci na wszelkie pytania i sugestie, które należy kierować za pośrednictwem poczty elektronicznej na adres: clarin-pl@pwr.edu.pl .

Więcej informacji na temat Konsorcjum oraz Centrum Technologii Językowych CLARIN-PL można znaleźć pod linkiem CLARIN-PL oraz na stronie europejskiego programu CLARIN.

Program warsztatów

Formularz zgłoszeniowy

 

Informacja o noclegach: Uczestnicy warsztatów powinni zapewnić sobie noclegi we własnym zakresie. Organizatorzy informują, że dogodnym miejscem noclegowym jest Centrum Szkoleniowo-Konferencyjne Uniwersytetu Łódzkiego przy ul. Kopcińskiego 16/18. Centrum położone jest ok. 800 m od budynku, w którym odbywać się będą warsztaty. Koszt noclegu wynosi 99 – 129 zł. Więcej informacji można znaleźć na stronie Centrum.

Rada Programowa CLARIN-PL

Rada została powołana zgodnie z zaleceniem Ministerstwa Nauki i Szkolnictwa Wyższego i ma charakter doradczy. Jej zadaniem ma być wskazywanie nowych kierunków badań CLARIN-PL oraz ocena stanu bieżącego infrastruktury z perspektywy zastosowań w naukach humanistycznych i społecznych.

Skład Rady:

prof. dr hab. Marek Jeziński
Uniwersytet Mikołaja Kopernika

prof. dr hab. Kazimierz Wolny-Zmorzyński
Uniwersytet Warszawski

prof. dr hab. Jerzy Bartmiński
projekt EUROJOS

dr hab. Marek Troszyński
Instytut Badań Literackich PAN

prof. dr hab. Włodzimierz Gruszczyński
Uniwersytet SWPS; Instytut Języka Polskiego PAN

dr hab. Joanna Rączaszek-Leonardi
Instytut Psychologii PAN

dr hab. Kazimierz Krzysztofek, prof. Uniwersytetu SWPS
Uniwersytet SWPS

dr hab. Katarzyna Materska, prof. UKSW
Uniwersytet Kardynała Stefana Wyszyńskiego

prof. dr hab. Wojciech Burszta
Uniwersytet SWPS; Instytut slawistyki PAN

dr hab. Tomasz Wicherkiewicz, prof. UAM
Uniwersytet im. Adama Mickiewicza

dr hab. Katarzyna Klessa
Uniwersytet im. Adama Mickiewicza

Warsztaty: CLARIN Workshop – Towards Interoperability of Lexico-Semantic Resources

Zapraszamy na warsztaty w Tartu: CLARIN Workshop (type I) – Towards
Interoperability of Lexico-Semantic Resources
31st January – 1st February 2017

Call for Participation in CLARIN Workshop (type I) — Towards Interoperability of Lexico-Semantic Resources
The goal of the workshop is to improve the interoperability, usability and ease of access of CLARIN lexico-semantic resources. To achieve this goal, we will work on the design of CLARIN open virtual lexical platform facilitating better access to lexical resources and research web applications by Humanities & Social Sciences (H&SS) users. The workshop will have a discussion and group-work based character. Most of the time is reserved for chaired discussions in small topic-related subgroups, concluded with reports presented to the general forum by their chairs during the summing-up session.
Researchers interested in the participation in the workshop should send a letter to the following address: clarin-pl@pwr.edu.pl — including a description of interest:
1. Short description of the background of the applicant, especially related to the workshop goal and topics. If an applicant comes from an institution which is a member of CLARIN, this should be clearly expressed.
2. Description of the motivation for the participation in the workshop.
The description should be approximately 500 words.
The deadline for submission is December 5th 2016. Decisions concerning acceptance will be sent by December 8th 2016.

The workshop is sponsored by CLARIN. Accommodation during the workshop (including one night in a university hostel) is covered. Partial reimbursement of travel costs up to 200 Euros will be offered to all participants.
The maximum capacity is limited to 25 persons who will be selected by PC on the basis of the delivered descriptions of interest. Priority will be given to participants from the CLARIN members (www.clarin.eu).

Workshop Short Description

Name workshopCLARIN Workshop (type I) -- Towards Interoperability of Lexico-Semantic Resources
TypeI: Thematic workshop (no follow-up implementation project envisaged)
Programming CommitteeMaciej Piasecki, Wrocław University of Science and Technology,
maciej.piasecki@pwr.edu.pl
Erhard Hinrichs, Eberhard-Karls-Universität Tübingen
Kadri Vider, University of Tartu, CELR
LocationCELR, University of Tartu, Tartu, Estonia
Dates31st January (9 a.m. opening) - 1st February 2017 (1 p.m. closing)
SummaryThe goal of the workshop is to improve the interoperability, usability and ease of access of CLARIN lexico-semantic resources in order to build a CLARIN open virtual lexical platform facilitating better access to lexical resources by Humanities & Social Sciences (H&SS) users and research web applications.
The topics will include:
the choice of a few common formats for CLARIN lexico-semantic resources (LSR);
the design of a system of web services for accessing CLARIN LSRs,
the common virtual platform for linking, displaying and browsing LSRs;
gathering requirements from H&SS related to LRSs and the platform.
The outcome will be an integrated report with an action plan that will be offered to the wider CLARIN community for further discussion, testing and refinement. The workshop is planned for 3 invited experts and up to 25 participants in total.

Full Description
Workshop goal
The main goal of the workshop is to initiate the works on the improvement of interoperability, usability and ease of access of CLARIN LRSs for the needs of a their better visibility for H&SS users and their enhanced utilization in research applications. The key idea is to coordinate development of a system of web services for accessing LRSs and a common virtual lexical platform built on the top of them. The platform is intended to be an open generic solution that will allow for effective linking, displaying and browsing of the rich variety of data included in CLARIN LRSs. One of the functions of the platform will be a kind of federated search for LRSs. The platform will be an open solution with potentially many installations and many web application based on them.

The main topics will include:

1. the choice of a few common formats for CLARIN lexico-semantic resources (LSR);
2. the design of a system of web services for accessing CLARIN LSRs,
3. the common virtual platform for linking, displaying and browsing LSRs;
4. gathering requirements from H&SS related to LRSs and the platform.

The outcome of the workshop will be an integrated report with an action plan for each of the key topics discussed in the working groups. It will be next offered to the wider CLARIN community for further discussion, testing and refinement. The first, limited set of standards and requirements will be selected for further work. As a follow up we will also prepare a joint proposal of CLARIN type II workshop devoted to the construction of a first set of web services for accessing selected LRSs and a first prototype of the platform. The platform development is planned to be a collaborative work, but CLARIN-PL is prepared for serve as the main developer due to a similar goal in its action plan.

Link to CLARIN strategic priorities
The topics of the workshop are closely related to several CLARIN strategic pillars (cf. CE-2015-0657), namely:
integration of data – the common format and strategy of integration will form the basis for the interoperable multifaceted resources and will thus enable “the development of tools that allow for mapping between different standards”
integration of services – the common platform and system of web services will simplify providing multilingual web services for semantic annotation, exploration, exploitation, enhancement, analysis, manipulation and visualization of language data; support for mono- and multilingual processing workflows,
ease of access – the common platform and system of web services will simplify access to different types of lexico-semantic resources. They will will enhance multilingual browsing and visualization services.
crossing borders – the common format, platform and strategy of integration will facilitate crossing borders between languages, countries, and infrastructures; “international collaboration both at the RI and at the thematic level”.

Profile of proposing team
Maciej Piasecki is an Associated Professor at Wrocław University of Science and Technology and a coordinator of the G4.19 Computational Linguistics and Language Technology Research Group. He holds PhD in Computer Science for work on Natural Language Processing. Maciej has been the leader of the Polish wordnet project since its beginning in 2005 till now. Maciej’s main research topics are: extraction of the lexico-semantic knowledge from corpora, semi-automatic wordnet expansion, Distributional Semantics and relational lexical semantics. Maciej has been also working on morpho-syntactic processing of Polish (co-author of the first Polish tagger), Information Extraction, formal semantics and Machine Translation.
Erhard Hinrichs is a Full Professor (Ordinarius) for General and Computational Linguistics, Eberhard-Karls-Universität Tübingen, Seminar für Sprachwissenschaft, Tübingen, Germany, 1991 – present. He obtained Ph.D., Linguistics from The Ohio State University, Columbus, Ohio, USA. August 1985. He has been the leader of the GermaNet project since it beginning till now. Erhard Hinrichs is CLARIN National Coordinator of Germany.
Kadri Vider is a researcher of Language Technology at Institute of Computer Sciences in University of Tartu. She managed studies of Estonian Wordnet till 2007 when she started to work in Estonian Ministry of Education and Research arranging Estonian membership in CLARIN infrastructure also. Since coming back into University of Tartu in 2011 she manages Center of Estonian Language Resources – a research infrastructure consortium executing obligations of membership of Estonia in CLARIN ERIC. Kadri Vider is CLARIN National Coordinator of Estonia.

Indication of profile(s) and number of envisaged participants
We would like to bring together key wordnet developers from CLARIN, researches with experience in wordnet applications, as well as selected experts from the area of linking wordnets and lexical semantics technology from outside CLARIN. The external experts are meant to provide reference points facilitating the discussions during the workshop.

Participants from CLARIN will be selected on the basis of descriptions of interest collected in an open call. However, we will work on obtaining good coverage with respect to CLARIN wordnets and the workshop topics. We aim at 2 invited plenary talks. The rest of places will be open to moderated discussions and collaboration in working groups. We expect up to 25 participants for 2 days.

Workshop date(s), location and timetable
The workshop will be hosted by the Institute of Computer Science, University of Tartu, Estonia and will last for 2 days starting at 9 a.m. on 31st January and finishing at 1 p.m. on 1st February.

Provisional agenda
The core of the workshop will be chaired parallel working group meetings, each devoted to one of the key topics. They will start with short presentations of (selected) speakers, addressing questions included in the CfP. Presentations will be followed by extensive discussions. Their results will be consolidated into reports and action plans. The working group meetings will be preceded by 1-2 invited plenary talks focused on the experience related to the workshop topics. The workshop will close with the plenary session during which chairs of all the working groups will present their reports and action plans that will be subject to a general discussion. It will be next offered to the wider CLARIN community for further discussion, testing and refinement.

Program Committee:

Maciej Piasecki
Erhard Hinrichs
Kadri Vider

Invited Experts (confirmed so far):
Francis Bond – author of the Open Multilingual WordNet
Christiane Fellbaum – Princeton WordNet