Opublikowaliśmy materiały z warsztatów przeprowadzonych w IPI PAN

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas V cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały
Zapraszamy do korzystania z udostępnionych prezentacji!

Korpusomat – przygotowanie do warsztatów

Wymagania podstawowe

Do uczestnictwa w warsztacie potrzebny jest komputer z dostępem do Internetu (sieć WiFi dostępna będzie na sali warsztatowej), przeglądarką internetową (np. Firefox, Chrome) oraz systemem operacyjnym Windows, Linux lub MacOS X.

Instalacja Javy

  1. Wejdź na stronę https://www.java.com/pl/ i wybierz przycisk “Bezpłatnie pobieranie oprogramowania Java”
  2. Postępuj zgodnie z dalszymi instrukcjami na stronie, a więc wybierz opcję “Zgadzam się – rozpocznij bezpłatne pobieranie”
  3. Otwórz pobrany plik, aby rozpocząć instalację.

Pobranie i uruchomienie oprogramowania Poliqarp

Ze strony http://clip.ipipan.waw.pl/Poliqarp pobierz wersję Poliqarpa dla swojego systemu operacyjnego.

Windows

  1. Pobierz plik poliqarp-1_3_11.zip
  2. Rozpakuj archiwum do wybranego katalogu (np. na Pulpit).
    Większość współczesnych wersji Windows posiada możliwość otwierania archiwów .zip – wystarczy otworzyć pobrany plik (najczęściej znajduje się w katalogu Pobrane) i przeciągnąć zawartość, np. na Pulpit. Jeśli Windows nie pozwala otworzyć powyższego pliku, pobierz i zainstaluj dodatkowe oprogramowanie do otwierania archiwów (np. http://7-zip.org.pl/)
  3. Uruchomienie poliqarpa sprowadza się do otwarcia pliku run.bat w rozpakowanym katalogu Poliqarp.
    Jeśli wybranie pliku run.bat nie spowoduje uruchomienia Poliqarpa wykonaj następujące czynności:

 

  • otwórz plik poliqarpd.exe
  • otwórz plik poliqarp.jar

 

Linux

Pobierz:

 

Pobierz również interfejs graficzny Poliqarpa: poliqarp-gui_1.3.13_all.deb

 

Zainstaluj obie paczki za pomocą poleceń:

sudo apt-get install libjgoodies-common-java libjgoodies-forms-java libjgoodies-looks-java

 

sudo dpkg -i poliqarp-base_1.3.13_amd64.deb 

sudo dpkg -i poliqarp-gui_1.3.13_all.deb

 

Uruchom poliqarpa za pomocą polecenia:

/usr/bin/poliqarp

MacOS X

Gotowa paczka z Poliqarpem pod Mac OS X Sierra dostępna jest pod adresem:

poliqarp-1.13.13-osx.zip

 

Rozpakuj archiwum i uruchom poliqarpa poprzez:

  1. uruchomienie elementu poliqarpd (pojawi się konsola, nie należy jej wyłączać)
  2. uruchomienie elementu poliqarp.jar

 

Ewentualne problemy:

  1. Jeśli podczas uruchomienia poliqard pojawi się komunikat:
    gethostbyname() failed […]
    Sprawdź nazwę swojego komputera w oknie Preferencje systemowe -> Udostępnianie
    Jeśli nazwa Twojego komputera to np. iMac, wówczas dodaj wiersz do pliku /etc/hosts o następującej postaci:
    127.0.0.1 iMac.local
  2. Jeśli podczas uruchomienia poliqarp.jar pojawi się komunikat o braku dostępności maszyny wirtualnej Java -> Zainstaluj Javę (patrz początek dokumentu)
  3. Jeśli podczas uruchomienia poliqarp.jar pojawi się komunikat “Nie można połączyć z serwerem” / “Could not connect to the server” -> Nie działa poliqarpd, upewnij się, że okno terminala, w którym działa poliqarpd nie zostało zamknięte
  4. Jeśli podczas uruchamiania poliqarpd lub poliqarp.jar pojawi się ostrzeżenie o próbie uruchomienia aplikacji spoza AppStore -> Musisz zmienić ustawienia zezwalając na uruchamianie aplikacji spoza AppStore (Preferencje systemowe -> Ochrona i prywatność)
  5. Inne problemy z uruchomieniem poliqarpd -> Patrz “Samodzielna kompilacja ze źródeł poniżej”

MacOS X – samodzielna kompilacja ze źródeł

Pobierz źródła poliqarpa:

poliqarp_1.3.13.tar.gz

 

A następnie skompiluj, z poniższymi uwagami.

 

  1. Instalacja kompilatora, np. poprzez polecenie xcode-select –install
  2. Wygenerowanie skryptu Makefile poprzez polecenie
    ./configure
  3. Instalacja menadżera pakietów brew (https://brew.sh/index_pl.html)
    /usr/bin/ruby -e „$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)”
  4. Instalacja gnu-sed:
    brew install gnu-sed
  5. Modyfikacja pliku Makefile – dowolnym edytorem zmień wiersz rozpoczynający się od:
    sed -n -e ‘/^%token …
    na:
    gsed -n -e ‘/^%token …
  6. Kompilacja za pomocą polecenia
    make
  7. Skompilowany serwer poliqarpa oraz klient tekstowy (poliqarpd, poliqarpc) znajduje się w katalogu bin

Materiały z warsztatów w Łodzi (3-4 lutego 2017)

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas IV cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały

IV cykl wykładów i warsztatów CLARIN-PL

IV cykl wykładów i warsztatów CLARIN-PL

CLARIN-PL w praktyce badawczej.

Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

Łódź, 3 – 4 lutego 2017

Organizatorzy: 

CLARIN-PL (www.clarin-pl.eu / www.clarin.eu)

Instytut Anglistyki Uniwersytetu Łódzkiego

miejsce: 

Wydział Filologiczny,
Uniwersytet Łódzki,
ul. Pomorska 171/173 Łódź

 

Organizatorzy cyklu zapraszają na warsztaty z praktycznego wykorzystania cyfrowych narzędzi do ilościowej i jakościowej analizy języka, przeznaczone dla badaczy z obszaru nauk humanistycznych i społecznych oraz dla tłumaczy

Wykładowcami będą pracownicy naukowi Politechniki Wrocławskiej, Uniwersytetu Łódzkiego, Instytutu Podstaw Informatyki PAN, Polsko-Japońskiej Wyższej Szkoły Technik Komputerowych, Uniwersytetu Wrocławskiego, Instytutu Języka Polskiego PAN:

mgr Agnieszka Dziob, dr hab. Maciej Eder, dr hab. Elżbieta Hajnicz, mgr inż. Paweł Kędzia, dr inż. Łukasz Kobyliński, mgr inż. Jan Kocoń, mgr inż. Danijel Korzinek,  dr hab. Małgorzata Marciniak, dr inż. Michał Marcińczuk, dr Marek Maziarz, dr Maciej Ogrodniczuk, dr Marcin Oleksy, dr Agnieszka Patejuk, prof. dr hab. Adam Pawłowski, dr Piotr Pęzik, dr inż. Maciej Piasecki, dr hab. Adam Przepiórkowski prof. IPI PAN, mgr inż. Marcin Pol, dr Ewa Rudnicka, dr Piotr Rychlik, dr inż. Tomasz Walkowiak, dr Marcin Woliński

Program warsztatów

CLARIN-PL to polskie konsorcjum naukowe będące częścią ogólnoeuropejskiej infrastruktury badawczej CLARIN (Common Language Resources & Technology Infrastructure), udostępniającej zasoby językowe oraz elektroniczne narzędzia do automatycznego przetwarzania języka, które mogą znaleźć zastosowanie w badaniach opartych na gromadzeniu i analizie dużych ilości tekstowych materiałów źródłowych.

Główna część warsztatów będzie poświęcona wykorzystaniu narzędzi i zasobów językowych w pracach badawczych z zakresu nauk humanistycznych i społecznych. Zapraszamy pracowników naukowych oraz doktorantów do udziału w zajęciach, podczas których będą mogli zapoznać się m.in. z systemami do analizy stylometrycznej i klasyfikacji tekstu, wspomagającymi tworzenie słowników dziedzinowych na podstawie tekstów oraz do badań związanych z nazwami własnymi i indeksami, które stanowią pomoc w pracach leksykograficznych. W zakres warsztatów wejdą takie zagadnienia, jak: gromadzenie i udostępnianie korpusów oraz możliwość wykorzystania narzędzi CLARIN-PL w pracy naukowej w różnych dziedzinach nauk humanistycznych i społecznych (przegląd narzędzi, zasobów i aplikacji – potencjalne zastosowania).

Serdecznie zapraszamy wszystkich naukowców, których interesuje wykorzystanie nowych metod, technik i narzędzi w praktyce badawczej. Nie jest wymagana wcześniejsza znajomość zagadnień z zakresu lingwistyki korpusowej. Dostęp do opracowanych narzędzi i zasobów językowych oraz wykorzystanie technologii językowych w naukach humanistycznych otwierają nowe ścieżki działań w badaniach z zakresu nauk humanistycznych i społecznych.

Osoby zainteresowane udziałem w warsztatach prosimy o przesłanie zgłoszenia za pośrednictwem formularza zgłoszeniowego do dnia 15 stycznia 2017. Informujemy, że ze względów technicznych liczba miejsc jest ograniczona. Warsztaty będą miały charakter praktyczny, niezbędne zatem będzie przyniesienie własnych laptopów. Jeżeli chcą Państwo uczestniczyć tylko w wybranych dniach warsztatów, proszę je wskazać w zgłoszeniu. Udział w warsztatach jest bezpłatny. Jesteśmy otwarci na wszelkie pytania i sugestie, które należy kierować za pośrednictwem poczty elektronicznej na adres: clarin-pl@pwr.edu.pl .

Więcej informacji na temat Konsorcjum oraz Centrum Technologii Językowych CLARIN-PL można znaleźć pod linkiem CLARIN-PL oraz na stronie europejskiego programu CLARIN.

Program warsztatów

Formularz zgłoszeniowy

 

Informacja o noclegach: Uczestnicy warsztatów powinni zapewnić sobie noclegi we własnym zakresie. Organizatorzy informują, że dogodnym miejscem noclegowym jest Centrum Szkoleniowo-Konferencyjne Uniwersytetu Łódzkiego przy ul. Kopcińskiego 16/18. Centrum położone jest ok. 800 m od budynku, w którym odbywać się będą warsztaty. Koszt noclegu wynosi 99 – 129 zł. Więcej informacji można znaleźć na stronie Centrum.

Warsztaty: CLARIN Workshop – Towards Interoperability of Lexico-Semantic Resources

Zapraszamy na warsztaty w Tartu: CLARIN Workshop (type I) – Towards
Interoperability of Lexico-Semantic Resources
31st January – 1st February 2017

Call for Participation in CLARIN Workshop (type I) — Towards Interoperability of Lexico-Semantic Resources
The goal of the workshop is to improve the interoperability, usability and ease of access of CLARIN lexico-semantic resources. To achieve this goal, we will work on the design of CLARIN open virtual lexical platform facilitating better access to lexical resources and research web applications by Humanities & Social Sciences (H&SS) users. The workshop will have a discussion and group-work based character. Most of the time is reserved for chaired discussions in small topic-related subgroups, concluded with reports presented to the general forum by their chairs during the summing-up session.
Researchers interested in the participation in the workshop should send a letter to the following address: clarin-pl@pwr.edu.pl — including a description of interest:
1. Short description of the background of the applicant, especially related to the workshop goal and topics. If an applicant comes from an institution which is a member of CLARIN, this should be clearly expressed.
2. Description of the motivation for the participation in the workshop.
The description should be approximately 500 words.
The deadline for submission is December 5th 2016. Decisions concerning acceptance will be sent by December 8th 2016.

The workshop is sponsored by CLARIN. Accommodation during the workshop (including one night in a university hostel) is covered. Partial reimbursement of travel costs up to 200 Euros will be offered to all participants.
The maximum capacity is limited to 25 persons who will be selected by PC on the basis of the delivered descriptions of interest. Priority will be given to participants from the CLARIN members (www.clarin.eu).

Workshop Short Description

Name workshopCLARIN Workshop (type I) -- Towards Interoperability of Lexico-Semantic Resources
TypeI: Thematic workshop (no follow-up implementation project envisaged)
Programming CommitteeMaciej Piasecki, Wrocław University of Science and Technology,
maciej.piasecki@pwr.edu.pl
Erhard Hinrichs, Eberhard-Karls-Universität Tübingen
Kadri Vider, University of Tartu, CELR
LocationCELR, University of Tartu, Tartu, Estonia
Dates31st January (9 a.m. opening) - 1st February 2017 (1 p.m. closing)
SummaryThe goal of the workshop is to improve the interoperability, usability and ease of access of CLARIN lexico-semantic resources in order to build a CLARIN open virtual lexical platform facilitating better access to lexical resources by Humanities & Social Sciences (H&SS) users and research web applications.
The topics will include:
the choice of a few common formats for CLARIN lexico-semantic resources (LSR);
the design of a system of web services for accessing CLARIN LSRs,
the common virtual platform for linking, displaying and browsing LSRs;
gathering requirements from H&SS related to LRSs and the platform.
The outcome will be an integrated report with an action plan that will be offered to the wider CLARIN community for further discussion, testing and refinement. The workshop is planned for 3 invited experts and up to 25 participants in total.

Full Description
Workshop goal
The main goal of the workshop is to initiate the works on the improvement of interoperability, usability and ease of access of CLARIN LRSs for the needs of a their better visibility for H&SS users and their enhanced utilization in research applications. The key idea is to coordinate development of a system of web services for accessing LRSs and a common virtual lexical platform built on the top of them. The platform is intended to be an open generic solution that will allow for effective linking, displaying and browsing of the rich variety of data included in CLARIN LRSs. One of the functions of the platform will be a kind of federated search for LRSs. The platform will be an open solution with potentially many installations and many web application based on them.

The main topics will include:

1. the choice of a few common formats for CLARIN lexico-semantic resources (LSR);
2. the design of a system of web services for accessing CLARIN LSRs,
3. the common virtual platform for linking, displaying and browsing LSRs;
4. gathering requirements from H&SS related to LRSs and the platform.

The outcome of the workshop will be an integrated report with an action plan for each of the key topics discussed in the working groups. It will be next offered to the wider CLARIN community for further discussion, testing and refinement. The first, limited set of standards and requirements will be selected for further work. As a follow up we will also prepare a joint proposal of CLARIN type II workshop devoted to the construction of a first set of web services for accessing selected LRSs and a first prototype of the platform. The platform development is planned to be a collaborative work, but CLARIN-PL is prepared for serve as the main developer due to a similar goal in its action plan.

Link to CLARIN strategic priorities
The topics of the workshop are closely related to several CLARIN strategic pillars (cf. CE-2015-0657), namely:
integration of data – the common format and strategy of integration will form the basis for the interoperable multifaceted resources and will thus enable “the development of tools that allow for mapping between different standards”
integration of services – the common platform and system of web services will simplify providing multilingual web services for semantic annotation, exploration, exploitation, enhancement, analysis, manipulation and visualization of language data; support for mono- and multilingual processing workflows,
ease of access – the common platform and system of web services will simplify access to different types of lexico-semantic resources. They will will enhance multilingual browsing and visualization services.
crossing borders – the common format, platform and strategy of integration will facilitate crossing borders between languages, countries, and infrastructures; “international collaboration both at the RI and at the thematic level”.

Profile of proposing team
Maciej Piasecki is an Associated Professor at Wrocław University of Science and Technology and a coordinator of the G4.19 Computational Linguistics and Language Technology Research Group. He holds PhD in Computer Science for work on Natural Language Processing. Maciej has been the leader of the Polish wordnet project since its beginning in 2005 till now. Maciej’s main research topics are: extraction of the lexico-semantic knowledge from corpora, semi-automatic wordnet expansion, Distributional Semantics and relational lexical semantics. Maciej has been also working on morpho-syntactic processing of Polish (co-author of the first Polish tagger), Information Extraction, formal semantics and Machine Translation.
Erhard Hinrichs is a Full Professor (Ordinarius) for General and Computational Linguistics, Eberhard-Karls-Universität Tübingen, Seminar für Sprachwissenschaft, Tübingen, Germany, 1991 – present. He obtained Ph.D., Linguistics from The Ohio State University, Columbus, Ohio, USA. August 1985. He has been the leader of the GermaNet project since it beginning till now. Erhard Hinrichs is CLARIN National Coordinator of Germany.
Kadri Vider is a researcher of Language Technology at Institute of Computer Sciences in University of Tartu. She managed studies of Estonian Wordnet till 2007 when she started to work in Estonian Ministry of Education and Research arranging Estonian membership in CLARIN infrastructure also. Since coming back into University of Tartu in 2011 she manages Center of Estonian Language Resources – a research infrastructure consortium executing obligations of membership of Estonia in CLARIN ERIC. Kadri Vider is CLARIN National Coordinator of Estonia.

Indication of profile(s) and number of envisaged participants
We would like to bring together key wordnet developers from CLARIN, researches with experience in wordnet applications, as well as selected experts from the area of linking wordnets and lexical semantics technology from outside CLARIN. The external experts are meant to provide reference points facilitating the discussions during the workshop.

Participants from CLARIN will be selected on the basis of descriptions of interest collected in an open call. However, we will work on obtaining good coverage with respect to CLARIN wordnets and the workshop topics. We aim at 2 invited plenary talks. The rest of places will be open to moderated discussions and collaboration in working groups. We expect up to 25 participants for 2 days.

Workshop date(s), location and timetable
The workshop will be hosted by the Institute of Computer Science, University of Tartu, Estonia and will last for 2 days starting at 9 a.m. on 31st January and finishing at 1 p.m. on 1st February.

Provisional agenda
The core of the workshop will be chaired parallel working group meetings, each devoted to one of the key topics. They will start with short presentations of (selected) speakers, addressing questions included in the CfP. Presentations will be followed by extensive discussions. Their results will be consolidated into reports and action plans. The working group meetings will be preceded by 1-2 invited plenary talks focused on the experience related to the workshop topics. The workshop will close with the plenary session during which chairs of all the working groups will present their reports and action plans that will be subject to a general discussion. It will be next offered to the wider CLARIN community for further discussion, testing and refinement.

Program Committee:

Maciej Piasecki
Erhard Hinrichs
Kadri Vider

Invited Experts (confirmed so far):
Francis Bond – author of the Open Multilingual WordNet
Christiane Fellbaum – Princeton WordNet

III cykl wykładów i warsztatów CLARIN-PL

W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się

III cykl wykładów i warsztatów

CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych

         17 – 19 czerwca 2015 roku

Uniwersytet Pedagogiczny w Krakowie, ul. Podchorążych 2

 

Organizatorzy:

CLARIN-PL

Wydział Filologiczny Uniwersytetu Pedagogicznego w Krakowie

Instytut Języka Polskiego Polskiej Akademii Nauk

Prowadzący: dr hab. Maciej Eder, dr Wojciech Jaworski, mgr inż. Paweł Kędzia, mgr inż. Jan Kocoń, dr hab. Krzysztof Marasek, dr inż. Michał Marcińczuk, dr Marek Maziarz, dr Marcin Oleksy, dr Piotr Pęzik, dr inż. Maciej Piasecki, dr hab. Adam Przepiórkowski, dr Ewa Rudnicka

Letnia Szkoła Humanistyki Cyfrowej jest skierowana do studentów, doktorantów i pracowników naukowych zainteresowanych zastosowaniem narzędzi informatycznych w swoich badaniach. W punkcie ciężkości tegorocznej edycji Szkoły stoi tekst. Proponujemy dwa moduły:

Program warsztatów CLARIN-PL

 

Warsztaty CLARIN-PL będą poświęcone wykorzystaniu narzędzi i zasobów językowych w pracach badawczych z zakresu nauk humanistycznych i społecznych. Zapraszamy pracowników naukowych do udziału w zajęciach, podczas których będą mogli zapoznać się m. in. z systemami do klasyfikacji tekstu, analizy korpusów mowy, wspomagającymi tworzenie słowników dziedzinowych na podstawie tekstów oraz do badań związanych z nazwami własnymi i indeksami, które stanowią pomoc w pracach leksykograficznych. W zakres warsztatów wejdą takie zagadnienia, jak: gromadzenie i udostępnianie korpusów oraz możliwość wykorzystania narzędzi CLARIN-PL w pracy naukowej w różnych dziedzinach nauk humanistycznych i społecznych (przegląd narzędzi, zasobów i aplikacji – potencjalne zastosowania).

Udział w Szkole Letniej jest bezpłatny, uczestnicy samodzielnie pokrywają koszty noclegów i posiłków. Organizatorzy służą pośrednictwem w znalezieniu niedrogich miejsc hotelowych w pobliskim domu studenckim lub w hostelu.
W razie pytań lub wątpliwości prosimy o kontakt na adres pracownia_metodologiczna@ijp-pan.krakow.pl lub clarin-pl@pwr.edu.pl.
Informujemy, że ze względu na bardzo duże zainteresowanie warsztatami CLARIN-PL zajęcia będą przebiegać równolegle w dwóch tokach.

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

zdjęcia z warsztatów