Warsztaty CLARIN-PL w praktyce badawczej (UMCS LUBLIN)

Szanowni Państwo,

w imieniu wszystkich organizatorów chciałbym poinformować o nadchodzącej X Edycji Cyklu wykładów i warsztatów: CLARIN-PL w praktyce badawczej.

Wydarzenie to odbędzie się 25 i 26 września 2019 roku na Wydziale Politologii Uniwersytetu Marii Curie-Skłodowskiej w Lublinie.

Serdecznie zapraszamy do wzięcia udziału w warsztatach wszystkich naukowców, dydaktyków, doktorantów i studentów zainteresowanych wykorzystaniem metod maszynowego przetwarzania języka naturalnego w badaniach humanistycznych i społecznych.

Warunkiem wzięcia udziału w warsztatach jest wypełnienie formularza rejestracyjnego (adres internetowy w dalszej części ogłoszenia). Warsztaty mają charakter bezpłatny, nie jest wymagane wcześniejsze doświadczenie w pracy z narzędziami służącymi do przetwarzania języka, konsorcjum CLARIN-PL pokrywa koszt przerw kawowych i lunchu dla uczestników.

Na warsztaty zapraszamy przede wszystkim osoby, które chciałyby w swoich badaniach wykorzystać aplikacje i zasoby oferowane przez konsorcjum CLARIN-PL. By dostosować program do Państwa potrzeb, w formularzach rejestracyjnych znajdują się pytania dotyczące zagadnień, którymi się Państwo zajmują. Prosimy o syntetyczne odpowiedzi:

Termin rejestracji to 20 czerwca 2019 roku. Po tym dniu organizatorzy przeprowadzą kwalifikację zgłoszeń (jeśli osób zgłoszonych będzie więcej niż miejsc), której wyniki zostaną przekazane zainteresowanym osobom najpóźniej 20 lipca. Zapraszamy również do zapoznania się z:

  • materiałami z poprzednich warsztatów: LINK
  • krótką charakterystyką zajęć przygotowanych na warsztaty: LINK

Organizatorami warsztatów są:

  • Wydział Politologii Uniwersytetu Marii Curie-Skłodowskiej w Lublinie

  • Centrum Technologii Językowych CLARIN-PL

  • PolLinguaTec – Centrum Wiedzy CLARIN Technologii Językowej dla Języka Polskiego

Więcej informacji na temat działalności CLARIN-PL znajdą Państwo na stronie www.clarin-pl.eu.

Zapraszamy do Wrocławia na dziesiątą edycję the Global Wordnet Conference!

Zapraszamy do udziału w dziesiątej edycji The Global Wordnet Conference (GWC 2019). Konferencja stanowi okazję do zaprezentowania wyników badań nad rozwojem, rozbudową i wykorzystaniem wordnetów dla różnych języków świata.

Organizatorami konferencji są: The Global WordNet Association oraz Grupa Technologii Językowych G4.19 (Politechnika Wrocławska)
Data konferencji: 23 – 27 lipca 2019 roku
Miejsce: Wydział Informatyki i Zarządzania Politechniki Wrocławskiej

Szczegółowe informacje o konferencji dostępne są tu: https://gwc2019.clarin-pl.eu

 

Proponowana tematyka zgłaszanych referatów:

1. Lexical semantics and meaning representation
* Critical analysis and applications of lexical and semantic relations
* Proposed new relations
* Definitions, semantic components, co-occurrence and frequency statistics
* Word and Sense Embeddings
* Necessity and completeness issues
* Ontology and wordnet
* Other lexicographical and lexicological questions pertaining to wordnet-style meaning representation
* Wordnets and Linked Open Data (LOD)

2. Architecture of lexical databases
* Language independent and language dependent components
* Integration of multi-wordnets in research infrastructures (like CLARIN) and LT networks (like META-NET)

3. Tools and Methods for wordnet development
* User and Data entry interfaces
* Methods for constructing, extending and enriching wordnets

4. Applications of wordnet
* Word sense disambiguation
* Machine translation
* Information extraction and retrieval
* Document structuring and categorisation
* Automatic hyperlinking
* Language pedagogy
* Psycholinguistic applications

5. Standardization, distribution and availability of wordnets and wordnet tools

 

 

Warsztaty CLARIN-PL w Toruniu – udostępniamy materiały

Zapraszamy do zapoznania się i korzystania z materiałów szkoleniowych przygotowanych na warsztaty CLARIN-PL w Toruniu. Warsztaty odbyły się na Uniwersytecie Mikołaja Kopernika w dniach 16 – 17 listopada 2018 roku.

Organizatorami wydarzenia byli:

– Wydział Filologiczny Uniwersytetu Mikołaja Kopernika

– Katedra Filologii Angielskiej Uniwersytetu Mikołaja Kopernika

– Centrum Technologii Językowych CLARIN-PL

– Centrum Badań nad Ewolucją Języka (CLES) UMK (http://cles.umk.pl/)

 

Archiwalne ogłoszenie o warsztatach jest dostępne tutaj.

Program można obejrzeć tutaj.

Zajęcia wraz z materiałami:

1. Tworzenie i zarządzanie korpusami, prowadzenie anotacjiautomatycznej i ręcznej: DSpace, Inforex, Korpusomat: prezentacja DSpace i Nextcloud, prezentacja Inforex, prezentacja Korpusomat.

2. Analiza morfosyntaktyczna: prezentacja Morfeusz 2.

3. Narzędzia analizy korpusów mowy: prezentacja Przetwarzanie mowy.

4. Słownik walencyjny Walenty: prezentacja Walenty.

5. Narzędzie do wydobywania terminów z tekstów TermoPL: prezentacja TermoPL.

6. Wydobywanie informacji z tekstu i stylometria: prezentacja Wydobywanie informacji z tekstu i stylometria 1, prezentacja Wydobywanie informacji z tekstu i stylometria 2, prezentacja Wydobywanie informacji z tekstu i stylometria 3.

7. Korpus równoległy PL – ENG: prezentacja Paralela.

8. Korpus konwersacyjny SPOKES: prezentacja SPOKES.

9. Wielki Słownik Relacyjny Języka Polskiego Słowosieć: prezentacja Słowosieć.

Spotkanie Rady Programowej CLARIN-PL – Politechnika Wrocławska – 07. 12. 2018 r.

Dnia siódmego grudnia 2018 roku Politechnika Wrocławska będzie gościć spotkanie Rady Programowej CLARIN-PL


Rada została powołana zgodnie z zaleceniem Ministerstwa Nauki i Szkolnictwa Wyższego i ma charakter doradczy.

Jej zadaniem ma być wskazywanie nowych kierunków badań CLARIN-PL oraz ocena stanu bieżącego infrastruktury z perspektywy zastosowań w naukach humanistycznych i społecznych.

Lista osób zasiadających w Radzie Programowej jest dostępna tutaj.

 

Warsztaty CLARIN-PL dla Stowarzyszenia 61, Mam Prawo Wiedzieć – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL dla Stowarzyszenia 61 – Mam Prawo Wiedzieć, które odbyły się w Warszawie, w dniach 13-14 lipca 2018 roku:

Wprowadzenie – przewodnik po zasobach i narzędziach CLARIN-PL: PREZENTACJA

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud: PREZENTACJA

Inforex – zarządzanie korpusami i ich anotacja: PREZENTACJA

Narzędzia CLARIN-PL: analiza tematyczna i semantyczna tekstu: PREZENTACJA

Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna (LEM) – PREZENTACJA

WebSty – otwarty sieciowy system do analizy stylometrycznej tekstu: PREZENTACJA

Narzędzia do automatycznego wydobywania kolokacji (MeWeX): PREZENTACJA

Materiały przykładowe do ćwiczeń korpusowych (archiwa zip): ludzie i partie

 

Warsztaty CLARIN-PL w Gdańsku – informacje organizacyjne

Przekazujemy najważniejsze informacje organizacyjne dotyczące warsztatów CLARIN-PL w Gdańsku  (18-19 maja 2018 r.):

 

1. Program zajęć

Aktualny program zajęć znajduje się pod tym linkiem:  PROGRAM

2. Miejsce warsztatów

Uniwersytet Gdański

Budynek Neofilologii (Wydział Filologiczny)

Wita Stwosza 51

80-308 Gdańsk

 

SALA I – 019A – sala teatralna na parterze

SALA II – 019B – sala teatralna na parterze

grupa studencka – 18.05. – sala 376; 19.05. – sala 024

3. Posiłki

Zapraszamy wszystkich Uczestników warsztatów na obiad (18.05) oraz przerwy kawowe, które będą zorganizowane w okolicach sali 019. Uczestników zapisanych w pierwszym naborze (przypisanych do zajęć w sali 019) zapraszamy również na piątkową kolację (godz. 20:30)

4. Sprzęt

Przypominamy o konieczności posiadania własnego laptopa z zainstalowaną przeglądarką (najlepiej Chrome lub Firefox) oraz możliwością podłączenia do internetu.

5. Certyfikaty

W trakcie warsztatów przekażemy Państwu imienne certyfikaty potwierdzające udział w warsztatach.

Warsztaty CLARIN-PL w Poznaniu 2018 – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL w Poznaniu:

 

Program warsztatów: tabela z programem

Czym jest CLARIN-PL – wprowadzenie

Tworzenie, przeglądanie i anotacja korpusów tekstów:

Narzędzia i zasoby do przetwarzania mowy:

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk, stylometria, grupowanie, ustalanie autorstwa, wydobywanie terminów, ustalanie nazw własnych:

Zasoby leksykalne CLARIN-PL: wielki relacyjny słownik semantyczny – Słowosieć, Słowosieć polsko-angielska, Słownik znakowany wydźwiękiem emocjonalnym, Walenty – słownik walencyjny:

Korzystanie z korpusów konwersacyjnych i równoległych: Spokes i Paralela:

Warsztaty CLARIN-PL w Poznaniu – informacje organizacyjne

Przekazujemy najważniejsze informacje organizacyjne dotyczące warsztatów CLARIN-PL w Poznaniu (12-13 kwietnia 2018 r.)
1. Program zajęć
 
2. Miejsce warsztatów

Collegium Novum UAM

Al. Niepodległości 4 Poznań

SALA I – 104 (1. piętro, budynek B) – trzeba kierować się w prawo idąc od głównego wejścia
SALA II – Sala Nauki Biblioteki Novum – od głównego wejścia na lewo, Biblioteka jest na końcu korytarza na parterze, za bistro Patio.
 
3. Posiłki
Obiady oraz kolacja są finansowane przez CLARIN-PL, posiłki będą wydawane w lokalu PATIO znajdującym się na terenie budynku, w którym przeprowadzamy warsztaty. Przerwy kawowe będą zorganizowana w pobliżu sali II. 
 
4. Sprzęt 
Przypominamy o konieczności posiadania własnego laptopa. 
 
5. Certyfikaty
W trakcie warsztatów przekażemy Państwu imienne certyfikaty potwierdzające udział w warsztatach.
 
6. Zaświadczenie dotyczące udziału
Podczas poprzednich edycji warsztatów niektórzy uczestnicy prosili nas o przesłanie przed warsztatami potwierdzenia udziału wraz z informacją, na jakie konkretnie zajęcia zostali zarejestrowani. Zaświadczenia takie zostaną rozesłane do Państwa jutro (wtorek, 10.04.) drogą mailową. 

Opublikowaliśmy instrukcje używania repozytorium DSpace oraz Systemu LEM

Wychodząc naprzeciw oczekiwaniom naszych użytkowników, którym specyficzne słownictwo językoznawczo-technologiczne może sprawiać problem, systematycznie zamieszczać będziemy specjalnie opracowane instrukcje, które w sposób przejrzysty wyjaśnią funkcjonowanie udostępnionych w ramach infrastruktury CLARIN-PL elektronicznych zasobów, narzędzi językowych i aplikacji sieciowych. Naszym celem jest przełamywanie barier hamujących wykorzystanie inżynierii języka w badaniach naukowych, zwłaszcza na gruncie dyscyplin humanistycznych i społecznych.

 

W pierwszej kolejności prezentujemy opis funkcjonowania:

  • repozytorium DSpace, które pozwala użytkownikom tworzyć bezpieczne archiwa, dostosowane do dalszego przetwarzania i długoterminowego przechowywania danych;
  • aplikacji LEM, służącej do przetwarzania tekstów (również literackich) w języku polskim w celu wydobywania z nich prostych informacji statystycznych.

 

Instrukcje zawierają nie tylko opis działania narzędzi, ale też przykłady zastosowań, które wzbogacono o grafiki ilustrujące wygląd poszczególnych elementów i komentarze na ich temat. Wyjaśniamy też specjalistyczne pojęcia i rozwiewamy wątpliwości, jakie pojawić się mogą przy pierwszym spotkaniu z infrastrukturą CLARIN-PL. Mamy nadzieję, że instrukcje ułatwią użytkownikom korzystanie z naszych usług i zachęcą do korzystania z nich w pracy naukowej.

Instrukcje będą znajdowały się na stronie CLARIN-PL w dziale Mediateka.

Poniżej zamieszczamy bezpośrednie odnośniki do dokumentów:

Instrukcja DSpace

Instrukcja LEM

Filologia cyfrowa, a może raczej eksperymentalna? Kilka uwag metodologicznych

Zapraszamy serdecznie na wystąpienie dr. hab. Macieja Edera (IJP PAN) w ramach Spotkań z Humanistyką Cyfrową organizowanych przez Pracownię Humanistyki Cyfrowej Instytutu Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Wrocławskiego.

Wystąpienie będzie poświęcone tematowi: Filologia cyfrowa, a może raczej eksperymentalna? Kilka uwag metodologicznych

 

Termin i miejsce spotkania:

2 marca 2018 roku

Instytut Informacji Naukowej i Bibliotekoznawstwa UWr
pl. Uniwersytecki 9/13
sala 104

 

Więcej informacji można uzyskać pod adresem:

Spotkania z Humanistyką Cyfrową