Zapraszamy do Wrocławia na dziesiątą edycję the Global Wordnet Conference!

Zapraszamy do udziału w dziesiątej edycji The Global Wordnet Conference (GWC 2019). Konferencja stanowi okazję do zaprezentowania wyników badań nad rozwojem, rozbudową i wykorzystaniem wordnetów dla różnych języków świata.

Organizatorami konferencji są: The Global WordNet Association oraz Grupa Technologii Językowych G4.19 (Politechnika Wrocławska)
Data konferencji: 23 – 27 lipca 2019 roku
Miejsce: Wydział Informatyki i Zarządzania Politechniki Wrocławskiej

Szczegółowe informacje o konferencji dostępne są tu: https://gwc2019.clarin-pl.eu

 

Proponowana tematyka zgłaszanych referatów:

1. Lexical semantics and meaning representation
* Critical analysis and applications of lexical and semantic relations
* Proposed new relations
* Definitions, semantic components, co-occurrence and frequency statistics
* Word and Sense Embeddings
* Necessity and completeness issues
* Ontology and wordnet
* Other lexicographical and lexicological questions pertaining to wordnet-style meaning representation
* Wordnets and Linked Open Data (LOD)

2. Architecture of lexical databases
* Language independent and language dependent components
* Integration of multi-wordnets in research infrastructures (like CLARIN) and LT networks (like META-NET)

3. Tools and Methods for wordnet development
* User and Data entry interfaces
* Methods for constructing, extending and enriching wordnets

4. Applications of wordnet
* Word sense disambiguation
* Machine translation
* Information extraction and retrieval
* Document structuring and categorisation
* Automatic hyperlinking
* Language pedagogy
* Psycholinguistic applications

5. Standardization, distribution and availability of wordnets and wordnet tools

 

 

Warsztaty CLARIN-PL w Toruniu – udostępniamy materiały

Zapraszamy do zapoznania się i korzystania z materiałów szkoleniowych przygotowanych na warsztaty CLARIN-PL w Toruniu. Warsztaty odbyły się na Uniwersytecie Mikołaja Kopernika w dniach 16 – 17 listopada 2018 roku.

Organizatorami wydarzenia byli:

– Wydział Filologiczny Uniwersytetu Mikołaja Kopernika

– Katedra Filologii Angielskiej Uniwersytetu Mikołaja Kopernika

– Centrum Technologii Językowych CLARIN-PL

– Centrum Badań nad Ewolucją Języka (CLES) UMK (http://cles.umk.pl/)

 

Archiwalne ogłoszenie o warsztatach jest dostępne tutaj.

Program można obejrzeć tutaj.

Zajęcia wraz z materiałami:

1. Tworzenie i zarządzanie korpusami, prowadzenie anotacjiautomatycznej i ręcznej: DSpace, Inforex, Korpusomat: prezentacja DSpace i Nextcloud, prezentacja Inforex, prezentacja Korpusomat.

2. Analiza morfosyntaktyczna: prezentacja Morfeusz 2.

3. Narzędzia analizy korpusów mowy: prezentacja Przetwarzanie mowy.

4. Słownik walencyjny Walenty: prezentacja Walenty.

5. Narzędzie do wydobywania terminów z tekstów TermoPL: prezentacja TermoPL.

6. Wydobywanie informacji z tekstu i stylometria: prezentacja Wydobywanie informacji z tekstu i stylometria 1, prezentacja Wydobywanie informacji z tekstu i stylometria 2, prezentacja Wydobywanie informacji z tekstu i stylometria 3.

7. Korpus równoległy PL – ENG: prezentacja Paralela.

8. Korpus konwersacyjny SPOKES: prezentacja SPOKES.

9. Wielki Słownik Relacyjny Języka Polskiego Słowosieć: prezentacja Słowosieć.

Spotkanie Rady Programowej CLARIN-PL – Politechnika Wrocławska – 07. 12. 2018 r.

Dnia siódmego grudnia 2018 roku Politechnika Wrocławska będzie gościć spotkanie Rady Programowej CLARIN-PL


Rada została powołana zgodnie z zaleceniem Ministerstwa Nauki i Szkolnictwa Wyższego i ma charakter doradczy.

Jej zadaniem ma być wskazywanie nowych kierunków badań CLARIN-PL oraz ocena stanu bieżącego infrastruktury z perspektywy zastosowań w naukach humanistycznych i społecznych.

Lista osób zasiadających w Radzie Programowej jest dostępna tutaj.

 

IX Cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej (Toruń)

Centrum Technologii Językowych CLARIN-PL informuje o 9. edycji Cyklu wykładów i warsztatów: CLARIN-PL w praktyce badawczej, która będzie miała miejsce

16-17 listopada 2018 roku na Uniwersytecie Mikołaja Kopernika w Toruniu

Serdecznie zapraszamy do wzięcia udziału w warsztatach wszystkich naukowców, dydaktyków, doktorantów i studentów zainteresowanych wykorzystaniem metod maszynowego przetwarzania języka naturalnego w badaniach humanistycznych i społecznych.

Warunkiem wzięcia udziału w warsztatach jest wypełnienie formularza rejestracyjnego (adres internetowy w dalszej części ogłoszenia). Jest to ostateczna rejestracja, nie przewidujemy drugiej tury zapisów.

Warsztaty mają charakter bezpłatny, nie jest wymagane wcześniejsze doświadczenie w pracy z narzędziami służącymi do przetwarzania języka.

Do wzięcia udziału w zajęciach zapraszamy przede wszystkim osoby, które chciałyby w swoich badaniach wykorzystać aplikacje i zasoby oferowane przez konsorcjum CLARIN-PL. By dostosować program do Państwa potrzeb, w formularzach rejestracyjnych znajdują się pytania dotyczące zagadnień, którymi się Państwo zajmują. Prosimy o syntetyczne odpowiedzi:

https://docs.google.com/forms/d/1rE6drq85ZDedCTiKlHv4UJqIHotz0YOsQo14LIQplPE/edit?usp=sharing

Ostateczny termin rejestracji to 05 listopada 2018 roku. Po tym czasie organizatorzy przeprowadzą kwalifikację zgłoszeń, której wyniki zostaną przekazane zainteresowanym osobom najpóźniej 08 listopada. Program jest dostępny pod linkiem: https://drive.google.com/file/d/1C0WtzPZm2gqzZAThYmlEDkFEAwW-yt0N/view

Zachęcamy Państwa do wzięcia udziału w zajęciach warsztatowych oraz dyskusjach w trakcie trzech przerw kawowych przewidzianych w programie.

Tematyka zajęć warsztatowych będzie dotyczyła między innymi:

      • tworzenia, udostępniania i zarządzania korpusami tekstowymi (repozytorium DSpace, platforma Next Cloud, system Inforex, Korpusomat)
      • charakterystyki oraz sposobu wykorzystania cyfrowych zasobów leksykalnych (wielki słownik relacyjny Słowosieć, Słowosieć dwujęzyczna, słownik walencyjny Walenty)
      • zagadnień związanych z korpusami równoległymi i konwersacyjnymi (Spokes, Paralela, wielojęzyczne korpusy równoległe)
      • wykorzystania cyfrowych narzędzi służących do wydobywania informacji z tekstu, tworzenia analiz stylometrycznych, grupowania tekstów, ustalania autorstwa, przygotowywania prostych statystyk (LEM, WebSty, Liner2)
      • narzędzi i zasobów do przetwarzania mowy; korpusów, segmentacji, rozpoznawania, analizy i transkrypcji mowy

Organizatorami warsztatów są:

– Wydział Filologiczny Uniwersytetu Mikołaja Kopernika

– Katedra Filologii Angielskiej Uniwersytetu Mikołaja Kopernika

– Centrum Technologii Językowych CLARIN-PL

– Centrum Badań nad Ewolucją Języka (CLES) UMK (http://cles.umk.pl/)

Warsztaty CLARIN-PL dla Stowarzyszenia 61, Mam Prawo Wiedzieć – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL dla Stowarzyszenia 61 – Mam Prawo Wiedzieć, które odbyły się w Warszawie, w dniach 13-14 lipca 2018 roku:

Wprowadzenie – przewodnik po zasobach i narzędziach CLARIN-PL: PREZENTACJA

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud: PREZENTACJA

Inforex – zarządzanie korpusami i ich anotacja: PREZENTACJA

Narzędzia CLARIN-PL: analiza tematyczna i semantyczna tekstu: PREZENTACJA

Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna (LEM) – PREZENTACJA

WebSty – otwarty sieciowy system do analizy stylometrycznej tekstu: PREZENTACJA

Narzędzia do automatycznego wydobywania kolokacji (MeWeX): PREZENTACJA

Materiały przykładowe do ćwiczeń korpusowych (archiwa zip): ludzie i partie

 

VIII Cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej (Wrocław)

 

Centrum Technologii Językowych CLARIN-PL pragnie poinformować o kolejnej edycji Cyklu wykładów i warsztatów: CLARIN-PL w praktyce badawczej, która będzie miała miejsce

19-20 czerwca 2018 roku na Politechnice Wrocławskiej

 

Serdecznie zapraszamy do wzięcia udziału w warsztatach wszystkich naukowców, dydaktyków, doktorantów i studentów zainteresowanych wykorzystaniem metod maszynowego przetwarzania języka naturalnego w badaniach humanistycznych i społecznych.

Warunkiem wzięcia udziału w warsztatach jest wypełnienie formularza rejestracyjnego (adres internetowy w dalszej części ogłoszenia). Warsztaty mają charakter bezpłatny, nie jest wymagane wcześniejsze doświadczenie w pracy z narzędziami służącymi do przetwarzania języka.

Na warsztaty zapraszamy przede wszystkim osoby, które chciałyby w swoich badaniach wykorzystać aplikacje i zasoby oferowane przez konsorcjum CLARIN-PL. By dostosować program do Państwa potrzeb, w formularzu rejestracyjnym znajdują się pytania dotyczące zagadnień, którymi się Państwo zajmują. Prosimy o syntetyczne odpowiedzi:

Tematyka zajęć warsztatowych będzie dotyczyła między innymi:

      • tworzenia, udostępniania i zarządzania korpusami tekstowymi (repozytorium DSpace, platforma Next Cloud, system Inforex, Korpusomat)
      • charakterystyki oraz sposobu wykorzystania cyfrowych zasobów leksykalnych (wielki słownik relacyjny Słowosieć, Słowosieć dwujęzyczna, słownik walencyjny Walenty)
      • zagadnień związanych z korpusami równoległymi i konwersacyjnymi (Spokes, Paralela, wielojęzyczne korpusy równoległe)
      • wykorzystania cyfrowych narzędzi służących do wydobywania informacji z tekstu, tworzenia analiz stylometrycznych, grupowania tekstów, ustalania autorstwa, przygotowywania prostych statystyk (LEM, WebSty, Liner2)
      • narzędzi i zasobów do przetwarzania mowy; korpusów, segmentacji, rozpoznawania, analizy i transkrypcji mowy
      • planowania badań z obszaru nauk humanistycznych i społecznych wykorzystujących przetwarzanie języka naturalnego
      • innych aspektów przetwarzania języka naturalnego, które zostaną zgłoszone w formularzach rejestracyjnych przez uczestników

Ostateczny termin rejestracji to 13 czerwca 2018 roku. Po tym czasie organizatorzy przeprowadzą kwalifikację zgłoszeń (jeśli osób zgłoszonych będzie więcej niż miejsc), której wyniki zostaną przekazane zainteresowanym osobom najpóźniej 14 czerwca.

Organizatorami warsztatów są:

      • Centrum Technologii Językowych CLARIN-PL
      • Politechnika Wrocławska, Wydział Informatyki i Zarządzania

Więcej informacji na temat działalności CLARIN-PL znajdą Państwo na stronie www.clarin-pl.eu. W zakładce „mediateka” dostępne są materiały z dotychczasowych warsztatów. Zachęcamy do zapoznania się z nimi.

 

 

Warsztaty CLARIN-PL w Gdańsku – informacje organizacyjne

Przekazujemy najważniejsze informacje organizacyjne dotyczące warsztatów CLARIN-PL w Gdańsku  (18-19 maja 2018 r.):

 

1. Program zajęć

Aktualny program zajęć znajduje się pod tym linkiem:  PROGRAM

2. Miejsce warsztatów

Uniwersytet Gdański

Budynek Neofilologii (Wydział Filologiczny)

Wita Stwosza 51

80-308 Gdańsk

 

SALA I – 019A – sala teatralna na parterze

SALA II – 019B – sala teatralna na parterze

grupa studencka – 18.05. – sala 376; 19.05. – sala 024

3. Posiłki

Zapraszamy wszystkich Uczestników warsztatów na obiad (18.05) oraz przerwy kawowe, które będą zorganizowane w okolicach sali 019. Uczestników zapisanych w pierwszym naborze (przypisanych do zajęć w sali 019) zapraszamy również na piątkową kolację (godz. 20:30)

4. Sprzęt

Przypominamy o konieczności posiadania własnego laptopa z zainstalowaną przeglądarką (najlepiej Chrome lub Firefox) oraz możliwością podłączenia do internetu.

5. Certyfikaty

W trakcie warsztatów przekażemy Państwu imienne certyfikaty potwierdzające udział w warsztatach.

Warsztaty CLARIN-PL w Poznaniu 2018 – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL w Poznaniu:

 

Program warsztatów: tabela z programem

Czym jest CLARIN-PL – wprowadzenie

Tworzenie, przeglądanie i anotacja korpusów tekstów:

Narzędzia i zasoby do przetwarzania mowy:

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk, stylometria, grupowanie, ustalanie autorstwa, wydobywanie terminów, ustalanie nazw własnych:

Zasoby leksykalne CLARIN-PL: wielki relacyjny słownik semantyczny – Słowosieć, Słowosieć polsko-angielska, Słownik znakowany wydźwiękiem emocjonalnym, Walenty – słownik walencyjny:

Korzystanie z korpusów konwersacyjnych i równoległych: Spokes i Paralela:

Warsztaty CLARIN-PL w Poznaniu – informacje organizacyjne

Przekazujemy najważniejsze informacje organizacyjne dotyczące warsztatów CLARIN-PL w Poznaniu (12-13 kwietnia 2018 r.)
1. Program zajęć
 
2. Miejsce warsztatów

Collegium Novum UAM

Al. Niepodległości 4 Poznań

SALA I – 104 (1. piętro, budynek B) – trzeba kierować się w prawo idąc od głównego wejścia
SALA II – Sala Nauki Biblioteki Novum – od głównego wejścia na lewo, Biblioteka jest na końcu korytarza na parterze, za bistro Patio.
 
3. Posiłki
Obiady oraz kolacja są finansowane przez CLARIN-PL, posiłki będą wydawane w lokalu PATIO znajdującym się na terenie budynku, w którym przeprowadzamy warsztaty. Przerwy kawowe będą zorganizowana w pobliżu sali II. 
 
4. Sprzęt 
Przypominamy o konieczności posiadania własnego laptopa. 
 
5. Certyfikaty
W trakcie warsztatów przekażemy Państwu imienne certyfikaty potwierdzające udział w warsztatach.
 
6. Zaświadczenie dotyczące udziału
Podczas poprzednich edycji warsztatów niektórzy uczestnicy prosili nas o przesłanie przed warsztatami potwierdzenia udziału wraz z informacją, na jakie konkretnie zajęcia zostali zarejestrowani. Zaświadczenia takie zostaną rozesłane do Państwa jutro (wtorek, 10.04.) drogą mailową. 

Opublikowaliśmy instrukcje używania repozytorium DSpace oraz Systemu LEM

Wychodząc naprzeciw oczekiwaniom naszych użytkowników, którym specyficzne słownictwo językoznawczo-technologiczne może sprawiać problem, systematycznie zamieszczać będziemy specjalnie opracowane instrukcje, które w sposób przejrzysty wyjaśnią funkcjonowanie udostępnionych w ramach infrastruktury CLARIN-PL elektronicznych zasobów, narzędzi językowych i aplikacji sieciowych. Naszym celem jest przełamywanie barier hamujących wykorzystanie inżynierii języka w badaniach naukowych, zwłaszcza na gruncie dyscyplin humanistycznych i społecznych.

 

W pierwszej kolejności prezentujemy opis funkcjonowania:

  • repozytorium DSpace, które pozwala użytkownikom tworzyć bezpieczne archiwa, dostosowane do dalszego przetwarzania i długoterminowego przechowywania danych;
  • aplikacji LEM, służącej do przetwarzania tekstów (również literackich) w języku polskim w celu wydobywania z nich prostych informacji statystycznych.

 

Instrukcje zawierają nie tylko opis działania narzędzi, ale też przykłady zastosowań, które wzbogacono o grafiki ilustrujące wygląd poszczególnych elementów i komentarze na ich temat. Wyjaśniamy też specjalistyczne pojęcia i rozwiewamy wątpliwości, jakie pojawić się mogą przy pierwszym spotkaniu z infrastrukturą CLARIN-PL. Mamy nadzieję, że instrukcje ułatwią użytkownikom korzystanie z naszych usług i zachęcą do korzystania z nich w pracy naukowej.

Instrukcje będą znajdowały się na stronie CLARIN-PL w dziale Mediateka.

Poniżej zamieszczamy bezpośrednie odnośniki do dokumentów:

Instrukcja DSpace

Instrukcja LEM