Warsztaty CLARIN-PL w Poznaniu 2018 – prezentacje i materiały

Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL w Poznaniu:

 

Program warsztatów: tabela z programem

Czym jest CLARIN-PL – wprowadzenie

Tworzenie, przeglądanie i anotacja korpusów tekstów:

Narzędzia i zasoby do przetwarzania mowy:

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk, stylometria, grupowanie, ustalanie autorstwa, wydobywanie terminów, ustalanie nazw własnych:

Zasoby leksykalne CLARIN-PL: wielki relacyjny słownik semantyczny – Słowosieć, Słowosieć polsko-angielska, Słownik znakowany wydźwiękiem emocjonalnym, Walenty – słownik walencyjny:

Korzystanie z korpusów konwersacyjnych i równoległych: Spokes i Paralela:

Opublikowaliśmy materiały z warsztatów przeprowadzonych w IPI PAN

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas V cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały
Zapraszamy do korzystania z udostępnionych prezentacji!

Korpusomat – przygotowanie do warsztatów

Wymagania podstawowe

Do uczestnictwa w warsztacie potrzebny jest komputer z dostępem do Internetu (sieć WiFi dostępna będzie na sali warsztatowej), przeglądarką internetową (np. Firefox, Chrome) oraz systemem operacyjnym Windows, Linux lub MacOS X.

Instalacja Javy

  1. Wejdź na stronę https://www.java.com/pl/ i wybierz przycisk “Bezpłatnie pobieranie oprogramowania Java”
  2. Postępuj zgodnie z dalszymi instrukcjami na stronie, a więc wybierz opcję “Zgadzam się – rozpocznij bezpłatne pobieranie”
  3. Otwórz pobrany plik, aby rozpocząć instalację.

Pobranie i uruchomienie oprogramowania Poliqarp

Ze strony http://clip.ipipan.waw.pl/Poliqarp pobierz wersję Poliqarpa dla swojego systemu operacyjnego.

Windows

  1. Pobierz plik poliqarp-1_3_11.zip
  2. Rozpakuj archiwum do wybranego katalogu (np. na Pulpit).
    Większość współczesnych wersji Windows posiada możliwość otwierania archiwów .zip – wystarczy otworzyć pobrany plik (najczęściej znajduje się w katalogu Pobrane) i przeciągnąć zawartość, np. na Pulpit. Jeśli Windows nie pozwala otworzyć powyższego pliku, pobierz i zainstaluj dodatkowe oprogramowanie do otwierania archiwów (np. http://7-zip.org.pl/)
  3. Uruchomienie poliqarpa sprowadza się do otwarcia pliku run.bat w rozpakowanym katalogu Poliqarp.
    Jeśli wybranie pliku run.bat nie spowoduje uruchomienia Poliqarpa wykonaj następujące czynności:

 

  • otwórz plik poliqarpd.exe
  • otwórz plik poliqarp.jar

 

Linux

Pobierz:

 

Pobierz również interfejs graficzny Poliqarpa: poliqarp-gui_1.3.13_all.deb

 

Zainstaluj obie paczki za pomocą poleceń:

sudo apt-get install libjgoodies-common-java libjgoodies-forms-java libjgoodies-looks-java

 

sudo dpkg -i poliqarp-base_1.3.13_amd64.deb 

sudo dpkg -i poliqarp-gui_1.3.13_all.deb

 

Uruchom poliqarpa za pomocą polecenia:

/usr/bin/poliqarp

MacOS X

Gotowa paczka z Poliqarpem pod Mac OS X Sierra dostępna jest pod adresem:

poliqarp-1.13.13-osx.zip

 

Rozpakuj archiwum i uruchom poliqarpa poprzez:

  1. uruchomienie elementu poliqarpd (pojawi się konsola, nie należy jej wyłączać)
  2. uruchomienie elementu poliqarp.jar

 

Ewentualne problemy:

  1. Jeśli podczas uruchomienia poliqard pojawi się komunikat:
    gethostbyname() failed […]
    Sprawdź nazwę swojego komputera w oknie Preferencje systemowe -> Udostępnianie
    Jeśli nazwa Twojego komputera to np. iMac, wówczas dodaj wiersz do pliku /etc/hosts o następującej postaci:
    127.0.0.1 iMac.local
  2. Jeśli podczas uruchomienia poliqarp.jar pojawi się komunikat o braku dostępności maszyny wirtualnej Java -> Zainstaluj Javę (patrz początek dokumentu)
  3. Jeśli podczas uruchomienia poliqarp.jar pojawi się komunikat “Nie można połączyć z serwerem” / “Could not connect to the server” -> Nie działa poliqarpd, upewnij się, że okno terminala, w którym działa poliqarpd nie zostało zamknięte
  4. Jeśli podczas uruchamiania poliqarpd lub poliqarp.jar pojawi się ostrzeżenie o próbie uruchomienia aplikacji spoza AppStore -> Musisz zmienić ustawienia zezwalając na uruchamianie aplikacji spoza AppStore (Preferencje systemowe -> Ochrona i prywatność)
  5. Inne problemy z uruchomieniem poliqarpd -> Patrz “Samodzielna kompilacja ze źródeł poniżej”

MacOS X – samodzielna kompilacja ze źródeł

Pobierz źródła poliqarpa:

poliqarp_1.3.13.tar.gz

 

A następnie skompiluj, z poniższymi uwagami.

 

  1. Instalacja kompilatora, np. poprzez polecenie xcode-select –install
  2. Wygenerowanie skryptu Makefile poprzez polecenie
    ./configure
  3. Instalacja menadżera pakietów brew (https://brew.sh/index_pl.html)
    /usr/bin/ruby -e „$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)”
  4. Instalacja gnu-sed:
    brew install gnu-sed
  5. Modyfikacja pliku Makefile – dowolnym edytorem zmień wiersz rozpoczynający się od:
    sed -n -e ‘/^%token …
    na:
    gsed -n -e ‘/^%token …
  6. Kompilacja za pomocą polecenia
    make
  7. Skompilowany serwer poliqarpa oraz klient tekstowy (poliqarpd, poliqarpc) znajduje się w katalogu bin

Materiały z warsztatów w Łodzi (3-4 lutego 2017)

W dziale mediateka umieściliśmy prezentacje, z których korzystali prelegenci podczas IV cyklu wykładów i warsztatów „CLARIN-PL w praktyce badawczej. Cyfrowe Narzędzia do analizy języka w naukach humanistycznych i społecznych”.
Prezentacje zawierają podstawowe informacje dotyczące infrastruktury CLARIN-PL, wytworzonych zasobów oraz narzędzi do automatycznego przetwarzania języka.
Do materiałów prowadzi link: materiały

Prezentacja o CLARIN-PL dla firmy Samsung

17 stycznia 2017 roku dr Maciej Piasecki przeprowadził prezentację dotyczącą celów, struktury i efektów działania konsorcjum CLARIN-PL. Wykład był skierowany do pracowników firmy Samsung. Zachęcamy do zapoznania się z materiałami prezentacyjnymi:

G4.19 Language Technology and Computational Linguistics Research Group and CLARIN-PL Research Infrastructure in brief

(Podstawowe informacje na temat CLARIN-PL oraz CLARIN-EU): link

Basic language resources for Polish

(Podstawowe zasoby dla języka polskiego): link

Systems supporting development of resources

(Systemy wspierające rozwój zasobów): link

Morpho-syntactic processing of Polish

(Przetwarzanie morfo-syntaktyczne języka polskiego): link

Lexical semantics tools

(Narzędzia leksykalno-semantyczne): link

Text structure analysis

(Analiza struktury tekstu): link

Research applications in Humanities and Social Sciences

(Zastosowania badawcze w naukach humanistycznych i społecznych): link

„Słowa dnia” – nowa witryna CLARIN-PL

Szanowni Państwo!
Od 26 listopada 2015 r. na serwerach CTJ CLARIN-PL działa witryna “Słowa dnia”. Na stronie tej publikowane i komentowane są słowa, które pojawiały się szczególnie często w próbkach dyskursu medialnego z danego dnia. Listy słów dnia służą również do wyboru list miesiąca, a także słów roku.
Zapraszamy do zapoznania się z narzędziem.

 

Nowa aplikacja: Mobile plWordNet

Darmowa mobilna aplikacja do przeglądania Słowosieci (Mobile plWordNet) jest już dostępna na Google Play!

Zapraszamy do ściągania, używania i dzielenia się z nami swoimi uwagami.

Aplikacja Mobile plWordNet służy do bezpłatnego przeglądania zasobów Słowosieci (wordnetu języka polskiego). Udostępnia słownik wyrazów bliskoznacznych, opis relacji semantycznych między wyrazami, hierarchię pojęć, a dla niektórych wyrazów krótkie komentarze i przykłady użycia (więcej komentarzy i przykładów udostępnimy w kolejnych wersjach).

Aplikacja umożliwia przeglądanie wyrazów, a także podążanie po ścieżkach połączeń między nimi w obrębie dwóch słowników: polskojęzycznej Słowosieci 2.2 i anglojęzycznego Princeton Wordnet 3.1. W udostępnionej wersji Słowosieć zawiera na razie relacje międzyjęzykowe tylko dla rzeczowników. Mimo to już jest największym publicznie dostępnym słownikiem polsko-angielskim i angielsko-polskim.

Mobile plWordNet może być przeglądany offline, wymagane jest jedynie jednorazowe połączenie z Internetem i pobranie aktualnej wersji bazy danych (automatyczne aktualizacje są udostępniane co pewien czas).

UWAGA! Wielkość bazy danych do pobrania wynosi ok. 70MB, a do jej przechowywania po rozpakowaniu na urządzeniu mobilnym potrzeba ok. 190MB. Podczas pobierania zalecamy korzystanie ze stabilnego połączenia internetowego.

Pobierz Mobile plWordNet

Więcej informacji o aplikacji

Przeglądaj Słowosieć online

Czym jest Słowosieć?

Mantel i Paralela - nowe narzędzia korpusowe CLARIN-PL

Prezentacja narzędzi korpusowych CLARIN-PL

Dnia 30 marca 2015 r. w ramach organizowanego przez Wydział Lingwistyki Stosowanej UW seminarium „Polskojęzyczne korpusy równoległe”, zostaną zaprezentowane opracowane w ramach projektu CLARIN-PL narzędzie do anotacji tekstów równoległych Mantel oraz wyszukiwarka korpusów równoległych Paralela. Tego samego dnia pierwsza wersja wyszukiwarki Paralela udostępniona zostanie pod adresem http://paralela.clarin-pl.eu/.

Więcej informacji: http://rownolegle.blog.ils.uw.edu.pl/