Mediateka
INSTRUKCJE OBSŁUGI ZASOBÓW I NARZĘDZI
Praktyczne i proste instrukcje skierowane do każdego użytkownika.
Zawierają informacje o podstawowych funkcjach, obsłudze i możliwościach zastosowania narzędzi.
Nazwa | Opis |
Instrukcja obsługi repozytorium DSpace | |
Instrukcja obsługi systemu Inforex (dokument w trakcie aktualizacji) | |
Instrukcja obsługi systemu WebSty | |
Instrukcja obsługi systemu LEM | |
Instrukcja do wyszukiwarki korpusowej KonText | |
Ściągawka dla instrukcji do KonTextu | |
Instrukcja do Federacyjnego Wyszukiwania Treści | |
Opis obsługi Wirtualnego Obserwatorium Językowego | |
Instrukcja użytkowania | |
Instrukcja użytkowania | |
Opis funkcji | |
Instrukcja użytkowania |
MATERIAŁY WARSZTATOWE
Cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej.
-
Warsztaty “Automatyczne przetwarzanie tekstów na potrzeby badaczy mediów i komunikacji społecznej” – 24 maja 2024 r
Zapraszamy do zapoznania się z prezentacjami wykorzystanymi podczas warsztatów “Automatyczne przetwarzanie tekstów na potrzeby badaczy mediów i komunikacji społecznej”, które odbyły się 24 maja 2024 roku i które zostały zorganizowane przez Zakład Nowych Mediów IDMiKS we współpracy z CLARIN-PL:
- CLARIN-PL – wydobywanie informacji: (PREZENTACJA)
- CLARIN-PL – otwarta infrastruktura: (PREZENTACJA)
- CLARIN-PL – modelowanie tematyczne: (PREZENTACJA)
- Dobre praktyki samodzielnego pozyskiwania i przygotowania danych: (PREZENTACJA)
-
Seminarium “CLARIN-PL-Biz – technologie językowe dla nauki i biznesu II” – 24-25 czerwca 2021 r
Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas seminarium “CLARIN-PL-Biz – technologie językowe dla nauki i biznesu II”, które odbyło się 24-25 czerwca 2021 roku:
- CLARIN-PL – infrastruktura badawcza nauk humanistycznych i społecznych: (WEBINARIUM)
- CLARIN-PL – model współpracy z infrastrukturą: (WEBINARIUM, PREZENTACJA)
- Korpus Czterech Wieszczów – nowy wymiar dziedzictwa polskiego Romantyzmu: (WEBINARIUM)
- Słowosieć i jej wykorzystanie w badaniach ekonomicznych: (WEBINARIUM, PREZENTACJA)
- Nowe usługi przetwarzania tekstów: (WEBINARIUM, PREZENTACJA)
- Prezentacja parsera zależnościowego COMBO wraz z zastosowaniami: (WEBINARIUM, PREZENTACJA)
- Migranci i pandemia na Twitterze – analiza wydźwięku: (WEBINARIUM)
- Dialog Obywatelski w dyskursie parlamentarnym – przykład integralnego zastosowania infrastruktury: (WEBINARIUM, PREZENTACJA)
- Korpusomat i jego zastosowanie w analizie i rozwoju Zintegrowanego Rejestru Kwalifikacji: (WEBINARIUM, PREZENTACJA)
- CLARIN-PL Biz – infrastruktura badawczo-rozwojowa dla sztucznej inteligencji i ich zastosowań: (WEBINARIUM)
- Rozpoznawanie mowy i jego ocen: (WEBINARIUM)
- Anonimizator – narzędzie do automatycznej anonimizacji tekstów: (WEBINARIUM, PREZENTACJA)
- Biznesowe zastosowania wordnetów i ontologii: przykład współpracy z QTravel: (WEBINARIUM)
- Wydobywanie informacji z tekstów oraz klasyfikacja kwalifikacji: Instytut Badań Edukacyjnych: (WEBINARIUM, PREZENTACJA)
- Wykorzystanie korpusów CLARIN jako zasobów do uczenia sztucznej inteligencji – anotowany korpus dialogów: (WEBINARIUM)
- Wykorzystanie korpusów CLARIN jako zasobów do uczenia sztucznej inteligencji – korpusy wielojęzyczne i modele
językowe: (WEBINARIUM) - Chronopress – eksploracja diachronicznych korpusów prasowych: (WEBINARIUM)
- Wykrywanie klauzul abuzywnych we wzorcach umownych – przykład współpracy z UOKiK: (WEBINARIUM)
- CLARIN jako źródło modeli wektorowych: (WEBINARIUM)
- Korpus dyskursu parlamentarnego (PREZENTACJA)
-
Seminarium “CLARIN-PL-Biz – technologie językowe dla nauki i biznesu” – 16 marca 2021 r
Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas seminarium “CLARIN-PL-Biz – technologie językowe dla nauki i biznesu”, które odbyło się 16 marca 2021 roku:
- Wprowadzenie: (PREZENTACJA)
- System CLARIN BIZ do przechowywania i przetwarzania bardzo dużych danych językowych: (PREZENTACJA)
- Zasoby językowe – źródła wiedzy i wzorce treningowe dla uczenia maszynowego: (PREZENTACJA)
- Podstawowe narzędzia analizy językowej: (PREZENTACJA)
- Wstępne przetwarzanie języka: (PREZENTACJA)
- Serwis przetwarzania mowy: (PREZENTACJA)
- Analiza semantyczna tekstów: (PREZENTACJA)
- Analiza semantyczna tekstów: (PREZENTACJA)
- Systemy dialogowe: podstawowy, szkieletowy, modułowy system dla języka polskiego: (PREZENTACJA)
- Analiza polaryzacji wydźwięku i emocji w tekście (PREZENTACJA)
- Analiza polaryzacji wydźwięku i emocji w tekście (WEBINARIUM)
- Planowane aplikacje (PREZENTACJA)
- Folder informacyjny Clarin-Biz
-
Udostępniamy materiały z Warsztatów w Instytucie Dziennikarstwa, Mediów i Komunikacji Społecznej UJ
W dniach 2-3 marca 2020 roku odbyły się warsztaty dla zespołu badaczy z IDMiKS UJ.
Zachęcamy do zapoznania się z materiałami warsztatowymi:
- CLARIN-PL – wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych (PREZENTACJA)
-
CLARIN-PL. Inżynieria języka naturalnego w naukach społecznych – podstawowe pojęcia (PREZENTACJA)
-
Korpus Dyskursu Parlamentarnego (PREZENTACJA)
-
Korpusomat – narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego (PREZENTACJA)
-
Narzędzia wydobywania informacji z tekstu (PREZENTACJA)
-
Wydobywanie informacji z tekstu (PREZENTACJA)
-
LEM: wydobywanie statystyk z tekstu (PREZENTACJA)
-
Słowosieć – polskie zasoby leksykalne i możliwość ich wykorzystania (PREZENTACJA) (CASE STUDY: Artykuł K. Rybińskiego – przykład zastosowania plWordNetu)
-
Narzędzia przetwarzania mowy (PREZENTACJA)
-
Warsztaty CLARIN-PL w praktyce badawczej (UMCS LUBLIN)
MATERIAŁY I PREZENTACJE Z WARSZTATÓW:
- CLARIN-PL – wprowadzenie (PREZENTACJA)
- Słowosieć – WordNet (PREZENTACJA)
- Narzędzia przetwarzania mowy (PREZENTACJA)
- Parsowanie zależnościowe (PREZENTACJA)
- Ekstrakcja terminologii z tekstu – TermoPL (PREZENTACJA)
- Korpus Dyskursu Parlamentarnego (PREZENTACJA)
- Korpusomat – narzędzie do tworzenia korpusów (PREZENTACJA)
-
Analizator fleksyjny Morfeusz2 (PREZENTACJA)
- Korpusy wielojęzyczne + przeglądarka korpusowa Kontext (PREZENTACJA)
- Repozytorium DSpace + Platforma CLARIN Cloud + Narzędzie INFOREX (anotacja korpusów) (PREZENTACJA)
-
Materiały i prezentacje z warsztatów: „Narzędzia CLARIN-PL w badaniach naukowych w psychologii”
Udostępniamy poniżej materiały prezentacyjne z warsztatów „Narzędzia CLARIN-PL w badaniach naukowych w psychologii„, które odbyły się w Poznaniu na Uniwersytecie SWPS w dniach 23-24 maja 2019 roku.
Zachęcamy do zapoznania się z materiałami oraz dzielenia się uwagami lub sugestiami drogą mailową na adres: jan.wieczorek@pwr.edu.pl
UWAGA! Niektóre prezentacje mają rozmiar większy niż 20 MB.
Materiały i prezentacje:
- CLARIN w pigułce. Skrót informacji na temat infrastruktury badawczej CLARIN ERIC oraz polskiego konsorcjum CLARIN-PL. Co to jest? Jakie są cele? Kto je tworzy? Kim są użytkownicy? (PREZENTACJA)
-
Ekstrakcja informacji oraz stylometria na usługach psychologii. Zajęcia ukazujące możliwości analizy materiału interesujące z perspektywy psychologów.Przykładowo: analiza stylometryczna i ekstrakcja informacji z materiałów pozyskanych od osób po przejściu traumy: wyszukiwanie charakterystycznych cech językowych (na planie formalnym oraz semantycznym), próba typologii, wykazanie zmian w czasie. Ekstrakcja informacji oraz stylometria na usługach psychologii (I) (PREZENTACJA), Analiza semantyczna – stylometria (II) (PREZENTACJA), Klasyfikacja tematyczna (III) (PREZENTACJA), zmiany w czasie/modelowanie tematyczne (IV) (PREZENTACJA)
-
Narzędzia analizy korpusów mowy. Jak szybko przeprowadzić podstawowe działania badawcze na materiale akustycznym – analiza formalna nagrań, tworzenie transkrypcji nagrań. Mowa (PREZENTACJA)
-
Słowosieć – polskie zasoby leksykalne i możliwość ich wykorzystania. Słownik ten jest wzorowany na angielskojęzycznym Princeton WordNet tworzonym pierwotnie na potrzeby amerykańskich psychologów. Słowosieć może służyć do różnych celów badawczych – w tym psychologicznych (przykłady wykorzystania anotacji emocjonalnej pojęć). Słowosieć (PREZENTACJA)
-
Dspace i Inforex – tworzenie korpusów tekstów. Zajęcia prezentujące narzędzia przeznaczone do tworzenia i publicznego udostępniania korpusów materiałów językowych (repozytorium Dspace) oraz środowisko zintegrowane z nim. DSpace (PREZENTACJA), CLARIN CLOUD i środowisko zintegrowanych narzędzi (PREZENTACJA)
-
Warsztaty CLARIN-PL w Toruniu – udostępniamy materiały
Zapraszamy do zapoznania się i korzystania z materiałów szkoleniowych przygotowanych na warsztaty CLARIN-PL w Toruniu. Warsztaty odbyły się na Uniwersytecie Mikołaja Kopernika w dniach 16 – 17 listopada 2018 roku.
Organizatorami wydarzenia byli:
– Wydział Filologiczny Uniwersytetu Mikołaja Kopernika
– Katedra Filologii Angielskiej Uniwersytetu Mikołaja Kopernika
– Centrum Technologii Językowych CLARIN-PL
– Centrum Badań nad Ewolucją Języka (CLES) UMK (http://cles.umk.pl/)
Program można obejrzeć tutaj.
Zajęcia wraz z materiałami:
1. Tworzenie i zarządzanie korpusami, prowadzenie anotacji automatycznej i ręcznej: DSpace i Nextcloud (PREZENTACJA), Inforex (PREZENTACJA), Korpusomat (PREZENTACJA)
2. Narzędzia znakowania fleksyjnego tekstów polskich: Morfeusz 2 i Concraft 2 (PREZENTACJA).
3. Narzędzia analizy korpusów mowy: Przetwarzanie mowy (PREZENTACJA).
4. Walenty – elektroniczny słownik walencyjny języka polskiego (PREZENTACJA).
5. Identyfikacja terminów wielowyrazowych w tekście TermoPL (PREZENTACJA).
6. Wydobywanie informacji z tekstu i stylometria: Wydobywanie informacji z tekstu i stylometria 1 (PREZENTACJA), prezentacja Modelowanie tematyczne (PREZENTACJA), prezentacja WebSty – otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów (PREZENTACJA)
7. Korpus równoległy PL – ENG: Paralela (PREZENTACJA).
8. Korpus konwersacyjny SPOKES: (PREZENTACJA).
9. Wielki Słownik Relacyjny Języka Polskiego Słowosieć: (PREZENTACJA).
-
Warsztaty CLARIN-PL dla Stowarzyszenia 61, Mam Prawo Wiedzieć – prezentacje i materiały
Zapraszamy do zapoznania się z prezentacjami i materiałami wykorzystanymi podczas warsztatów CLARIN-PL dla Stowarzyszenia 61 – Mam Prawo Wiedzieć, które odbyły się w Warszawie, w dniach 13-14 lipca 2018 roku:
- Wprowadzenie – przewodnik po zasobach i narzędziach CLARIN-PL: (PREZENTACJA)
- Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud: (PREZENTACJA)
- Inforex – zarządzanie korpusami i ich anotacja: (PREZENTACJA)
- Narzędzia CLARIN-PL: analiza tematyczna i semantyczna tekstu: (PREZENTACJA)
- Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna (LEM): (PREZENTACJA)
- WebSty – otwarty sieciowy system do analizy stylometrycznej tekstu: (PREZENTACJA)
- Narzędzia do automatycznego wydobywania kolokacji (MeWeX): (PREZENTACJA)
- Materiały przykładowe do ćwiczeń korpusowych (archiwa zip): ludzie i partie
PUBLIKACJE I PREZENTACJE
Materiały poświęcone polskim badaniom z dziedziny humanistyki cyfrowej oraz zasobom i narzędziom rozwijanym w CLARIN-PL.
-
Wytyczne dla lingwistów
- Dokument techniczny – opis semantyczny rzeczownika w Słowosieci
- Dokument techniczny – opis semantyczny przymiotnika w Słowosieci
- Dokument techniczny – opis semantyczny przysłówka w Słowosieci
- Dokument techniczny – system kwalifikatorów w Słowosieci
- Dokument techniczny – procedura sprawdzania leksykalności połączenia wielowyrazowego w Słowosieci
- Relacyjna definicja znaczenia w leksykografii
E-HUMANISTYKA W POLSCE
Baza odnośników do wybranych polskich narzędzi i zasobów językowych; informacje o centrach badawczych, projektach i inicjatywach związanych z zastosowaniami lingwistyki komputerowej w Polsce.
-
- “Historia mówiona” – projekt lubelskiego ośrodka “Brama Grodzka – Teatr NN”, polegający na rejestrowaniu, opracowywaniu oraz upowszechnianiu relacji mówionych dotyczących Lublina i Lubelszczyzny od dwudziestolecia międzywojennego do czasów współczesnych.
- Grupa stylistyki komputerowej – strona poświęcona możliwościom wykorzystania inżynierii języka w nowoczesnych badaniach stylistycznych.
Analiza języka postaci Trylogii Sienkiewicza
- Centrum Humanistyki Cyfrowej Instytutu Badań Literackich PAN – Centrum zajmuje się obecnością humanistyki w sieci, wykorzystywaniem nowych technologii w badaniach literackich oraz badaniami literackimi nad nowymi technologiami.
Blog jako nowa forma piśmiennictwa multimedialnego Współpraca z CLARIN-PL
Interaktywna mapa literacka Współpraca z CLARIN-PL
- Analiza Dyskursu – konsorcjum naukowe i portal gromadzący teksty ważne dla polskiej kultury i społeczeństwa oraz zrzeszający badaczy nauk humanistycznych i społecznych zainteresowanych polskim dyskursem publicznym.
- ehum.psnc.pl – strona przedstawia narzędzia i zasoby przydatne w badaniach humanistycznych, w szczególności wspierające gromadzenie, przetwarzanie i analizę danych oraz publikację wyników badań.
- Platforma Obsługi Nauki PLATON – projekt rozwoju krajowej naukowej infrastruktury teleinformatycznej o aplikacje i usługi wspierające prace badawcze.
- Kultura instytucjonalna w Sieci: treści i odbiorcy – celem projektu jest pogłębiona charakterystyka rosnącego wycinka odbiorców kultury instytucjonalnej, którzy stykają się z nią za pośrednictwem Internetu.
Współpraca z CLARIN-PL - Sensualność w kulturze polskiej – projekt poświęcony problematyce sensualności rozumianej jako historycznie zmienny zbiór reprezentacji ludzkich zmysłów. Projekt realizowany on-line w formie witryny pełniącej funkcję multimedialnej internetowej encyklopedii tematycznej.
- Analiza kulturologiczna i suprasegmentalna interakcji komunikacyjnych nacechowanych grzecznością lub niegrzecznością – projekt mający na celu analizę funkcji wyrażeniowych i komunikacyjnych istniejącego korpusu niemieckiego oraz stworzenie i analizę korpusów równoległych w innych językach (polski, włoski, bułgarski).
-
- Academica
- Archiwum Kobiet – projekt zakładający stworzenie bazy danych oraz zainicjowanie digitalnego archiwum niewydanych rękopisów kobiet mieszkających na obszarze historycznej Polski od XVI wieku do współczesności.
- Bałtycka Biblioteka Cyfrowa
- BazTech
- Biblioteka Cyfrowa Uniwersytetu Wrocławskiego
- CYBRA Łódzka Regionalna Biblioteka Cyfrowa
- Cyfrowa Biblioteka Narodowa Polona
- dlibra.psnc.pl – strona produktów wspomagających biblioteki cyfrowe (dArceo, dLab, dLibra, dMuseion).
- Dolnośląska Biblioteka Cyfrowa
- Federacja Bibliotek Cyfrowych – zbiór usług sieciowych opartych na zasobach cyfrowych dostępnych w polskich bibliotekach cyfrowych i repozytoriach uruchomionych w sieci PIONIER.
- Kujawsko-Pomorska Biblioteka Cyfrowa
- Małopolska Biblioteka Cyfrowa
- Mazowiecka Biblioteka Cyfrowa
- Podkarpacka Biblioteka Cyfrowa
- Podlaska Biblioteka Cyfrowa
- Pomorska Biblioteka Cyfrowa
- Repozytorium Cyfrowe Instytutów Naukowych – repozytorium gromadzące materiały archiwalne, publikacje naukowe, dokumentację badań oraz piśmiennicze dziedzictwo kulturowe.
- Śląska Biblioteka Cyfrowa
- Zachodniopomorska Biblioteka Cyfrowa “Pomerania”
- Zespół Bibliotek Cyfrowych Poznańskiego Centrum Superkomputerowo-Sieciowego – zespół prowadzący prace badawczo-rozwojowe w zakresie bibliotek cyfrowych.
- Zielonogórska Biblioteka Cyfrowa
- Wirtualna Biblioteka Nauki
-
- Centrum Cyfrowe Projekt: Polska pracuje na rzecz zmiany społecznej i zwiększenia zaangażowania obywatelskiego wykorzystując potencjał narzędzi cyfrowych oraz modeli współpracy opartych na dzieleniu się zasobami i wiedzą.
- Fundacja Nowoczesna Polska – fundacja działa na rzecz nowoczesnej edukacji, promuje otwarty, darmowy dostęp do materiałów edukacyjnych, lektur i podręczników.
- Fundacja Piąte Medium – lubelska organizacja pozarządowa zajmująca się edukacją pozaformalną, skoncentrowaną na upowszechnianiu tzw. „nowych mediów” w procesie edukacyjnym.
- Historia i Media – portal poświęcony historycznym zasobom Internetu i nowym trendom w humanistyce cyfrowej; informuje o dostępnych online zbiorach historycznych/archiwalnych, narzędziach cyfrowych dla historyków, udostępnia artykuły dotyczące np. zagadnień metodologicznych czy rekonstrukcji historycznych.
- Labkit.pl – interdyscyplinarne spotkania, warsztaty i projekty łączące nowe technologie i edukację.
- THATCamp Polska (The Humanities and Technology Camp) – otwarte spotkania i warsztaty promujące cyfrową humanistykę i integrujące polskie środowisko badaczy kultury cyfrowej.