Korpus Czterech Wieszczów – nowy wymiar dziedzictwa polskiego Romantyzmu
Korpus Czterech Wieszczów to koncepcja projektu, którego celem jest stworzenie nowoczesnego zasobu zwierającego pełną twórczość Wieszczów, do których grona zaliczamy Adama Mickiewicza, Juliusza Słowackiego, Zygmunta Krasińskiego i Cypriana Norwida. Obejmuje ich twórczość od 1817 do 1883 roku.
Projekt jest efektem współpracy językoznawców, historyków literatury i informatyków. Przy tworzeniu korpusu wykorzystywany jest m.in. dorobek współczesnej filologii i edytorstwa. Głównym celem stworzenia go jest dostarczenie narzędzi do realizacji badań nad twórczością wieszczów.
Podstawowym zadaniem jest określenie zbioru tekstów. Zwracamy uwagę na istnienie różnych wersji tekstu, a w tym form użytych w pierwotnej edycji i kolejnych wydaniach, a także form uwspólnionych np. kobita – kobieta. Do wyznaczonych zadań należy też tagowanie morfosyntaktyczne, uwzględniające takie problemy jak grafia np. xiążę − książę, XIX-wieczne fleksja i słownictwo czy nietypowa składnia. Kolejnym etapem będzie przeprowadzenie analizy i wizualizacji tekstu poprzez generowanie list frekwencyjnych, tworzenie konkordancji i kolokacji, a także przeprowadzenie badań stylometrycznych czy ekstrakcji informacji. Zadania zostaną wykonane za pomocą usług i narzędzi tworzonych przez CLARIN-PL, takich jak Inforex, KonText, NER czy MeWeX.
Opisany wyżej projekt został przedstawiony podczas konferencji CLARIN-PL, która odbyła się 24-25 czerwca 2021 r., na webinarium pt. Korpus Czterech Wieszczów – nowy wymiar dziedzictwa polskiego Romantyzmu. Nagranie tego webinarium dostępne jest pod linkiem: https://www.youtube.com/watch?v=VwGx3Unyw6w.
Zachęcamy również do zapoznania się z innymi materiałami dostępnymi na kanale CLARIN-PL: https://www.youtube.com/channel/UCqrhEITxu8_MIWPnFdYomPw/videos
Wasz Zespół CLARIN-PL