Polsko-Bułgarski Korpus

Nazwa

Polsko-Bułgarski Korpus (nazwa wersji opublikowanej Polish-Bulgarian Parallel Corpus) – dwujęzyczny (polsko-bułgarski) korpus równoległy tekstów współczesnych.

Opis

Polsko-Bułgarski Korpus jest nieustannie rozwijanym zasobem dwujęzycznym. Zawiera ręcznie zrównoleglone współczesne teksty polskie i litewskie o łącznej objętości przekraczającej 27,5 mln słowoform. W korpusie reprezentowane są wszystkie style funkcjonalne. Mowa potoczna jest uwidoczniona w dialogach filmowych. Poza tłumaczeniami wzajemnymi (z polskiego na bułgarski lub z bułgarskiego na polski) w korpusie znalazły się przekłady z języków trzecich. Obecnie na ukończeniu są prace nad pełnym otagowaniem zasobów, obejmującym lematyzację i anotację morfologiczno-syntaktyczną wszystkich słowoform. W doborze zasobów korpusowych kierowano się zasadą zapewnienia wysokiej reprezentacji różnorodnych leksemów i terminów.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Polsko-Bułgarskiego Korpusu, prosimy o cytowanie tej publikacji):

Roszko, Roman; Roszko, Danuta; Sosnowski, Wojciech; et al., 2018, Polish-Bulgarian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/536 lub Roszko, D., Roszko, R., & Sosnowski, W. (2018). Polsko-bułgarskie korpusy IS PAN i CLARIN-PL. Slavica Lodziensia, 2018(2), 59-71. https://doi.org/10.18778/2544-1795.02.05

Materiały pomocniczne:

Prezentacja z warsztatów CLARIN-PL: http://clarin-pl.eu/wp-content/uploads/2019/10/Korpusy-wieloj%C4%99zyczne-i-KonText-wprowadzenie.pdf

Dostęp

Strona korpusu z wersją do pobrania: https://clarin-pl.eu/dspace/handle/11321/536
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#

Przykładowe zastosowania

Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).

Sosnowski W., Blagoeva D., & Jaskot M. (2019a). Kŭm vŭprosa za mezhduezikovata ekvivalentnost pri frazeologiyata (leksikografski aspekti). In Vanya Micheva, Diana Blagoeva, Sia Kolkovska, Tatyana Aleksandrova, Hristina Deykova (Eds.). International Annual Conference of the Institute for Bulgarian Language (pp. 76-82). Sofia: Instytut Języka Bułgarskiego BAN, ISBN 978-954-322-987-1.

Sosnowski W., Blagoeva D., & Jaskot M. (2019b). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology, Cognitive Studies/ Études cognitives, 19, 1-17. DOI: https://doi.org/10.11649/cs.1923

Sosnowski W., Blagoeva D., & Jaskot M. (2019c). O koncepcji „Leksykonu aktywnej frazeologii bułgarskiej i polskiej”. Izvestiya na Instituta za bŭlgarski ezik ‘Prof. Lyubomir Andreĭchin ’, 32, 134-159.

Satoła-Staśkowiak, J. (2010). From momentarity to perfective multiplicity. Different aspects of the aorist. Cognitive Studies/Études cognitives, 10, 127–132, DOI: https://doi.org/10.11649/cs.2010.007

Koseska-Toszewa, V., & Satoła-Staśkowiak, J. (2014). Wprowadzenie teoretyczno-metodologiczne do „Współczesnego słownika bułgarsko-polskiego”. In A. Kisiel (Ed.), Współczesny słownik bułgarsko-polski (pp. 1–18). Warszawa: Instytut Slawistyki PAN.

Korytkowska M., Koseska-Toszewa V., & Roszko R. (2007). Polsko-bułgarska gramatyka konfrontatywna. Warszawa: Wydawnictwo Akademickie Dialog.

Sosnowski, Wojciech, Kisiel, Anna oraz Koseska-Toszewa Violetta (2016). Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim. T. 1. Warszawa: Instytut Slawistyki PAN

Sosnowski, W. P., & Satoła-Staśkowiak, J. (2019). Contrastive analysis of feminitives in Bulgarian, Polish and Russian.Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1922

Blagoeva, D., Jaskot, M. P., & Sosnowski, W. (2019). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology. Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1923

Sosnowski, Wojciech, Blagoeva, Diana oraz Kolkovska, Sia (2018). Frazeologichni inovatsii v bŭlgarskiia i polskiia ezik. Balkanistichen forum, 3, 9-20. https://www.ceeol.com/search/journal-detail?id=1069

Sosnowski, Wojciech, Blagoeva, Diana oraz Tymoshuk, Roman (2018). New Bulgarian, Polish, Ukrainian Phraseology and language corpora. Cognitive Studies | Etudes Cognitives, 18, 1-13. DOI: https://doi.org/10.11649/cs.1768

Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).