Polish-Bulgarian Corpus

Name

Polish-Bulgarian Parallel Corpus – bilingual (Polish-Bulgarian) parallel corpus of contemporary texts.

Description

The Polish-Bulgarian Corpus is a constantly developing bilingual resource. It contains manually aligned contemporary Polish and Bulgarian texts with a total volume of more than 27.5 million words. All functional styles are represented in the Corpus. The colloquial speech is shown in film dialogues. In addition to the translations (from Polish into Bulgarian or from Bulgarian into Polish), the corpus includes translations from third languages. Currently, the work on full resource rigging is being completed, including lemmatization and morphological-syntactic annotation of all the word-forms. The selection of corpus resources was guided by the principle of ensuring high representation of various lexems and terms.

Bibliographic address of the main publication (in case of using the Polish-Bulgarian Corpus, please cite this publication)

Roszko, Roman; Roszko, Danuta; Sosnowski, Wojciech; et al., 2018, Polish-Bulgarian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/536 lub Roszko, D., Roszko, R., & Sosnowski, W. (2018). Polsko-bułgarskie korpusy IS PAN i CLARIN-PL. Slavica Lodziensia, 2018(2), 59-71. https://doi.org/10.18778/2544-1795.02.05

Auxiliary materials

Presentation from CLARIN-PL workshops: http://clarin-pl.eu/wp-content/uploads/2019/10/Korpusy-wieloj%C4%99zyczne-i-KonText-wprowadzenie.pdf

Access

Link to the manual

Corpus page with a downloadable version: https://clarin-pl.eu/dspace/handle/11321/536
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#

Examples of application

Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).

Sosnowski W., Blagoeva D., & Jaskot M. (2019a). Kŭm vŭprosa za mezhduezikovata ekvivalentnost pri frazeologiyata (leksikografski aspekti). In Vanya Micheva, Diana Blagoeva, Sia Kolkovska, Tatyana Aleksandrova, Hristina Deykova (Eds.). International Annual Conference of the Institute for Bulgarian Language (pp. 76-82). Sofia: Instytut Języka Bułgarskiego BAN, ISBN 978-954-322-987-1.

Sosnowski W., Blagoeva D., & Jaskot M. (2019b). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology, Cognitive Studies/ Études cognitives, 19, 1-17. DOI: https://doi.org/10.11649/cs.1923

Sosnowski W., Blagoeva D., & Jaskot M. (2019c). O koncepcji „Leksykonu aktywnej frazeologii bułgarskiej i polskiej”. Izvestiya na Instituta za bŭlgarski ezik ‘Prof. Lyubomir Andreĭchin ’, 32, 134-159.

Satoła-Staśkowiak, J. (2010). From momentarity to perfective multiplicity. Different aspects of the aorist. Cognitive Studies/Études cognitives, 10, 127–132, DOI: https://doi.org/10.11649/cs.2010.007

Koseska-Toszewa, V., & Satoła-Staśkowiak, J. (2014). Wprowadzenie teoretyczno-metodologiczne do „Współczesnego słownika bułgarsko-polskiego”. In A. Kisiel (Ed.), Współczesny słownik bułgarsko-polski (pp. 1–18). Warszawa: Instytut Slawistyki PAN.

Korytkowska M., Koseska-Toszewa V., & Roszko R. (2007). Polsko-bułgarska gramatyka konfrontatywna. Warszawa: Wydawnictwo Akademickie Dialog.

Sosnowski, Wojciech, Kisiel, Anna oraz Koseska-Toszewa Violetta (2016). Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim. T. 1. Warszawa: Instytut Slawistyki PAN

Sosnowski, W. P., & Satoła-Staśkowiak, J. (2019). Contrastive analysis of feminitives in Bulgarian, Polish and Russian.Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1922

Blagoeva, D., Jaskot, M. P., & Sosnowski, W. (2019). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology. Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1923

Sosnowski, Wojciech, Blagoeva, Diana oraz Kolkovska, Sia (2018). Frazeologichni inovatsii v bŭlgarskiia i polskiia ezik. Balkanistichen forum, 3, 9-20. https://www.ceeol.com/search/journal-detail?id=1069

Sosnowski, Wojciech, Blagoeva, Diana oraz Tymoshuk, Roman (2018). New Bulgarian, Polish, Ukrainian Phraseology and language corpora. Cognitive Studies | Etudes Cognitives, 18, 1-13. DOI: https://doi.org/10.11649/cs.1768

Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).