Polsko-Bułgarski Korpus
Nazwa
Polsko-Bułgarski Korpus (nazwa wersji opublikowanej Polish-Bulgarian Parallel Corpus) – dwujęzyczny (polsko-bułgarski) korpus równoległy tekstów współczesnych.
Opis
Polsko-Bułgarski Korpus jest nieustannie rozwijanym zasobem dwujęzycznym. Zawiera ręcznie zrównoleglone współczesne teksty polskie i litewskie o łącznej objętości przekraczającej 27,5 mln słowoform. W korpusie reprezentowane są wszystkie style funkcjonalne. Mowa potoczna jest uwidoczniona w dialogach filmowych. Poza tłumaczeniami wzajemnymi (z polskiego na bułgarski lub z bułgarskiego na polski) w korpusie znalazły się przekłady z języków trzecich. Obecnie na ukończeniu są prace nad pełnym otagowaniem zasobów, obejmującym lematyzację i anotację morfologiczno-syntaktyczną wszystkich słowoform. W doborze zasobów korpusowych kierowano się zasadą zapewnienia wysokiej reprezentacji różnorodnych leksemów i terminów.
Adres bibliograficzny publikacji przewodniej (w przypadku użycia Polsko-Bułgarskiego Korpusu, prosimy o cytowanie tej publikacji):
Roszko, Roman; Roszko, Danuta; Sosnowski, Wojciech; et al., 2018, Polish-Bulgarian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/536 lub Roszko, D., Roszko, R., & Sosnowski, W. (2018). Polsko-bułgarskie korpusy IS PAN i CLARIN-PL. Slavica Lodziensia, 2018(2), 59-71. https://doi.org/10.18778/2544-1795.02.05
Materiały pomocniczne:
Prezentacja z warsztatów CLARIN-PL: http://clarin-pl.eu/wp-content/uploads/2019/10/Korpusy-wieloj%C4%99zyczne-i-KonText-wprowadzenie.pdf
Dostęp
Strona korpusu z wersją do pobrania: https://clarin-pl.eu/dspace/handle/11321/536
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#
Link do instrukcji
Przykładowe zastosowania
Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).
Sosnowski W., Blagoeva D., & Jaskot M. (2019a). Kŭm vŭprosa za mezhduezikovata ekvivalentnost pri frazeologiyata (leksikografski aspekti). In Vanya Micheva, Diana Blagoeva, Sia Kolkovska, Tatyana Aleksandrova, Hristina Deykova (Eds.). International Annual Conference of the Institute for Bulgarian Language (pp. 76-82). Sofia: Instytut Języka Bułgarskiego BAN, ISBN 978-954-322-987-1.
Sosnowski W., Blagoeva D., & Jaskot M. (2019b). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology, Cognitive Studies/ Études cognitives, 19, 1-17. DOI: https://doi.org/10.11649/cs.1923
Sosnowski W., Blagoeva D., & Jaskot M. (2019c). O koncepcji „Leksykonu aktywnej frazeologii bułgarskiej i polskiej”. Izvestiya na Instituta za bŭlgarski ezik ‘Prof. Lyubomir Andreĭchin ’, 32, 134-159.
Satoła-Staśkowiak, J. (2010). From momentarity to perfective multiplicity. Different aspects of the aorist. Cognitive Studies/Études cognitives, 10, 127–132, DOI: https://doi.org/10.11649/cs.2010.007
Koseska-Toszewa, V., & Satoła-Staśkowiak, J. (2014). Wprowadzenie teoretyczno-metodologiczne do „Współczesnego słownika bułgarsko-polskiego”. In A. Kisiel (Ed.), Współczesny słownik bułgarsko-polski (pp. 1–18). Warszawa: Instytut Slawistyki PAN.
Korytkowska M., Koseska-Toszewa V., & Roszko R. (2007). Polsko-bułgarska gramatyka konfrontatywna. Warszawa: Wydawnictwo Akademickie Dialog.
Sosnowski, Wojciech, Kisiel, Anna oraz Koseska-Toszewa Violetta (2016). Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim. T. 1. Warszawa: Instytut Slawistyki PAN
Sosnowski, W. P., & Satoła-Staśkowiak, J. (2019). Contrastive analysis of feminitives in Bulgarian, Polish and Russian.Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1922
Blagoeva, D., Jaskot, M. P., & Sosnowski, W. (2019). A lexicographical approach to the contrastive analysis of Bulgarian and Polish phraseology. Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1923
Sosnowski, Wojciech, Blagoeva, Diana oraz Kolkovska, Sia (2018). Frazeologichni inovatsii v bŭlgarskiia i polskiia ezik. Balkanistichen forum, 3, 9-20. https://www.ceeol.com/search/journal-detail?id=1069
Sosnowski, Wojciech, Blagoeva, Diana oraz Tymoshuk, Roman (2018). New Bulgarian, Polish, Ukrainian Phraseology and language corpora. Cognitive Studies | Etudes Cognitives, 18, 1-13. DOI: https://doi.org/10.11649/cs.1768
Banasiak, Jakub (2018). Wokół problemów semantycznej kategorii określoności/nieokreśloności i struktury tematyczno-rematycznej w języku bułgarskim i polskim. Slavica Lodziensia, 2018(2).