Polish-Russian Corpus

Name

Polish-Russian Parallel Corpus – bilingual (Polish-Russian) parallel corpus of contemporary texts.

Description

The Polish-Russian Corpus is a constantly developing bilingual resource. It contains manually aligned contemporary Polish and Russian texts with a total volume of more than 5.6 million words. All functional styles are represented in the Corpus. The colloquial speech is shown in film dialogues. In addition to the translations (from Polish into Russian or from Russian into Polish), the corpus includes translations from third languages. Currently, the work on full resource rigging is being completed, including lemmatization and morphological-syntactic annotation of all the word-forms. The selection of corpus resources was guided by the principle of ensuring high representation of various lexems and terms. Great emphasis was placed on the presentation of new lexics typical of colloquial speech, which is visible in many movie dialogues.

Bibliographic address of the main publication (in case of using the Polish-Russian Corpus, please cite this publication)

Access

Corpus page with a downloadable version: https://clarin-pl.eu/dspace/handle/11321/534
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#

Examples of application

Sosnowski, Wojciech (2017). Kategoria adresatywności w bułgarskich, polskich i rosyjskich opracowaniach leksykograficznych. Problemy i rozwiązania. W Barbara Borkowska-Kępska oraz Grzegorz Gwóźdź (Red.), LSP Perspectives 2. Języki specjalistyczne – nowe perspektywy 2 (ss. 129-140). Dąbrowa Górnicza: Wyższa Szkoła Biznesu.

Duszkin, Maksim. (2010). Wykładniki przybliżoności adnumeratywnej w języku polskim i rosyjskim. Warszawa: Slawistyczny Ośrodek Wydawniczy.

Sosnowski, Wojciech, Kisiel, Anna oraz Koseska-Toszewa Violetta (2016). Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim. T. 1. Warszawa: Instytut Slawistyki PAN

Sosnowski, W. P., & Satoła-Staśkowiak, J. (2019). Contrastive analysis of feminitives in Bulgarian, Polish and Russian.Cognitive Studies | Etudes Cognitives, 2019(19). https://doi.org/10.11649/cs.1922

Sosnowski, Wojciech (2017). Kategoria adresatywności w bułgarskich, polskich i rosyjskich opracowaniach leksykograficznych. Problemy i rozwiązania. W Barbara Borkowska-Kępska oraz Grzegorz Gwóźdź (Red.), LSP Perspectives 2. Języki specjalistyczne – nowe perspektywy 2 (ss. 129-140). Dąbrowa Górnicza: Wyższa Szkoła Biznesu.