Polish-Lithuanian Corpus

Name

Polish-Lithuanian Parallel Corpus “2” – bilingual (Polish-Lithuanian) parallel corpus of contemporary texts.

Description

The Polish-Lithuanian Corpus is a constantly developing bilingual resource. It contains manually aligned contemporary Polish and Lithuanian texts with a total volume of more than 16.5 million words. All functional styles are represented in the Corpus. The colloquial speech is shown in film dialogues. In addition to the translations (from Polish into Lithuanian or from Lithuanian into Polish), the corpus includes translations from third languages. Currently, the work on full resource rigging is being completed, including lemmatization and morphological-syntactic annotation of all the word-forms. The selection of corpus resources was guided by the principle of proportional representation of particular functional styles and providing a high number of lexems and terms. The broad inclusion of texts, which are mutual translations, representing legal and specialized language deserves special mention.

Bibliographic address of the main publication (in case of using the Polish-Lithuanian Corpus, please cite this publication)

Roszko, Roman and Roszko, Danuta, 2018, Polish-Lithuanian Parallel Corpus “2”, CLARIN-PL digital repository, http://hdl.handle.net/11321/539 lub Roszko, Danuta and Roszko, Roman (2018). Polsko-litewskie korpusy IS PAN i CLARIN-PL. In Prace bałtystyczne 7 (ss. 185-205).

Access

Strona korpusu z wersją do pobrania: https://clarin-pl.eu/dspace/handle/11321/539
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#

Examples of application

Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf

Roszko, D. (2006). Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim. Warszawa: Instytut Slawistyki PAN.

Roszko, D., Roszko, R. (2012). Znachenija gipotetichnosti v litovskom, pol’skom jazykah i v litovskom govore okrestnostej Punska v Pol’she. Baltistica, 47(1), 73–88.
https://doi.org/10.15388/baltistica.47.1.2133

Roszko, R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim). Warszawa: Instytut Slawistyki PAN.

Danuta Roszko (2016). The Use of the Lexical Exponents of Hypothetical Modality in Polish and Lithuanian. “Cognitive Studies | Études cognitives“ 16. DOI: https://doi.org/10.11649/cs.2016.005

Danuta Roszko, Roman Roszko (2014), A Net Presentation of Lithuanian Sentences Containing Verbal Forms with the Grammatical Suffix -dav-, “Cognitive Studies | Études cognitives” 14, 173–182; DOI: 10.11649/cs.2014.014

Danuta Roszko (2015). Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (Na tle literackich języków polskiego i litewskiego), Instytut Slawistyki PAN, Warszawa, ss. 342.

Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf