Polish-Lithuanian Corpus
Name
Polish-Lithuanian Parallel Corpus “2” – bilingual (Polish-Lithuanian) parallel corpus of contemporary texts.
Description
The Polish-Lithuanian Corpus is a constantly developing bilingual resource. It contains manually aligned contemporary Polish and Lithuanian texts with a total volume of more than 16.5 million words. All functional styles are represented in the Corpus. The colloquial speech is shown in film dialogues. In addition to the translations (from Polish into Lithuanian or from Lithuanian into Polish), the corpus includes translations from third languages. Currently, the work on full resource rigging is being completed, including lemmatization and morphological-syntactic annotation of all the word-forms. The selection of corpus resources was guided by the principle of proportional representation of particular functional styles and providing a high number of lexems and terms. The broad inclusion of texts, which are mutual translations, representing legal and specialized language deserves special mention.
Bibliographic address of the main publication (in case of using the Polish-Lithuanian Corpus, please cite this publication)
Roszko, Roman and Roszko, Danuta, 2018, Polish-Lithuanian Parallel Corpus “2”, CLARIN-PL digital repository, http://hdl.handle.net/11321/539 lub Roszko, Danuta and Roszko, Roman (2018). Polsko-litewskie korpusy IS PAN i CLARIN-PL. In Prace bałtystyczne 7 (ss. 185-205).
Auxiliary materials
Prezentacja z warsztatów CLARIN-PL: http://clarin-pl.eu/wp-content/uploads/2019/10/Korpusy-wieloj%C4%99zyczne-i-KonText-wprowadzenie.pdf
Access
Strona korpusu z wersją do pobrania: https://clarin-pl.eu/dspace/handle/11321/539
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#
Link to the manual
Examples of application
Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf
Roszko, D. (2006). Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim. Warszawa: Instytut Slawistyki PAN.
Roszko, D., Roszko, R. (2012). Znachenija gipotetichnosti v litovskom, pol’skom jazykah i v litovskom govore okrestnostej Punska v Pol’she. Baltistica, 47(1), 73–88.
https://doi.org/10.15388/baltistica.47.1.2133
Roszko, R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim). Warszawa: Instytut Slawistyki PAN.
Danuta Roszko (2016). The Use of the Lexical Exponents of Hypothetical Modality in Polish and Lithuanian. “Cognitive Studies | Études cognitives“ 16. DOI: https://doi.org/10.11649/cs.2016.005
Danuta Roszko, Roman Roszko (2014), A Net Presentation of Lithuanian Sentences Containing Verbal Forms with the Grammatical Suffix -dav-, “Cognitive Studies | Études cognitives” 14, 173–182; DOI: 10.11649/cs.2014.014
Danuta Roszko (2015). Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (Na tle literackich języków polskiego i litewskiego), Instytut Slawistyki PAN, Warszawa, ss. 342.
Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf