Polsko-Litewski Korpus

Nazwa

Polsko-Litewski Korpus (nazwa wersji opublikowanej Polish-Lithuanian Parallel Corpus “2”) – dwujęzyczny (polsko-litewski) korpus równoległy tekstów współczesnych.

Opis

Polsko-Litewski Korpus jest nieustannie rozwijanym zasobem dwujęzycznym. Zawiera ręcznie zrównoleglone współczesne teksty polskie i litewskie o łącznej objętości przekraczającej 16,5 mln słowoform. W korpusie reprezentowane są wszystkie style funkcjonalne. Mowa potoczna jest uwidoczniona w dialogach filmowych. Poza tłumaczeniami wzajemnymi (z polskiego na litewski lub z litewskiego na polski) w korpusie znalazły się przekłady z języków trzecich. Obecnie na ukończeniu są prace nad pełnym otagowaniem zasobów, obejmującym lematyzację i anotację morfologiczno-syntaktyczną wszystkich słowoform. W doborze zasobów korpusowych kierowano się zasadą proporcjonalnej reprezentacji poszczególnych stylów funkcjonalnych oraz zapewnieniem wysokiej liczby leksemów i terminów. Na szczególne wyróżnienie zasługuje szerokie włączenie tekstów, będących wzajemnymi tłumaczeniami, reprezentujących język prawniczy oraz specjalistyczny.

Adres bibliograficzny publikacji przewodniej (w przypadku użycia Polsko-Litewskiego Korpusu, prosimy o cytowanie tej publikacji):

Roszko, Roman and Roszko, Danuta, 2018, Polish-Lithuanian Parallel Corpus “2”, CLARIN-PL digital repository, http://hdl.handle.net/11321/539 lub Roszko, Danuta and Roszko, Roman (2018). Polsko-litewskie korpusy IS PAN i CLARIN-PL. In Prace bałtystyczne 7 (ss. 185-205).

Dostęp

Strona korpusu z wersją do pobrania: https://clarin-pl.eu/dspace/handle/11321/539
Wyszukiwarka korpusowa: https://kontext.clarin-pl.eu/run.cgi/first_form#

Przykładowe zastosowania

Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf

Roszko, D. (2006). Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim. Warszawa: Instytut Slawistyki PAN.

Roszko, D., Roszko, R. (2012). Znachenija gipotetichnosti v litovskom, pol’skom jazykah i v litovskom govore okrestnostej Punska v Pol’she. Baltistica, 47(1), 73–88.
https://doi.org/10.15388/baltistica.47.1.2133

Roszko, R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim). Warszawa: Instytut Slawistyki PAN.

Danuta Roszko (2016). The Use of the Lexical Exponents of Hypothetical Modality in Polish and Lithuanian. “Cognitive Studies | Études cognitives“ 16. DOI: https://doi.org/10.11649/cs.2016.005

Danuta Roszko, Roman Roszko (2014), A Net Presentation of Lithuanian Sentences Containing Verbal Forms with the Grammatical Suffix -dav-, “Cognitive Studies | Études cognitives” 14, 173–182; DOI: 10.11649/cs.2014.014

Danuta Roszko (2015). Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (Na tle literackich języków polskiego i litewskiego), Instytut Slawistyki PAN, Warszawa, ss. 342.

Danuta Roszko, Roman Roszko (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej In: Ewa Gruszczyńska,
Agnieszka Leńko-Szymańska, Polskojęzyczne korpusy równoległe. Polishlanguage Parallel Corpora, s. 119-132. Warszawa. http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf