Párhuzamos korpusz szövegek

Nyelvész Dmitry Dobrovolsky korpusznyelvészeti, fordítási nehézségek és az elvek a szervezet a különböző épületek

Meg akarom érteni, hogy mi ez, hogyan működnek, és hogy kinek, és miért van szükség. Íme a három kérdésre igyekszem megválaszolni. A párhuzamos ügyben - kétnyelvű corpus, vagyis az eredeti szöveg és annak fordítása bármilyen nyelvre, és a két szöveg nem csak feküdjön egymás mellett, és hozzá kell igazítani: néhány töredéke az eredeti meg kell egyeznie a megfelelő fordítást töredékek. Ez lehetővé teszi, hogy használja a párhuzamos korpusz, mint kutatási eszköz.

Ezen kívül egy párhuzamos igazítás fékház jegyekkel. Vannak különböző típusú jelölés: metatext, grammatikai és szemantikai. Ezek különböző címkék vannak rendelve az egyes szavak vagy teljes szöveg egészére. Mik azok számára? Ha a szöveg nem jelölt rám, nem tudok keresni nyelvtani formáját. Például nem tudok kérdezni a passzív igenév többes számban, mintha szöveget jelölt, ha vannak megfelelő címkéket, például feladat megvalósítható, és nem tudok megoldani bizonyos kutatási feladat: hogy néz ki az egyik vagy másik nyelvtani formában lefordítani másik nyelvre. Szemantikus jelölés - ez is egy nagyon érdekes dolog. Például, kérem, hogy nekem minden kontextusban, amelyben van egy elnevezésnek a ruhadarab. „Jacket”, „ing”, „nadrág” - ők valószínűleg aligha szükséges, mert mi már tudjuk, hogyan kell lefordítani ezeket a szavakat más nyelveken, de a „ujjas”, 's kabát”,»kabátja«," kabát „-, hogy megtalálja az összes szót és látni, hogy a különböző fordítók munkáját különböző kontextusokban, ez nagyon érdekes a számukra, különösen azért, mert ezek a szavak nem minden szótárban találni.

Tovább párhuzamos korpusz, hogy segítse a tanulmány az úgynevezett lingvospetsifichnoy lexikon, vagyis a szó, hogy nem jó egyenértékű más nyelveken. Korábban a fő része a lingvospetsifichnogo nyelv intuitív: kutató azt képzelte, hogy itt ez a szó van valami primordially orosz vagy angol anyanyelvű. És most be lehet állítani a helyzet: ha egy szót minden alkalommal fordította különböző módon, és ő nem egyenértékű egy normális, ez azt jelenti, hogy valószínűleg lingvospetsifichno.

És érdekes módon, így lingvospetsifichnym magyar szó, hogy „holtág”. Német úgy tűnik, hogy nagyon hasonló szavak fordítását alkalmazzák, mint például a Einöde vagy KAFF, de ez nem ugyanaz. Einöde azt sugallja, hogy nincs semmi és senki, hogy üres. A KAFF - ez valami kis település, ahol az unalmas és rossz. De holtág - ez nem feltétlenül egy kisváros, van egy másik kérdés teljesen, hogy messze van a központtól, és úgy tűnik, hogy valóban a kultúrával kapcsolatos. Azaz, a német kultúra nem annyira fontos, hogy közel laknak a fővárosban, mert bármilyen kulturális központok ott és más helyeken. Egy orosz helyet, úgy tűnik, eredetileg úgy van elrendezve, hogy az ötlet a távolságukat a központtól lexicalized, és a „dzsungel”, ennyi.

És az utolsó dolog, amit mondani akartam, párhuzamos korpusz programunk „National Corpus magyar nyelv” kifejezés nemcsak a német, én beszélek ma, vagy angol nyelven. Párhuzamos korpuszok nagyon. Van francia, spanyol, olasz, lengyel, belovengersky, ukrán, lett, örmény, van még egy többnyelvű szervvel, ha az egyik vagy a másik szöveget összehasonlítjuk annak több fordítást különböző nyelvekre. És mindezen lehet használni, ez mind ingyenes és könnyen elérhető az interneten.

Párhuzamos korpusz szövegek

Kapcsolódó cikkek