Abordări ale traducerii automate
Sistemele de traducere automată pot utiliza o metodă de traducere bazată pe reguli lingvistice. Cel mai cuvintele potrivite din limba sursă sunt pur și simplu înlocuite cu cuvinte din limba țintă.
Se susține adesea că, pentru a rezolva cu succes problema traducerii automate, este necesar să se rezolve problema înțelegerii textului în limbaj natural.
De regulă, metoda de traducere bazată pe reguli folosește o reprezentare simbolică (intermediar), pe baza căreia este creat textul în limba țintă. Și dacă luăm în considerare natura intermediarului, atunci putem vorbi de traducere automată interlingvistică sau traducere automată de transfer. Aceste metode necesită dicționare foarte mari cu informații morfologice, sintactice și semantice și un set mare de reguli.
Dacă sistemul de traducere automată are suficiente date, se poate obține o traducere de bună calitate. Principala dificultate constă în formarea acestor date. De exemplu, corpurile mari de text necesare pentru metodele statistice de traducere nu sunt suficiente pentru traducerea bazată pe gramatică. Mai mult, pentru acesta din urmă, este necesară o sarcină suplimentară de gramatică.
Pentru traducerea limbilor înrudite (rusă, ucraineană), o simplă înlocuire a cuvintelor poate fi suficientă.
Sistemele moderne de traducere automată sunt împărțite în trei grupuri mari:
bazate pe reguli
pe baza de exemple
Bazat pe reguli SMP
Sisteme de traducere automată bazate pe reguli este un termen general care se referă la sisteme de traducere automată bazate pe informații lingvistice despre limbile sursă și țintă.
Ele constau din dicționare și gramatici bilingve, care acoperă principalele modele semantice, morfologice, sintactice ale fiecărei limbi. Această abordare a traducerii automate este numită și clasică.
Pe baza acestor date, textul sursă este convertit secvenţial, pe propoziţii, în textul tradus. Adesea, astfel de sisteme sunt în contrast cu sistemele de traducere automată care se bazează pe exemple.
Principiul de funcționare a unor astfel de sisteme este legătura dintre structura propozițiilor de intrare și de ieșire. Traducerea nu este de o calitate deosebit de bună. Dar mai departe exemple simple lucrări.
Traducerea din engleză în germană va arăta astfel:
O fată mănâncă un măr. Ein Madchen isst einen Apfel.
Aceste sisteme se împart în trei grupe:
sisteme de traducere cuvânt cu cuvânt;
· sisteme de transfer;
interlingvistice;
Traducerea cuvintelor
Astfel de sisteme sunt acum utilizate extrem de rar din cauza calității proaste a traducerii. Cuvintele textului sursă sunt convertite (ca atare) în cuvintele textului tradus. Adesea o astfel de transformare are loc fără lematizare și analiză morfologică. Aceasta este cea mai simplă metodă de traducere automată. Este folosit pentru a traduce liste lungi de cuvinte (de ex. directoare). Poate fi folosit și pentru a compune interliniare pentru sisteme TM.
Sisteme de transfer
La fel ca sistemele de transfer, și interlingvistice, au aceeași idee generală. Pentru traducere, este necesar să existe un intermediar care să poarte sensul expresiei traduse. În sistemele interlingvistice, mediatorul nu depinde de o pereche de limbi, în timp ce în sistemele de transfer depinde.
Sistemele de transfer funcționează pe un principiu foarte simplu: textului de intrare se aplică reguli care se potrivesc cu structurile limbilor sursă și țintă. Etapa inițială a lucrării include analiza morfologică, sintactică (și uneori semantică) a textului pentru a crea o reprezentare internă. Traducerea este generată din această reprezentare folosind dicționare bilingve și reguli gramaticale. Uneori, pe baza reprezentării primare, care a fost obținută din textul sursă, se construiește o reprezentare internă mai „abstractă”. Acest lucru se face pentru a sublinia locurile importante pentru traducere și pentru a elimina părțile neesențiale ale textului. La construirea textului de traducere, transformarea nivelurilor reprezentărilor interne are loc în ordine inversă.
Când folosiți această strategie, este suficient calitate superioară traduceri, cu o acuratețe de aproximativ 90% (deși aceasta depinde foarte mult de perechea de limbi). Funcționarea oricărui sistem de transfer constă din cel puțin cinci părți:
analiza morfologică;
transfer lexical;
transfer structural;
generare morfologică.
Analiza morfologică. Cuvintele textului sursă sunt clasificate pe părți de vorbire. Caracteristicile lor morfologice sunt relevate. Lemele de cuvinte sunt definite.
Categorizări lexicale. În orice text, unele cuvinte pot avea mai multe semnificații, provocând ambiguitate în analiză. Categorizarea lexicală dezvăluie contextul unui cuvânt. Sunt posibile diverse note și clarificări.
Transferul lexical. Pe baza unui dicționar bilingv, lemele de cuvinte sunt traduse. Acțiunea este foarte asemănătoare cu traducerea cuvânt cu cuvânt.
transfer structural. Cuvintele sunt de acord în propoziție.
Generație morfologică. Pe baza datelor de ieșire ale transferului structural, sunt create forme de cuvânt ale textului tradus.
Una dintre principalele caracteristici ale sistemelor transcendente de traducere automată este etapa în care reprezentarea intermediară a textului în limba sursă este „transferată” la reprezentarea intermediară a textului în limba țintă. Acest lucru poate funcționa pe unul dintre cele două niveluri de analiză lingvistică sau pe ambele.
1. Transfer de suprafață (sintactic). Acest nivel se caracterizează prin transferul de „structuri sintactice” între limbile sursă și țintă. Potrivit pentru limbi din aceeași familie sau același tip, cum ar fi limbile romanice, între italiană spaniolă, catalană, franceză etc.
2. Transfer profund (semantic). Nivelul este caracterizat de o reprezentare semantică. Depinde de limba originală. Această reprezentare poate consta dintr-un număr de structuri care reprezintă o valoare. De asemenea, traducerea necesită de obicei un transfer structural. Acest nivel este folosit pentru traducerea între limbi mai îndepărtate.
Traducere automată interlingvistică
Traducerea automată interlingvistică este una dintre abordările clasice ale traducerii automate. original textul este transformat într-o reprezentare abstractă care este independentă de limbă (spre deosebire de traducerea prin transfer). Textul tradus este generat pe baza acestei reprezentări. Principalul avantaj al acestei abordări este acela de a adăuga o nouă limbă sistemului. Se poate dovedi matematic că, în cadrul acestei abordări, crearea fiecărui interpret nou de limbă pentru un astfel de sistem va reduce costul acestuia, comparativ, de exemplu, cu un sistem de traducere prin transfer. Mai mult, această abordare poate
· să implementeze „repovestirea textului”, parafrazarea textului sursă într-o singură limbă;
· relativ implementare simplă traducerea unor limbi foarte diferite, cum ar fi, de exemplu, rusă și arabă.
Cu toate acestea, încă nu există implementări ale acestei abordări care să funcționeze corect pentru cel puțin două limbi. Mulți experți își exprimă îndoielile cu privire la posibilitatea unei astfel de implementări. Cea mai mare dificultate în crearea unor astfel de sisteme constă în proiectarea reprezentării în mai multe limbi. Ar trebui să fie atât abstract, cât și independent de limbaje specifice, dar în același timp ar trebui să reflecte caracteristicile oricărei limbi existente. Pe de altă parte, în cadrul inteligenţă artificială, sarcina de a evidenția sensul textului în acest moment nu a fost încă rezolvată.
Abordarea interlingvistică a fost propusă pentru prima dată în secolul al XVII-lea de Descartes și Leibniz, care au propus dicționare universale folosind coduri numerice. Alții precum Cave Beck, Athanasius Kircher și Johann Joachim Becher au lucrat pentru a dezvolta un limbaj universal fără ambiguități, bazat pe principiile logicii și iconografiei.
În 1668, John Wilkins, în tratatul său An Essay on Genuine Symbolism and Philosophical Language, vorbea despre interlingua sa.
În secolele al XVIII-lea și al XIX-lea, au fost dezvoltate multe limbi universale, inclusiv Esperanto. Se știe că ideea unui limbaj universal pentru traducerea automată nu s-a manifestat în niciun fel în etapele inițiale ale dezvoltării acestei tehnologii. În schimb, au fost luate în considerare doar perechi de limbi. Totuși, în anii 1950 și 60, cercetătorii de la Cambridge conduși de Margaret Masterman, de la Leningrad conduși de Nikolai Andreev și de la Milano Silvio Ceccato au început să lucreze în acest domeniu.
În anii 1970 și 1980, s-au făcut unele progrese în acest domeniu și au fost construite o serie de sisteme de traducere automată.
În această metodă de traducere, reprezentarea interlingvă poate fi gândită ca o modalitate de descriere a analizei unui text, în limba originală. Totodată, în reprezentare se păstrează caracteristicile morfologice, sintactice ale textului. Se presupune că în acest fel este posibil să se transmită „sensul” atunci când se creează un text tradus.
În acest caz, se folosesc uneori două reprezentări interlingve. Una dintre ele reflectă mai mult caracteristicile limbii sursă. Cealaltă este limba țintă. Traducerea în acest caz se realizează în două etape.
În unele cazuri, sunt folosite două sau mai multe reprezentări de același nivel (la fel de apropiate de ambele limbi), dar diferite în materie. Acest lucru este necesar pentru a îmbunătăți calitatea traducerii unor texte specifice.
Această abordare nu este nouă pentru lingvistică. Se bazează pe ideea de apropiere a limbilor. Pentru a îmbunătăți calitatea traducerii, limbajul natural este folosit ca punte între alte două limbi. De exemplu, când traduceți din ucraineană în engleză, uneori se folosește rusă.
Pentru a utiliza sistemul de traducere automată interlingvistică, aveți nevoie de:
Dicționare de analiză și generare de texte;
descrierea gramaticilor limbilor;
baza de cunoștințe a conceptelor (pentru a crea o reprezentare interlingvă);
· Reguli de proiectare a conceptelor pentru limbaje și reprezentări.
Cel mai dificil moment la crearea acestui tip este incapacitatea de a construi o bază pentru zone largi cunoştinţe. Și acele baze de date care sunt create pentru un subiect foarte specific au o complexitate de calcul ridicată.
Introducere
Traducere automată- procesul de traducere a textelor (scrise și, în mod ideal, orale) dintr-o limbă naturală în alta folosind un program special de calculator. Se mai numește și direcția cercetării științifice legate de construcția unor astfel de sisteme.
În loc de „mașină” se folosește uneori cuvântul automat, ceea ce nu afectează sensul. Cu toate acestea, nu confundați traducerea automată cu una automată, are un sens complet diferit - cu ea, programul pur și simplu ajută o persoană să traducă texte.
Ideea de a folosi calculatoare electronice (calculatoare) pentru traducere a fost exprimată în 1947 în Statele Unite, imediat după apariția primelor calculatoare. Prima demonstrație publică de traducere automată a avut loc în 1954. În ciuda caracterului primitiv al acelui sistem, acest experiment a primit un răspuns larg.
Până la mijlocul anilor 1960, două sisteme de traducere rusă-engleză au fost furnizate pentru utilizare practică în Statele Unite:
- MARCĂ
- GAT
Cu toate acestea, comisia ALPAC creată pentru evaluarea unor astfel de sisteme a ajuns la concluzia că, din cauza calității slabe a textelor traduse automat, această activitate este nerentabilă în SUA. Deși comisia a recomandat continuarea și aprofundarea dezvoltărilor teoretice, în general, concluziile sale au condus la o creștere a pesimismului, o scădere a finanțării și, adesea, la încetarea completă a lucrărilor pe această temă.
Cu toate acestea, cercetarea a continuat într-un număr de țări, ajutată de progresele constante ale tehnologiei de calcul. Un factor deosebit de semnificativ a fost apariția mini-calculatoarelor și computerelor personale și, odată cu acestea, dicționarul și sistemele de căutare din ce în ce mai complexe, concentrate pe lucrul cu date în limbaj natural. Nevoia de traducere ca atare a crescut și din cauza creșterii relațiilor internaționale. Toate acestea au dus la o nouă ascensiune în acest domeniu. A venit timpul pentru utilizarea practică pe scară largă a sistemelor de traducere și a apărut o piață pentru dezvoltări comerciale pe această temă.
Cu toate acestea, traducerea de înaltă calitate a textelor pe o gamă largă de subiecte este încă de neatins. Cu toate acestea, accelerarea muncii traducătorului atunci când se utilizează sisteme de traducere automată este fără îndoială.
1. Corpul principal
Sistemele de traducere automată se împart în trei categorii:
- -sisteme bazate pe reguli gramaticale(Traducerea automată bazată pe reguli, RBMT),
- -sisteme statistice(traducere automată statistică, SMT)
- -sisteme hibride combinând avantajele ambelor (sunt cele mai promițătoare)
Traducere automată bazată pe reguli- un termen general care se referă la sistemele de traducere automată bazate pe informații lingvistice despre limbile sursă și țintă. Ele constau din dicționare și gramatici bilingve, care acoperă principalele modele semantice, morfologice, sintactice ale fiecărei limbi. Această abordare a traducerii automate este, de asemenea, numită clasic. Pe baza acestor date, textul sursă este convertit secvenţial, pe propoziţii, în textul tradus. Principiul de funcționare a unor astfel de sisteme este legătura dintre structura propozițiilor de intrare și de ieșire. traducere automată pe computer
Sistemele RBMT sunt împărțite în trei grupuri:
- sisteme de traducere cuvânt cu cuvânt;
- Sisteme de transfer (Transfer) - transformă structurile limbajului de intrare în structuri gramaticale ale limbajului de ieșire;
- Sisteme interlingvistice (Interlingua) - un limbaj intermediar pentru descrierea sensului.
Principalul avantaj al sistemelor bazate pe transfer este completitatea ridicată a acoperirii textului cu un nivel acceptabil de calitate a traducerii, precum și costurile scăzute pentru dezvoltarea și modernizarea primară.
Componentele unui RBMT tipic:
- · Baze de date lingvistice: - dicționare bilingve; - fisiere de nume, transliterare; - tabele morfologice.
- · Modul de traducere: - reguli gramaticale; - algoritmi de traducere.
- · Avantajele sistemelor RBMT:
- - acuratețea sintactică și morfologică;
- - stabilitatea si predictibilitatea rezultatului;
- - capacitatea de a personaliza domeniul de subiect.
- · Dezavantajele sistemelor RBMT:
- - laboriozitatea și durata dezvoltării;
- - necesitatea menținerii și actualizării bazelor de date lingvistice;
- - „accent de mașină” la traducere.
Traducere automată statistică- un tip de traducere automată, în care traducerea este generată pe baza unor modele statistice, ai căror parametri sunt derivați din analiza corpurilor de text bilingve (corpuri de text).
Traducerea automată statistică este în contrast cu traducerea automată bazată pe reguli (RBMT) și sistemele MT bazate pe exemple (EBMT).
Primele idei pentru traducerea automată statistică au fost publicate de Warren Weaver în 1949. „Al doilea val” - începutul anilor 1990, IBM. „Al treilea val” - Google, Microsoft, Language Weaver, Yandex.
Modele de traducere statistică:
- în funcție de cuvinte (Traducere bazată pe cuvinte - WBT)
- după fraze (traducere bazată pe fraze - PBT)
- sintaxă (traducere bazată pe sintaxă - SBT)
- Traducere ierarhică bazată pe fraze - HPBT
Avantajele SMT:
- ·Instalare rapida
- · Adăugați cu ușurință noi direcții de traducere
- Netezimea traducerii
Dezavantajele SMT:
- „Deficiența” cazurilor paralele
- Numeroase erori gramaticale
- Instabilitatea traducerii
Pentru a îmbunătăți calitatea, dezvoltatorii de sisteme de traducere automată introduc câteva reguli „transversale”, transformând astfel sistemele pur statistice în Traducere automată hibridă. Adăugarea unor reguli, adică crearea de sisteme hibride, îmbunătățește oarecum calitatea traducerilor, mai ales atunci când cantitatea de date de intrare folosită pentru a construi indexul traductorului automat este insuficientă.
Traducere automată hibridă- integrarea diferitelor abordări de traducere automată din Opțiuni MP:
- · Traducere automată bazată pe reguli (RBMT) - Traducere automată bazată pe reguli.
- · Traducere automată bazată pe corpus (CBMT) - Traducere automată a corpurilor de text.
- · Traducere automată bazată pe exemple (EBMT)
- · Traducere automată statistică (SMT) - Traducere automată statistică.
Arhitectura hibridă este de așteptat să combine beneficiile acestor abordări.
Tehnologia de traducere hibridă presupune utilizarea metodelor statistice pentru construirea automată a bazelor de date de vocabular bazate pe corpuri paralele, formarea mai multor traduceri posibile, atât la nivel lexical, cât și la nivelul structurii sintactice a propoziției din limba țintă, utilizarea post- editarea în mod automatși alegerea celei mai bune (cel mai probabil) traduceri posibile pe baza unui model de limbă construit pe un corpus specific de limbă țintă.
Statistical MT caută să utilizeze date lingvistice, în timp ce sistemele cu o abordare „clasică” bazată pe reguli aplică metode statistice. Adăugarea unor reguli „end-to-end”, adică crearea de sisteme hibride, îmbunătățește oarecum calitatea traducerilor, mai ales cu date de intrare insuficiente utilizate pentru a construi fișiere index pentru stocarea informațiilor lingvistice ale unui traducător automat bazat pe N. -grame.
Arhitectură de tehnologie hibridă „SMT și RBMT”[
Sistemul RBMT este completat cu două componente: un modul de post-editare statistică și un modul de model de limbă. Post-editarea statistică vă permite să ușurați traducerea RB, aducând-o mai aproape de limbajul natural, menținând în același timp o structură clară a textului sintetizat. Modelele de limbaj sunt folosite pentru a evalua netezimea și corectitudinea gramaticală a traducerilor generate de sistemul hibrid.
Arhitectură tipică HMT:
- · Cazul paralel;
- · Educație;
- · Model lingvistic;
- · Date pentru post-editare;
- · Reguli de sinteză;
- · Glosar de terminologie.
Avantajele traducerii hibride:
- · Ajustare automată rapidă bazată pe Memoriile de traducere ale clientului;
- · Acuratețea terminologică a traducerii, precum și unitatea de stil;
- · Obținerea de date suplimentare utile – un dicționar terminologic bilingv.
Concluzie
Principalul avantaj al traducerii automate este că vă permite să vă ocupați rapid de volume foarte mari de text și, prin urmare, uneori se dovedește a fi mai rentabil decât traducerea manuală. În același timp, trebuie amintit că calitatea traducerii automate va fi întotdeauna inferioară traducerii umane. Prin urmare, este recomandabil să îl utilizați numai în anumite cazuri.
Multe tipuri de materiale nu sunt, în principiu, destinate traducerii automate. Astfel, textele nu pot fi de încredere aparatului, unde inexactitatea traducerii poate pune în pericol sănătatea umană, performanța unui dispozitiv complex sau un contract mare - timpul economisit aici nu justifică riscul. Orice documente care implică responsabilitate legală necesită control uman. Traducerea automată este nepotrivită pentru materialele de marketing, unde textul este de fapt regândit într-un nou context cultural și creat din nou.
O calitate acceptabilă poate fi de așteptat atunci când traduceți texte tehnice strict formalizate, în timp ce textele literare și publicitare nu sunt susceptibile de traducere automată.
Când recurgeți la traducerea automată, este important nu numai să aveți o idee clară a rezultatului dorit și să înțelegeți limitările acestei metode, ci și să luați în considerare încă un factor. Sistemele MT necesită, de obicei, reglare și rafinare individuală complexă, inclusiv „antrenament” pe o anumită temă - fără aceasta, ele arată rezultate mult mai proaste. În acest sens, are sens să folosești traducerea automată doar dacă trebuie să traduci volume uriașe de același tip de texte. În acest caz, va fi fezabil din punct de vedere economic să petreceți ceva timp pentru instruirea sistemului, apoi să aplicați traducerea automată și să obțineți textul potrivit pentru posteditare ca rezultat. Dacă vorbim de câteva zeci de pagini, încercarea de a implementa traducerea automată este inutilă și pur și simplu neprofitabilă.
Prin urmare, traducerea automată cu post-editare poate fi cu adevărat benefică dacă textele de tipul potrivit sunt traduse în volume foarte mari. Întrucât volume mari de traduceri trec prin companii de traduceri, care sunt adesea specializate în domenii specifice, introducerea unor sisteme de traducere automată de ultimă generație, destul de eficiente, dar costisitoare, este justificată din punct de vedere economic în astfel de companii: nici furnizorii de conținut, chiar și cei mari, nici individuali. traducătorii vor putea folosi eficient traducerea automată.
Cărți uzate
- 1. http://www.logrus.ru
- 2. http://www.moluch.ru/
- 3.https://www.academia.edu
- 4. http://study-english.info/
Cursul 13. Traducerea automată a textului. Dicționare de limbaj computerizat
Fundamentele traducerii automate
Traducere- Acesta este un tip de mediere lingvistică, care se concentrează pe un original în limbă străină. Traducerea este considerată ca o formă străină de existență a mesajului conținut în original. Comunicarea interlingvă realizată prin traducere, în majoritatea Mai mult reproduce procesul de direct comunicarea vorbirii, în care cei care comunică folosesc aceeași limbă.
Traducere automată este extragerea automată a cunoștințelor și a textelor scrise în limbaj natural folosind programe de calculator bazate pe suport lingvistic.
Proces de traducere automată sunt acțiunile unui computer de a converti text într-o limbă naturală într-un text echivalent în conținut într-o altă limbă, precum și rezultatul unei astfel de acțiuni.
Sistem automat de înțelegere a textului, provine din faptul că textul în limbaj natural, construit în conformitate cu dicționarele, gramatica și algoritmii limbajului natural, bazat pe rețeaua semantică, cadre și tezaure, este înțeles de utilizator datorită faptului că are cunoștințe lingvistice. - structuri sintactico-semantice, precum și cunoștințe de specialitate.
Majoritatea sistemelor de procesare automată a limbajului urmăresc să analizeze textele care sunt pre-împărțite în propoziții. Cu toate acestea, datele lingvistice ne sunt disponibile cel mai adesea sub formă de texte marcate în paragrafe, capitole și alte unități mai mari. Prin urmare, sunt necesari algoritmi de segmentare adecvați pentru analiza lor automată eficientă.
Sarcini în crearea unui sistem automat de înțelegere a textului:
analiza textului natural original, care prevede construirea unor structuri lingvistice, inclusiv diverse structuri semantice, complete, parțiale, comprimate, urmărind prezentarea conținutului textului sub formă de baze de date,
compararea structurilor lingvistice ale textului cu cunoștințe speciale sau individuale, prezentate și sub forma unei baze de date
· generalizarea textelor pe baza informațiilor conținute în baze de date relaționale tradiționale, precum și în structuri conceptuale de text sau în baze de date individuale.
Pentru traducere automată un program special este introdus în computerul care implementează algoritm de traducere, care este înțeles ca o secvență de acțiuni clar și strict definite asupra textului pentru a găsi corespondențe de traducere într-o anumită pereche de limbi pentru o anumită direcție de traducere (de la o anumită limbă la alta). Există, de asemenea, sisteme de traducere automată autonome concepute pentru a traduce în trei sau mai multe limbi, dar în prezent sunt experimentale.
Traducerea automată sau automată modernă se realizează cu ajutorul unei persoane: un pre-editor care preprocesează textul pentru a fi tradus într-un fel sau altul, un inter-editor care participă la procesul de traducere sau un post-editor. care corectează erorile și neajunsurile din textul tradus de mașină .
Sistemul de traducere automată include dicționare bilingve furnizate cu informațiile gramaticale necesare (morfologice, sintactice și semantice), care asigură transferul corespondențelor de traducere echivalente, variante și transformaționale, dicționare explicative și tematice speciale, precum și instrumente algoritmice de analiză gramaticală care implementează oricare dintre gramaticile formale adoptate pentru prelucrarea automată a textului.
Cel mai comun este următorul succesiune de operații formale, furnizarea de analiză și sinteză în sistemul de traducere automată:
introducerea textului și căutarea formelor de cuvinte introduse în dicționarul de introducere cu analiză morfologică însoțitoare, în timpul căreia se stabilește apartenența unei anumite forme de cuvânt la un anumit lexem. În procesul de analiză, informații legate de alte niveluri de organizare a sistemului lingvistic pot fi obținute și din forma cuvântului.
· traducerea de sintagme idiomatice, unități frazeologice sau ștampile dintr-o anumită disciplină, determinarea principalelor caracteristici gramaticale ale elementelor textului introdus, rezoluția omografiei, analiza lexicală și traducerea lexemelor. De obicei, în această etapă, cuvintele cu o singură valoare sunt separate de cele polisemantice, după care cuvintele cu o singură valoare sunt traduse conform listelor de echivalente, iar așa-numitele dicționare contextologice sunt folosite pentru a traduce cuvinte polisemantice, ale căror intrări de dicționar sunt algoritmi. pentru interogarea contextului pentru prezența/absența determinanților valorii contextuale.
· Analiza gramaticală finală, în cadrul căreia se redefinisc informațiile gramaticale necesare, ținând cont de datele limbii țintă.
· Sinteza formelor de cuvinte de ieșire și a propozițiilor în general în limba țintă.
Analiza și sinteza pot fi efectuate atât prin frază, cât și pentru întregul text introdus în memoria computerului; în acest din urmă caz, algoritmul de traducere prevede definirea așa-numitelor legături anaforice.
Calitatea traducerii automate depinde de:
Volumul dicționarelor
cantitatea de informații atribuită unităților lexicale,
minuțiozitatea compilării și testării muncii de analiză și algoritmi de sinteză,
eficienta software-ului.
Cu toate acestea, niciunul dintre programe nu se poate aștepta încă la o traducere literară „corectă” a unui text format din fraze complexe.
Hardware-ul și software-ul modern permit utilizarea unor dicționare mari care conțin informații gramaticale detaliate. Informațiile pot fi prezentate ca declarativ(descriptive) și procedural(ținând cont de nevoile algoritmului) form.
Îmbunătățirea programelor de traducere automată asociat cu conceptul de înțelegere a textului soft, conform căruia diferiți utilizatori își extrag informațiile și sensul lor individual din același text. Model de înțelegere a textului soft constă în capacitatea de a genera diverse interpretări semnificative ale obiectului original, în funcţie de conditii diferiteși componente ale percepției sale.
„Mașină înseamnă” mai privat pentru a ajuta traducătorul și editorul - acestea sunt dicționare automate și baze de date terminologice, tezaure de calculator, instrumente de editare a ecranului, sisteme de corectare ortografică, terminologică și gramaticală a textelor.
Traducerea automată modernă ar trebui să fie distinsă de utilizarea computerelor pentru a ajuta traducătorul uman. În acest din urmă caz, înseamnă dicţionar automat, care ajută o persoană să selecteze rapid echivalentul de traducere dorit. Deși în ambele cazuri computerul lucrează împreună cu o persoană (traducător sau editor), conținutul termenului „traducere automată” include ideea că mașina preia principala, cea mai mare parte a muncii de traducere și de găsire a echivalentelor de traducere și a corespondențelor de traducere pe ei înșiși, lăsând persoanei doar controlul și corectarea erorilor.
dicţionar de calculator pentru a ajuta o persoană - acesta este un instrument auxiliar pentru găsirea rapidă a potrivirilor traduse; În același timp, în astfel de dicționare, într-o măsură limitată, pot fi implementate și unele funcții inerente sistemelor de traducere automată.
Tehnologia informației este diferită 2 abordări principale ale traducerii automate:
familiarizarea superficială cu conținutul unui document într-o limbă necunoscută
Utilizarea traducerii automate în locul celei obișnuite „umane”. Aceasta implică editarea și personalizarea atentă a sistemului de traducere pentru un anumit domeniu.
Completitudinea dicționarului, concentrarea sa pe conținutul și setul de mijloace lingvistice ale textelor traduse, eficacitatea metodelor de rezolvare a polisemiei lexicale, eficacitatea algoritmilor de extragere a informațiilor gramaticale, găsirea corespondențelor de traducere și algoritmii de sinteză joacă un rol aici.
Ca tip de activitate lingvistică traducerea afectează toate nivelurile limbajului - de la recunoașterea grafemelor (și a fonemelor în traducerea vorbirii orale) până la transferul sensului enunțului și textului. În plus, traducerea automată oferă o oportunitate de a testa ipotezele teoretice despre structura anumitor nivele de limbaj și eficacitatea algoritmilor propuși.
Nevoie de îmbunătățire traducerea automată este în continuă creștere, fiind cea mai importantă condiție pentru asigurarea comunicării interlingve, al cărei volum crește în fiecare an.
Alte modalități de depășire a barierelor lingvistice în calea comunicării - dezvoltarea sau adoptarea unei limbi comune, precum și studiul limbilor străine - nu pot fi comparate cu traducerea din punct de vedere al eficienței.
data nașterii traducerea automată ca domeniu de cercetare este de obicei considerată martie 1947; atunci criptograful Warren Weaver, în scrisoarea sa către Norbert Wiener, a pus pentru prima dată problema traducerii automate, comparând-o cu problema decriptării.
se ocupă de problemele de traducere automată lingvistică computațională, care s-a născut în ianuarie 1954, când a avut loc primul experiment public din lume privind traducerea automată la Universitatea Georgetown (SUA). În același timp, sub conducerea celui mai mare matematician și cibernetic Alexei Lyapunov, la Moscova a început munca activă privind traducerea automată. La începutul anului 1956, primul sistem intern de traducere automată din franceză în rusă a început să funcționeze la Institutul de Matematică Aplicată (IPM) numit după M.V. Keldysh.
Liderii printre programele moderne de traducere automată din Rusia sunt sistemul PROMT (dezvoltat de PROMT, www.e-promt.ru) și sistemul SOCRAT (dezvoltat de Arsenal, www.ars.ru).
ÎN ultima versiune PROMT are o funcționalitate fundamental nouă, „Memorie asociată”. Mecanismul „Memoriei asociate” vă permite să antrenați sistemul. Cu ajutorul acestuia, poți salva traducerea textului care te mulțumește în baza de cunoștințe și ulterior să folosești fragmentele acestuia atunci când traduci texte similare.
SOCRATE încearcă să găsească o soluție fără ambiguitate și nu dă varianță în termeni: un cuvânt care nu este în dicționar rămâne în ortografia originală. PROMT oferă de obicei mai multe opțiuni pentru traducerea cuvintelor și expresiilor.
Traducerea automată, care a trecut prin mai multe etape de dezvoltare, se concentrează în prezent asupra ideea de a modela acțiunile unui traducător uman. Procesul de traducere este foarte dificil, iar utilizarea corectă a avantajelor software-ului determină în mare măsură calitatea traducerii. Sistemele moderne de traducere automată includ multe dicționare suplimentare. Pe baza caracteristicilor soluțiilor arhitecturale pentru algoritmi lingvistici, sistemele sunt împărțite în două tipuri - „Transfer” și „Interlingua”. Programele de traducere automată sunt construite în conformitate cu această diviziune. Deci, de exemplu, programul „Socrate” se traduce mult mai bine decât, să zicem, „Magic Goody” deoarece suportul lingvistic al primului program este mult mai puternic, iar dicționarele sunt mult mai mari ca volum.
Rezultatele traducerii automate trebuie întotdeauna editate. Deci, de exemplu, programul „Pars” prevede funcția de conectare suplimentară a dicționarelor de diferite subiecte. La urma urmei, calitatea traducerii produse de mașină depinde și de calitatea software-ului. Dar chiar și reglarea fină a sistemului la vocabularul textului tradus nu ține cont de toate caracteristicile acestuia, astfel încât cuvintele traduse care au mai multe sinonime sunt marcate cu un asterisc sau sunt date între paranteze ca opțiune.
tehnologii de internet a oferit o nouă dezvoltare traducerii automate, a contribuit la aducerea acesteia la o nouă etapă de dezvoltare. Traducerea automată este un instrument eficient pentru vizualizarea și căutarea informațiilor într-o limbă străină, iar aceasta este funcția principală atunci când lucrați pe Internet. Starea curenta traducerea automată vă permite să obțineți o traducere text relativ corectă a paginilor web din majoritatea limbilor. Deși traducerea complet automată de înaltă calitate nu este posibilă, este deja disponibil un software care facilitează procesul de traducere în sine.
Ca rezultat al personalizării la domeniul subiectului și al integrării cu alte programe de procesare a documentelor, traducerea automată vă permite să automatizați primirea textului tradus.
Problema principala dintre toate programele de traducere automată este alegerea potrivita dicționar tematic, precum și construirea de dicționare auxiliare.
Traducerea depinde parțial de nivelul de cunoștințe al utilizatorului (cunoașterea limbii, abilitățile de lucru cu programe, simțul limbajului), precum și, într-o măsură mai mare, capacitatea acestuia de a lucra corect cu un editor de text, utilități auxiliare , dicționare și cărți de referință frazeologică. Variante de traduceri realizate cu conexiunea dicționarelor tematice dau o traducere bună, alegerea corectă a sensului cuvântului și utilizarea expresiilor în text. Acest lucru se datorează faptului că aparatul își ajustează vocabularul pentru a selecta acele sinonime care ar fi mai relevante pentru subiectul limbii de intrare și s-ar traduce în conformitate cu subiectul limbii țintă.
2 abordări ale problemei dezvoltării traducerii automate:
setarea de a folosi limbajul universal al sensului, abordarea directă a traducerii, conversia textului original în textul țintă
stabilirea unei limbi intermediare, modelând competența limbajului uman
Problema este că sensul unui text în limbaj natural depinde nu numai de propoziție în sine, ci și de context, care este asociat cu ambiguitatea cuvintelor și construcțiilor sintactice, imposibilitatea practică a unei descrieri globale a structurii semantice a textului. lumea chiar și într-un domeniu limitat și lipsa unor metode formale eficiente.descrieri ale modelelor lingvistice.
Probleme nerezolvate traducerea automată este
rezolvarea ambiguității analizei sintactice formale a propozițiilor izolate ale textului
depășirea incompletității structurale și semantice a secțiunilor (fragmentelor) de text
organizarea conexiunii flexibile a diferitelor domenii
nevoia de a înțelege textul ca întreg educație
Programele de traducere automată sunt mai bune la procesarea textelor științifice, tehnice și educaționale, care se caracterizează printr-o prezentare strictă a materialului.
Stilul colocvial și jurnalistic, unde există multe turnuri specifice, dar majoritatea cuvintelor sunt folosite în sens literal, sunt potrivite pentru traducerea introductivă, totuși, editarea manuală este necesară pentru a obține un text de ieșire competent. Traducerea rezultată este un fel de text introductiv, unde se transmite doar orientarea tematică generală a textului.
Traducere fictiune iar poezia nu îndeplinește cerințele mașinii. Sensul unui text construit pe expresii alegorice este distorsionat în timpul traducerii automate și nici măcar nu este disponibil pentru revizuire. Mașina nu înțelege ambiguitatea, care, la rândul său, duce la interpretarea greșită a textului tradus, care se transformă în nonsens.
Puteți încerca să minimizați astfel de neînțelegeri observând urmând reguli:
Construiți corect dicționare tematice
verifica textul original în etapa de pre-pregătire a traducerii acestuia
editați în etapa finală a traducerii
utilizarea corectă a programelor de dicționar
bună cunoaștere a gramaticii și vocabularului, precum și a subiectului textului sursă
Utilizarea corectă a vocabularului, a clișeelor și a formelor de cuvinte
completați în timp util dicționarele speciale cu termeni noi
SUBIECTUL, OBIECTUL ȘI SARCINI ALE TEORIEI LINGVISTICE A TRADUCERII
În prezent, teoria lingvistică a traducerii s-a impus ferm ca o disciplină științifică independentă. Cu toate acestea, o serie de probleme fundamentale care determină statutul teoriei traducerii rămân încă nerezolvate. Una dintre aceste întrebări este problema subiectului și obiectului teoriei traducerii.
În literatura de specialitate au fost exprimate diferite puncte de vedere, adesea opuse, despre ceea ce ar trebui să fie considerat subiectul și obiectul teoriei traducerii. Astfel, I.I.Revzin și V.Yu.Rozentsveig susțin că obiectul traducerii este procesul de traducere în sine, în timpul căruia are loc trecerea de la un sistem de semne la altul și care poate fi descris în termeni semiotici 86 . Acești autori fac o distincție fundamentală între procesul de traducere și rezultatul traducerii. Ele pornesc de la faptul că în mod tradițional știința traducerii a fost construită ca o știință normativă, ale cărei obiective principale erau stabilirea rezultatului traducerii și elaborarea criteriilor de evaluare a calității traducerii. Teoria normativă a traducerii a fost construită empiric, pe baza unei analize comparative a originalelor și a traducerilor. Prevederile teoretice au fost împrumutate din lexicologie, gramatică, stilistică și critica literară. Cu o astfel de abordare, potrivit lui I.I.Revzin și V.Yu.Rozentsvey, nu se poate obține o înțelegere teoretică a procesului de traducere. Știința care caută să descrie
„Revzin I. I., Rozentsveig V. Yu. M.: Mai sus. scoala, 1964. P.21.
68 V.V. Sdobnikov, O.V. Petrova♦ TEORIA TRADUCERII
Traducerea ca proces nu ar trebui să fie normativă, ci teoretică. Adică ar trebui să descrie nu ceea ce ar trebui să fie, ci ceea ce este inerent naturii însăși a fenomenului 87 .
A.D. Schweitzer nu a fost de acord cu acest punct de vedere și consideră că o opoziție atât de puternică între abordările teoretice și cele normative este cu greu justificată. Excluderea din luarea în considerare a rezultatelor procesului de traducere restrânge în mod nejustificat subiectul teoriei traducerii și cu greu ajută la dezvăluirea esenței acesteia. Potrivit lui A.D. Schweitzer, traducerea este o activitate cu scop care îndeplinește anumite cerințe și standarde și este axată pe obținerea unui anumit rezultat. Aceste norme reflectă orientarea valorică a traducătorului, fără de care este imposibil de explicat satisfăcător logica deciziilor de traducere 88 . Astfel, A.D. Schweitzer include atât procesul de traducere în sine, cât și rezultatul procesului de traducere în subiectul teoriei traducerii.
Se pare că cercetătorii traducerii, încercând să desemneze subiectul teoriei traducerii, nu au ținut pe deplin în considerare faptul că traducerea este un fenomen complex, complex, care este influențat de mulți factori foarte diverși. Înțelegerea acestei împrejurări se realizează într-o măsură mai mare în lucrările lui VN Komissarov, care notează pe bună dreptate că nu este legitim să opunem rezultatului procesului de traducere. Este rezultatul traducerii care reprezintă acea realitate direct observabilă, pe baza analizei căreia se poate judeca indirect modul în care a decurs procesul de traducere, care este inaccesibilă observării directe.
„Revzin I. I., Rosenzweig V. Yu. Fundamentele traducerii generale și automate. M.: Mai sus. scoala, 1964. P.21.
„Schweitzer A.D. Teoria traducerii: statut, probleme, aspecte. M: Nauka, 1988. P.7.
PARTEA II. Teoria traducerii ca disciplină științifică 69
Teoria lingvistică a traducerii se ocupă atât de textele în limba sursă (SL) cât și în limba țintă (TL), precum și cu procesul de conversie a textului original în textul țintă. Dar această abordare nu este complet suficientă. Activitatea de traducere, prin definiție, este de natură intermediară. Traducerea oferă posibilitatea comunicării interlingve. Și aceasta înseamnă că, pentru a crea o traducere cu drepturi depline, traducătorul trebuie să țină cont de particularitățile autorului mesajului original și ale destinatarilor acestui mesaj, cunoștințele, experiența acestora, precum și particularitățile percepției persoanele cărora le este destinată traducerea etc. toate celelalte aspecte ale comunicării interlingve care afectează cursul și rezultatul procesului de traducere. Aceasta înseamnă că subiectul teoriei traducerii este complex și nu se limitează la procesul de traducere și la rezultatul acestuia. Teoria lingvistică a traducerii consideră traducerea în cadrul larg al comunicării interlingvistice și studiază toate aspectele și factorii determinanți ai acesteia, atât proprii lingvistic, cât și externi limbii, dar influențând direct sau indirect alegerea unităților lingvistice în procesul de traducere 89 .
Din această prezentare a problemei, se vede că nu există o unitate între cercetătorii traducerii în ceea ce privește terminologia utilizată. În primul rând, se atrage atenția asupra lipsei unei distincții clare între conceptele de subiect al cercetării științifice și obiectul cercetării științifice. Apropo, nici analiza definițiilor oferite de dicționarele limbii ruse nu aduce mai multă claritate acestei probleme. De exemplu, subiect Cercetarea științifică este definită ca „tema, ceea ce servește drept conținut al gândirii, vorbirii, la care cognitive sau creative.
89 Komissarov V.N. Teoria traducerii (Aspecte lingvistice). M.: Mai sus. şcoală., 1990. S.40-41.
70 V.V. Sdobnikov, O.V. Petrova♦ TEORIA TRADUCERII
Activități” 99 . Un obiect este definit ca „ceea ce se opune subiectului, spre care se îndreaptă activitatea sa practică şi cognitivă de fond” 100 . După cum putem observa, ambele concepte sunt definite ca ceva către care se îndreaptă activitatea practică, cognitivă și creativă a subiectului de cercetare. În același timp, ar fi oportun să se considere ca obiect de studiu ceva care aparține cu adevărat cercului fenomenelor materiale ale lumii și ca subiect de studiu - o anumită problemă, pentru a cărei rezolvare Cercetare științifică regizată efectiv. Bazat pe acest lucru, nog ca obiect al teoriei lingvistice a traducerii, vom înțelege activitatea de traducere intermediară în cadrul comunicării interlingve, prezentată atât direct (procesul), cât și indirect, adică reflectată în rezultatele procesului de traducere. Subiectul teoriei traducerii este studiul regularităților procesului de traducere, factori care influențează cursul procesului de traducere și determină rezultatul traducerii.
V.N.Komisarov 101 formulează următoarele sarcini Teoria lingvistică a traducerii:
1) să dezvăluie și să descrie sistemul de operare lingvistic general
traduceri noi, de ex. indicați ce trăsături ale limbii
sisteme kovy și modele de funcționare
Limbile se află în centrul procesului de traducere
sa, faceți posibil acest proces și determinați
caracterul și limitele sale;
2) defini traducerea ca obiect al lingvisticii
care studiază, indică diferența sa față de ceilalți
tipuri de mediere lingvistică;
3) elaborarea bazei pentru clasificarea tipurilor de ep
activități de traducere;
99 Dicționar al limbii ruse în 4 volume. Volumul III. M.: Rus yaz., 1983. P.366. „Dicționar al limbii ruse în 4 volume. Volumul 11. M: Rus. yaz., 1983. S.579. 101 K o m i s s a r o v V. N. Teoria traducerii (Aspecte lingvistice). M.: Superior şcoală., 1990. S.35-36.
PARTEA II. Teoria traducerii ca disciplină științifică 71
4) dezvăluie esența echivalenței traducerii ca bază pentru echivalența comunicativă a textelor originalului și traducerii;
5) să dezvolte principii și caracteristici generale
construirea unor teorii private și speciale ale traducerii
da pentru diverse combinatii limbi;
6) elaborarea principiilor generale ale descrierii științifice
a procesului de traducere ca acțiuni ale unui traducător
pentru a converti textul original în text retipărit
apă;
7) dezvăluie impactul asupra procesului de traducere
factori pragmatici și sociolingvistici;
8) definiți conceptul de „rata de traducere” și timp
lucrează principiile de evaluare a calității traducerii.
În conformitate cu aceste sarcini, se va construi cursul nostru de teorie generală a traducerii. Dar mai întâi, ar trebui să luăm în considerare problema compoziției provizorii a studiilor de traducere și teoria lingvistică a traducerii.
Studiile de traducere ca disciplină științifică sunt mai ample decât teoria traducerii și includ mai multe discipline sau secțiuni științifice. Studiile de traducere includ teoria traducerii, istoria activității de traducere, critica traducerii, lexicografia traducerii, didactica traducerii (metode de predare a traducerii). După cum putem observa, teoria lingvistică a traducerii este doar una dintre secțiunile studiilor traducerilor, dar, în același timp, are un caracter complex și cuprinde următoarele secțiuni:
Teoria generală a traducerii- o secțiune a teoriei lingvistice a traducerii care studiază cele mai generale modele lingvistice de traducere, indiferent de perechea specifică de limbi implicate în procesul de traducere, de modul în care se realizează acest proces și caracteristici individuale act specific de transfer.
Teoria specială a traducerii- o ramură a teoriei lingvistice a traducerii care studiază trăsăturile procesului de traducere a textelor tip diferitși influență
72 V.V. Sdobnikov, O.V. Petrova♦ TEORIA TRADUCERII
Nie pe acest proces de forme de vorbire și condiții pentru implementarea lui. Există mai multe teorii speciale ale traducerii: teoria traducerii literare, teoria traducerii științifice și tehnice, teoria traducerii orale, teoria traducerii automate etc.
Teoria privată a traducerii- o secțiune a teoriei lingvistice a traducerii care studiază aspectele lingvistice ale traducerii dintr-o limbă dată într-o altă limbă dată. Pot exista multe teorii private de traducere: teoria traducerii din engleză în rusă, teoria traducerii din germană în japoneză, teoria traducerii din limba francezaîn swahili etc.
RELAȚIA TEORIEI TRADUCERII CU ALTE DISCIPLINE LINGVISTICE
Teoria lingvistică a traducerii este strâns legată de discipline lingvistice precum lingvistica contrastivă, sociolingvistica, psiholingvistica, lingvistica textului.
Teoria traducerii și lingvistică contrastantă
Lingvistica contrastantă este o direcție de cercetare în lingvistica generală, al cărei scop este un studiu comparativ a două, mai rar mai multe limbi pentru a identifica asemănările și diferențele lor la toate nivelurile structurii limbii 102. După cum notează A.D. Schweitzer, problema relației dintre lingvistica contrastivă și teoria traducerii continuă să fie un subiect de controversă. În trecut, adesea nu exista o distincție clară
102 Dicţionar enciclopedic lingvistic. M: Bufnițe. enciclopedie, 1990. S.239.
. Teoria traducerii ca disciplină științifică 73
Redarea acestor discipline. JI Retsker scria încă din 1950 că „traducerea... este de neconceput fără o bază lingvistică solidă. O astfel de bază ar trebui să fie un studiu comparativ al fenomenelor lingvistice și stabilirea unor corespondențe între limba originală și limba țintă. Aceste corespondențe în domeniul vocabularului, frazeologiei, sintaxei și stilului ar trebui să formeze baza lingvistică a teoriei traducerii” 103 . Astfel, compararea limbilor și a fenomenelor lingvistice a fost de fapt identificată cu teoria lingvistică a traducerii.
Uneori, teoria traducerii este identificată nu cu lingvistica contrastantă în general, ci cu una dintre secțiunile sale, și anume, cu stilistica comparativă. Această tradiție a fost fondată prin lucrarea lui J.-P. Vine și J. Darbelnet „Stil comparat de franceză și Engleză”(1958), în care autorii pun de fapt un semn egal între conceptele de stilistică comparată și teoria traducerii. I.I.Revzin și V.Yu.Rozentsveig au acordat mai târziu atenție acestei trăsături a studiilor de traducere lingvistică: „Recunoscând valoarea lucrărilor acestei direcții pentru teoria traducerii, ... în același timp, nu se poate să nu sesizeze confuzia. în ele a conceptelor de stilistică şi teoria traducerii” 104 . Și totuși, chiar și un deceniu mai târziu, unii cercetători au susținut că „teoria lingvistică a traducerii nu este altceva decât „lingvistica comparată a textului”, adică un studiu comparativ al textelor multilingve identice din punct de vedere semantic” 105 .
Însăși descrierea metodei indică legătura strânsă dintre lingvistica contrastivă și teoria traducerii.
103 Shveytser A.D. M:
Nauka, 1988. S.Yu.
104 R e v z i n I. I., R o z ents v e g V. Yu. Fundamentele generale și ale mașinii
traducere. M.\ Superior scoala, 1964. P.32.
105 B a r k h u d a r o v L. S. Limbă și traducere (probleme generale și private
teoria traducerii). M.: Internaţional relaţii, 1975. P.28.
74 V.V. Sdobnikov, O.V. Petrova♦ TEORIA TRADUCERII
Studiul comparativ al limbilor. Principiile descrierii comparative sunt formulate de A.V. Fedorov astfel: „Ceea ce este specific unei anumite limbi nu este sensul exprimat care îi este comun cu o altă limbă, ci categoriile formale în care este exprimată, trăsăturile structurale. Dintr-o categorie formală, ca de la un obiectiv dat (de exemplu, dintr-un anumit tip de cuvinte, modele de formare a cuvintelor, din ordinea cuvintelor, din propoziții în două părți cu un anumit tip de subiect etc.), cercetătorul merge la determinați-i semnificațiile într-o limbă și apoi la cele care exprimă aceste semnificații la mijloacele formale ale altei limbi (coincidente sau alte tipuri de cuvinte, la aceeași ordine de cuvinte sau la diferită, propoziții din două părți sau dintr-o singură parte etc.). Fireşte, cu un asemenea mod de analiză, materialul traducerilor este foarte recunoscător...” 106 . Din această definiție a metodei de cercetare, rezultă că lingviștii, în interesul unui studiu comparativ al limbilor, au folosit metoda de a compara lucrări specifice de vorbire în diferite limbi, care sunt de fapt originale și traduceri. Acest lucru este pe deplin în concordanță cu afirmația lui E.Koseriu că lingvistica contrastivă la nivelul normei de limbă, care explorează utilizarea efectivă a unităților funcționale, acoperă exact zona în care se desfășoară procesul de traducere și coincide cu aceasta. De teoria traducerii, potrivit lui E.Koseriu, zona lingvisticii contrastive, care se concentrează pe limbajul în acțiune, este cea mai apropiată dintre toate. La fel ca teoria traducerii, această zonă se ocupă cu realizări de vorbire ale structurii limbajului, cu zona funcționării limbajului în vorbire și, ca și teoria privată a traducerii, este unidirecțională (de exemplu, problema găsirea
106 Op. de: RevzinI. I., Rosenzweig, V. YU. Fundamentele traducerii generale și automate. M.: Mai sus. şcoală., 1964. P.33
PARTEA //. Teorie traducerea ca disciplină științifică 75
Corespondența cu gerunziul este relevantă numai pentru traducerea din rusă și pentru lingvistica contrastivă, a cărei limbă originală este rusă) 107 .
Datele lingvisticii contrastive sunt, fără îndoială, utile pentru teoria lingvistică a traducerii. Explorând relația dintre unitățile funcționale ale limbii A și ale limbii B, lingvistica contrastivă creează fundamentul necesar pentru construirea unei teorii a traducerii. Într-adevăr, multe transformări ale traducerii care alcătuiesc „tehnologia” traducerii se întorc în cele din urmă la diferențele funcționale și structurale dintre limbi care „se ciocnesc” unele cu altele în procesul de traducere. Lingvistica contrastantă într-o serie de cazuri răspunde la întrebarea de ce se realizează una sau alta operație în traducere 107 . Unul dintre motivele pentru utilizarea transformărilor de traducere este prezența într-una dintre limbile care interacționează a așa-numitelor „forme neechivalente”, a căror identificare este facilitată de datele lingvisticii contrastive.
Putem spune că teoria traducerii are nevoie de lingvistică contrastivă ca sursă de date inițiale. Aceste date, care pun în lumină discrepanțele dintre tipurile structurale, sistemele și normele de limbi, servesc drept punct de plecare pentru o analiză adecvată a traducerii 108 .
În ciuda relației strânse dintre lingvistica contrastivă și teoria traducerii, acestea nu pot fi echivalate între ele. Sarcina lingvisticii contrastive este compararea limbilor, identificarea asemănărilor și diferențelor lor. Teoria traducerii, la rândul său, explorează traducerea ca un tip specific de comunicare interlingvistică, mediere lingvistică. Scopul ei este de a dezvălui esența, traducerea, ei
107 Shveytser A.D. Teoria traducerii: statut, probleme, aspecte M:
Nauka, 1988. SP.
108 Ibid. C.12.
76 V.V. Sdobnikov, O.V. Petrova♦ TEORIA TRADUCERII
Mecanisme, metode de implementare, factori lingvistici și extralingvistici care îl afectează. Teoria traducerii, pe lângă textele sursă și destinație, ia în considerare diferențele socioculturale și psihologice dintre comunicanții multilingvi, precum și o serie de alți factori socioculturali și psiholingvistici determinanți ai procesului de traducere. În același timp, se ține cont de faptul că traducerea nu este o simplă modificare a codului limbii, ci și adaptarea unui text pentru perceperea lui prin prisma altei culturi.
Cum funcționează programul de traducere?
Se bazează pe algoritmul de traducere - o secvență de acțiuni unic și strict definite asupra textului pentru a găsi potriviri într-o pereche dată de limbi L1 - L2 pentru o anumită direcție de traducere (de la o anumită limbă la alta). Dicționare și gramatici obișnuite limbi diferite nu sunt aplicabile traducerii automate, deoarece ele descriu semnificațiile cuvintelor și modelelor gramaticale într-o formă nestrictă, ceea ce nu este în niciun caz acceptabil pentru utilizarea „mașină”. Prin urmare, este necesară o gramatică formală a limbii, de exemplu. consecventă din punct de vedere logic și exprimată clar (fără omisiuni și implicite). De îndată ce au început să apară descrieri formale ale diferitelor zone ale limbii - în primul rând morfologia și sintaxa - s-au înregistrat progrese în dezvoltarea sistemelor de traducere automată. Pentru a funcționa cu succes, sistemul de traducere automată include, în primul rând, dicționare bilingve furnizate cu informațiile necesare (morfologice, legate de formele cuvântului, sintactic, care descriu modalitățile de combinare a cuvintelor într-o propoziție, și semantice, adică responsabile pentru sensul), și în al doilea rând, mijloacele de analiză gramaticală, care se bazează pe unul dintre cele formale, i.e. strict, gramatica. Cea mai comună este următoarea secvență de operații formale care oferă analiză și sinteză într-un sistem de traducere automată.
- 1. În prima etapă, textul este introdus și formele de cuvânt introduse (cuvinte într-o formă gramaticală specifică, de exemplu, dativul plural) sunt căutate în intrare cu o analiză morfologică însoțitoare, timp în care apartenența acestei forme de cuvânt la se stabilește un anumit lexem (un cuvânt ca unitate de dicționar). În procesul de analiză, informațiile legate de alte niveluri de organizare ale sistemului lingvistic pot fi obținute și din forma unui cuvânt, de exemplu, care membru al unei propoziții poate fi un anumit cuvânt. Pentru o mașină, combinarea acestor două operații - atât analiza gramaticală, cât și apelul la sensul cuvintelor - este o sarcină dificilă. Este mai bine să faceți analiza sintactică independentă de sensul cuvintelor și să utilizați dicționarul în alte etape ale traducerii.
- 2. Ce este o analiză sintactică independentă, puteți înțelege dacă încercați să analizați fraza, din care sensurile anumitor cuvinte sunt „eliminate”. Un exemplu strălucit de frază de acest fel este inventat de academicianul L.V. O sugestie perspicace: Kuzdra strălucitoare a întins bokra și o îndoiește. Fraza fără sens? Ca și cum da: în rusă nu există cuvinte din care constă (cu excepția unirii și). Și totuși, într-o oarecare măsură, o înțelegem.
- 3. Adică, mașina realizează analiza sintactică a propoziției fără a se baza pe semnificațiile cuvintelor sale constitutive, folosind doar informații despre proprietățile gramaticale ale acestora. Ca rezultat al analizei sintactice, apare o structură sintactică, care este descrisă ca un arbore de dependență: „rădăcina” este predicatul, iar „ramurile” sunt relațiile sale sintactice cu cuvintele dependente. Fiecare cuvânt al propoziției este scris în forma sa de dicționar, iar odată cu acesta sunt indicate și caracteristicile gramaticale pe care acest cuvânt le are în propoziția analizată.
- 4. 2. Următoarea etapă include traducerea expresiilor idiomatice, a unităților frazeologice sau a ștampilelor dintr-un anumit domeniu (de exemplu, în traducerea engleză-rusă, expresiile precum în cazul, în conformitate cu primesc un singur echivalent digital și sunt excluse din analiza gramaticală ulterioară); determinarea principalelor caracteristici gramaticale (morfologice, sintactice, semantice și lexicale) ale elementelor textului de intrare (de exemplu, numărul substantivelor, timpul verbal, rolul acestora în această propoziție etc.), produse în cadrul limbajului de intrare; dezambiguizare (să zicem, English round poate fi un substantiv, adjectiv, adverb, verb sau prepoziție); analiza și traducerea cuvintelor. De obicei, în această etapă, cuvintele cu o singură valoare sunt separate de cele polisemantice (având mai mult de un echivalent de traducere în limba țintă), după care cuvintele cu o singură valoare sunt traduse conform listelor de echivalente și sunt folosite așa-numitele dicționare contextuale. pentru a traduce cuvinte polisemantice ale căror intrări de dicționar sunt algoritmi de interogare a contextului în prezența/absența determinanților valorii contextului.
- 5. 3. Analiza gramaticală finală, în cadrul căreia se determină suplimentar informațiile gramaticale necesare, ținând cont de datele limbajului de ieșire.
- 6. 4. Sinteza formelor de cuvinte de ieșire și a propozițiilor în general în limba țintă. Aici nu se va putea face cu o simplă traducere a „nodurilor” arborelui într-o altă limbă. Sintaxa fiecărei limbi este aranjată în felul său: ceea ce este subiectul într-o propoziție rusă poate (sau ar trebui) să fie exprimat de un obiect într-o altă limbă, iar obiectul, dimpotrivă, trebuie transformat în subiect; ceea ce într-o limbă este notat printr-un grup de cuvinte este tradus într-o altă limbă cu un singur cuvânt și așa mai departe. Această trecere de la structură la propoziție reală se numește sinteză sintactică.
- 7. În funcție de caracteristicile morfologiei, sintaxei și semanticii unei anumite perechi de limbi, precum și de direcția traducerii, algoritmul general de traducere poate include și alte etape, precum și modificări ale acestor etape sau ordinea lor, dar variații ale acest gen în sistemele moderne sunt de obicei nesemnificative . Analiza contextului este folosită pentru a rezolva problema ambiguității cuvintelor. Faptul este că fiecare dintre cele mai multe semnificații ale unui cuvânt polisemantic în cele mai multe cazuri este realizat în propriul set de contexte. Adică, fiecare dintre semnificațiile „concurente” (sub interpretare) are propriul său set de contexte. Și tocmai această dependență a sensului de mediu este cea care permite ascultătorului să înțeleagă corect afirmația. Pentru o înțelegere corectă a enunțului, este necesar să se țină seama pe deplin de regulile de condiționalitate a sensului ales de mediul lexical (care operează în interpretarea „frazeologică” a cuvântului), regulile de condiționalitate a sensul ales de contextul semantic (așa-numitele legi ale acordului semantic) și regulile de condiționalitate a sensului ales de contextul gramatical (morfologic-sintactic).
- 8. Sistemele existente de traducere automată tind să vizeze anumite perechi de limbi (de exemplu, franceză și rusă sau japoneză și engleză) și tind să utilizeze potriviri de traducere fie la un nivel superficial, fie la un nivel intermediar între limbile de intrare și de ieșire. Calitatea traducerii automate depinde de volumul dicționarului, de cantitatea de informații atribuită unităților lexicale, de minuțiozitatea compilării și verificării funcționării algoritmilor de analiză și sinteză și de eficacitatea software-ului. Hardware-ul și software-ul modern permit utilizarea unor dicționare mari care conțin informații gramaticale detaliate. Informațiile pot fi prezentate atât în formă declarativă (descriptivă), cât și procedurală (ținând cont de nevoile algoritmului).
- 9. În practica traducerii și în tehnologia informației, există două abordări principale ale traducerii automate. Pe de o parte, rezultatele traducerii automate pot fi folosite pentru familiarizarea superficială cu conținutul unui document într-o limbă necunoscută. În acest caz, poate fi folosit ca informații de semnal și nu necesită o editare atentă. O altă abordare implică utilizarea traducerii automate în locul „umanului” obișnuit. Aceasta implică editarea și personalizarea atentă a sistemului de traducere pentru un anumit domeniu. Completitudinea dicționarului, concentrarea sa pe conținutul și setul de mijloace lingvistice ale textelor traduse, eficacitatea metodelor de rezolvare a polisemiei lexicale, eficacitatea algoritmilor de extragere a informațiilor gramaticale, găsirea corespondențelor de traducere și algoritmii de sinteză joacă un rol aici. În practică, traducerea de acest tip devine rentabilă dacă volumul de texte traduse este suficient de mare (cel puțin câteva zeci de mii de pagini pe an), dacă textele sunt suficient de omogene, dicționarele de sistem sunt complete și permit extinderea în continuare. , iar software-ul este convenabil pentru post-editare.