Approches de la traduction automatique
Les systèmes de traduction automatique peuvent utiliser une méthode de traduction basée sur des règles linguistiques. La plupart les bons mots de la langue source sont simplement remplacés par des mots de la langue cible.
On prétend souvent que pour résoudre avec succès le problème de la traduction automatique, il est nécessaire de résoudre le problème de la compréhension du texte en langage naturel.
En règle générale, la méthode de traduction basée sur des règles utilise une représentation symbolique (intermédiaire), sur la base de laquelle le texte dans la langue cible est créé. Et si l'on tient compte de la nature de l'intermédiaire, alors on peut parler de traduction automatique interlinguistique ou de traduction automatique de transfert. Ces méthodes nécessitent de très grands dictionnaires contenant des informations morphologiques, syntaxiques et sémantiques et un ensemble important de règles.
Si le système de traduction automatique dispose de suffisamment de données, une traduction de bonne qualité peut être obtenue. La principale difficulté réside dans la constitution de ces données. Par exemple, les grands corpus de texte requis pour les méthodes statistiques de traduction ne suffisent pas pour la traduction basée sur la grammaire. De plus, pour ces derniers, un travail supplémentaire de grammaire est requis.
Pour la traduction de langues apparentées (russe, ukrainien), un simple remplacement de mots peut suffire.
Les systèmes de traduction automatique modernes sont divisés en trois grands groupes :
basé sur des règles
basé sur des exemples
Basé sur des règles SMP
Les systèmes de traduction automatique basés sur des règles sont un terme général qui fait référence aux systèmes de traduction automatique basés sur des informations linguistiques sur les langues source et cible.
Ils se composent de dictionnaires et de grammaires bilingues, couvrant les principaux schémas sémantiques, morphologiques et syntaxiques de chaque langue. Cette approche de la traduction automatique est également appelée classique.
Sur la base de ces données, le texte source est séquentiellement, par phrases, converti en texte traduit. Souvent, ces systèmes sont mis en contraste avec les systèmes de traduction automatique basés sur des exemples.
Le principe de fonctionnement de tels systèmes est la connexion entre la structure des phrases d'entrée et de sortie. La traduction n'est pas de très bonne qualité. Mais sur exemples simples travaux.
La traduction de l'anglais vers l'allemand ressemblera à ceci :
Une fille mange une pomme. Ein Madchen isst einen Apfel.
Ces systèmes se répartissent en trois groupes :
systèmes de traduction mot à mot;
· systèmes de transfert ;
interlinguistique;
Traduction de mots
De tels systèmes sont maintenant extrêmement rarement utilisés en raison de la mauvaise qualité de la traduction. Les mots du texte source sont convertis (tels quels) en mots du texte traduit. Souvent, une telle transformation se produit sans lemmatisation ni analyse morphologique. C'est la méthode de traduction automatique la plus simple. Il est utilisé pour traduire de longues listes de mots (par exemple des répertoires). Il peut également être utilisé pour composer des interlinéaires pour les systèmes TM.
Systèmes de transfert
Comme les systèmes de transfert, et interlinguistique, ont la même idée générale. Pour la traduction, il est nécessaire d'avoir un intermédiaire qui porte le sens de l'expression traduite. Dans les systèmes interlinguistiques, le médiateur ne dépend pas d'une paire de langues, alors que dans les systèmes de transfert, il le fait.
Les systèmes de transfert fonctionnent sur un principe très simple : des règles sont appliquées au texte d'entrée qui correspondent aux structures des langues source et cible. La première étape du travail comprend l'analyse morphologique, syntaxique (et parfois sémantique) du texte pour créer une représentation interne. La traduction est générée à partir de cette représentation à l'aide de dictionnaires bilingues et de règles de grammaire. Parfois, sur la base de la représentation primaire, qui a été obtenue à partir du texte source, une représentation interne plus "abstraite" est construite. Ceci est fait afin de mettre l'accent sur les endroits importants pour la traduction et d'éliminer les parties non essentielles du texte. Lors de la construction du texte de traduction, la transformation des niveaux de représentations internes se produit dans l'ordre inverse.
Lorsque vous utilisez cette stratégie, il suffit haute qualité traductions, avec une précision de l'ordre de 90% (bien que cela dépende fortement de la paire de langues). Le fonctionnement de tout système de transfert comprend au moins cinq parties :
analyse morphologique;
transfert lexical;
transfert structurel;
génération morphologique.
Analyse morphologique. Les mots du texte source sont classés par parties du discours. Leurs caractéristiques morphologiques sont révélées. Les lemmes de mots sont définis.
Catégorisations lexicales. Dans tout texte, certains mots peuvent avoir plus d'un sens, provoquant une ambiguïté dans l'analyse. La catégorisation lexicale révèle le contexte d'un mot. Diverses notes et précisions sont possibles.
Transfert lexical. Sur la base d'un dictionnaire bilingue, les lemmes des mots sont traduits. L'action est très similaire à la traduction mot à mot.
transfert structurel. Les mots s'accordent dans la phrase.
Génération morphologique. Sur la base des données de sortie du transfert structurel, des formes de mots du texte traduit sont créées.
L'une des principales caractéristiques des systèmes de traduction automatique transcendants est l'étape au cours de laquelle la représentation intermédiaire du texte dans la langue source est "transférée" à la représentation intermédiaire du texte dans la langue cible. Cela peut fonctionner sur l'un des deux niveaux d'analyse linguistique, ou sur les deux.
1. Transfert de surface (syntaxique). Ce niveau se caractérise par le transfert de "structures syntaxiques" entre les langues source et cible. Convient aux langues de la même famille ou du même type, comme dans les langues romanes, entre l'espagnol italien, le catalan, le français, etc.
2. Transfert profond (sémantique). Le niveau est caractérisé par une représentation sémantique. Cela dépend de la langue d'origine. Cette représentation peut consister en un certain nombre de structures qui représentent une valeur. La traduction nécessite également généralement un transfert structurel. Ce niveau est utilisé pour la traduction entre des langues plus éloignées.
Traduction automatique interlinguistique
La traduction automatique interlinguistique est l'une des approches classiques de la traduction automatique. original le texte est transformé en une représentation abstraite indépendante de la langue (contrairement à la traduction par transfert). Le texte traduit est généré sur la base de cette représentation. Le principal avantage de cette approche est d'ajouter une nouvelle langue au système. On peut prouver mathématiquement que dans le cadre de cette approche, la création de chaque nouvel interprète de langue pour un tel système réduira son coût, par rapport, par exemple, à un système de traduction par transfert. De plus, cette approche peut
· mettre en œuvre la "réécriture du texte", paraphraser le texte source dans une langue ;
· relativement mise en œuvre simple traduction de langues très différentes, comme par exemple le russe et l'arabe.
Cependant, il n'existe toujours pas d'implémentations de cette approche qui fonctionneraient correctement pour au moins deux langues. De nombreux experts expriment des doutes sur la possibilité d'une telle mise en œuvre. La plus grande difficulté dans la création de tels systèmes réside dans la conception de la représentation inter-langues. Il doit être à la fois abstrait et indépendant des langues spécifiques, mais en même temps, il doit refléter les caractéristiques de toute langue existante. D'autre part, dans le cadre intelligence artificielle, la tâche de mettre en évidence le sens du texte pour le moment n'a pas encore été résolue.
L'approche interlinguistique a été proposée pour la première fois au XVIIe siècle par Descartes et Leibniz, qui ont proposé des dictionnaires universels utilisant des codes numériques. D'autres comme Cave Beck, Athanasius Kircher et Johann Joachim Becher ont travaillé à développer un langage universel sans ambiguïté basé sur les principes de la logique et de l'iconographie.
En 1668, John Wilkins, dans son traité An Essay on Genuine Symbolism and Philosophical Language, parle de son Interlingua.
Aux XVIIIe et XIXe siècles, de nombreuses langues universelles se sont développées, dont l'espéranto. On sait que l'idée d'un langage universel pour la traduction automatique ne s'est en aucun cas manifestée aux premiers stades du développement de cette technologie. Au lieu de cela, seules les paires de langues ont été prises en compte. Cependant, au cours des années 1950 et 1960, des chercheurs de Cambridge dirigés par Margaret Masterman, de Leningrad dirigé par Nikolai Andreev et de Milan Silvio Ceccato ont commencé à travailler dans ce domaine.
Dans les années 1970 et 1980, des progrès ont été réalisés dans ce domaine et un certain nombre de systèmes de traduction automatique ont été construits.
Dans cette méthode de traduction, la représentation interlinguistique peut être considérée comme une manière de décrire l'analyse d'un texte, dans la langue d'origine. Dans le même temps, les caractéristiques morphologiques et syntaxiques du texte sont préservées dans la représentation. On suppose qu'il est ainsi possible de transmettre le "sens" lors de la création d'un texte traduit.
Dans ce cas, deux représentations interlinguistiques sont parfois utilisées. L'un d'eux reflète davantage les caractéristiques de la langue source. L'autre est la langue cible. La traduction dans ce cas s'effectue en deux étapes.
Dans certains cas, deux ou plusieurs représentations du même niveau sont utilisées (également proches des deux langues), mais différant par le sujet. Cela est nécessaire pour améliorer la qualité de la traduction de textes spécifiques.
Cette approche n'est pas nouvelle en linguistique. Elle repose sur l'idée de la proximité des langues. Pour améliorer la qualité de la traduction, le langage naturel est utilisé comme pont entre deux autres langues. Par exemple, lors de la traduction de l'ukrainien vers l'anglais, le russe est parfois utilisé.
Pour utiliser le système de traduction automatique interlinguistique, vous avez besoin :
Dictionnaires pour l'analyse et la génération de textes;
description des grammaires des langues;
base de connaissance des concepts (pour créer une représentation interlinguistique) ;
· Règles de projection conceptuelle pour les langages et les représentations.
Le moment le plus difficile lors de la création de ce type est l'incapacité de construire une base pour vastes domaines connaissance. Et ces bases de données qui sont créées pour un sujet très spécifique ont une grande complexité de calcul.
Introduction
Traduction automatique- le processus de traduction de textes (écrits et idéalement oraux) d'une langue naturelle à une autre à l'aide d'un programme informatique spécial. La direction de la recherche scientifique liée à la construction de tels systèmes est également appelée.
Au lieu de "machine", le mot automatique est parfois utilisé, ce qui n'affecte pas le sens. Cependant, ne confondez pas la traduction automatique avec la traduction automatisée, elle a une signification complètement différente - avec elle, le programme aide simplement une personne à traduire des textes.
L'idée d'utiliser des ordinateurs électroniques (ordinateurs) pour la traduction a été exprimée en 1947 aux États-Unis, immédiatement après l'apparition des premiers ordinateurs. La première démonstration publique de traduction automatique a eu lieu en 1954. Malgré le caractère primitif de ce système, cette expérience a reçu une large réponse.
Au milieu des années 1960, deux systèmes de traduction russe-anglais ont été fournis pour une utilisation pratique aux États-Unis :
- MARQUER
- FLINGUE
Cependant, la commission ALPAC créée pour évaluer de tels systèmes est arrivée à la conclusion qu'en raison de la mauvaise qualité des textes traduits par machine, cette activité n'est pas rentable aux États-Unis. Bien que la commission ait recommandé de poursuivre et d'approfondir les développements théoriques, en général, ses conclusions ont conduit à une augmentation du pessimisme, à une diminution des financements et souvent à un arrêt complet des travaux sur ce sujet.
Néanmoins, la recherche s'est poursuivie dans un certain nombre de pays, aidée par les progrès constants de la technologie informatique. Un facteur particulièrement important a été l'émergence des mini-ordinateurs et des ordinateurs personnels, et avec eux des dictionnaires et des systèmes de recherche de plus en plus complexes axés sur le travail avec des données en langage naturel. Le besoin de traduction en tant que tel a également augmenté en raison de la croissance des relations internationales. Tout cela a conduit à un nouvel essor dans ce domaine. Le temps est venu de généraliser l'utilisation pratique des systèmes de traduction, et un marché pour les développements commerciaux sur ce sujet a émergé.
Cependant, la traduction de haute qualité de textes sur un large éventail de sujets est toujours inaccessible. Cependant, l'accélération du travail du traducteur lors de l'utilisation de systèmes de traduction automatique est incontestable.
1. Corps principal
Les systèmes de traduction automatique se répartissent en trois catégories :
- -systèmes basés sur des règles de grammaire(Traduction automatique basée sur des règles, RBMT),
- -systèmes statistiques(Traduction automatique statistique, SMT)
- -systèmes hybrides combinant les avantages des deux (sont les plus prometteurs)
Traduction automatique basée sur des règles- un terme général qui fait référence aux systèmes de traduction automatique basés sur des informations linguistiques sur les langues source et cible. Ils se composent de dictionnaires et de grammaires bilingues, couvrant les principaux schémas sémantiques, morphologiques et syntaxiques de chaque langue. Cette approche de la traduction automatique est également appelée classique. Sur la base de ces données, le texte source est séquentiellement, par phrases, converti en texte traduit. Le principe de fonctionnement de tels systèmes est la connexion entre la structure des phrases d'entrée et de sortie. traduction automatique informatique
Les systèmes RBMT sont divisés en trois groupes:
- systèmes de traduction mot à mot;
- Systèmes de transfert (Transfert) - transforment les structures de la langue d'entrée en structures grammaticales de la langue de sortie ;
- Systèmes interlinguistiques (Interlingua) - une langue intermédiaire pour décrire le sens.
Le principal avantage des systèmes basés sur le transfert est la grande exhaustivité de la couverture du texte avec un niveau acceptable de qualité de traduction, ainsi que de faibles coûts de développement primaire et de modernisation.
Composants d'un RBMT typique :
- · Bases de données linguistiques : - dictionnaires bilingues ; - fichiers de noms, translittération ; - tableaux morphologiques.
- · Module de traduction : - règles de grammaire ; - algorithmes de traduction.
- · Avantages des systèmes RBMT:
- - précision syntaxique et morphologique ;
- - stabilité et prévisibilité du résultat ;
- - la possibilité de personnaliser le domaine.
- · Inconvénients des systèmes RBMT:
- - pénibilité et durée de développement;
- - la nécessité de maintenir et de mettre à jour des bases de données linguistiques ;
- - "accent machine" lors de la traduction.
Traduction automatique statistique- un type de traduction automatique, où la traduction est générée sur la base de modèles statistiques dont les paramètres sont dérivés de l'analyse de corpus de textes bilingues (corpus de textes).
La traduction automatique statistique s'oppose aux systèmes de traduction automatique basée sur des règles (RBMT) et de traduction automatique basée sur des exemples (EBMT).
Les premières idées de traduction automatique statistique ont été publiées par Warren Weaver en 1949. "Deuxième vague" - début des années 1990, IBM. "Troisième vague" - Google, Microsoft, Language Weaver, Yandex.
Modèles statistiques de traduction :
- selon les mots (Word based translation - WBT)
- par phrases (traduction basée sur des phrases - PBT)
- syntaxe (traduction basée sur la syntaxe - SBT)
- Traduction hiérarchique basée sur des phrases - HPBT
Avantages du SMT :
- ·Installation rapide
- · Ajoutez facilement de nouvelles directions de traduction
- Fluidité de la traduction
Inconvénients du SMT :
- "Déficit" de cas parallèles
- De nombreuses fautes de grammaire
- Instabilité de traduction
Pour améliorer la qualité, les développeurs de systèmes de traduction automatique introduisent des règles "transversales", transformant ainsi les systèmes purement statistiques en Traduction automatique hybride. L'ajout de certaines règles, c'est-à-dire la création de systèmes hybrides, améliore quelque peu la qualité des traductions, surtout lorsque la quantité de données d'entrée utilisées pour construire l'index du traducteur automatique est insuffisante.
Traduction automatique hybride- intégration de différentes approches de traduction automatique de choix député :
- · Traduction automatique basée sur des règles (RBMT) - Traduction automatique basée sur des règles.
- · Traduction automatique basée sur des corpus (CBMT) - Traduction automatique de corpus de texte.
- · Traduction automatique basée sur des exemples (EBMT)
- · Traduction automatique statistique (SMT) - Traduction automatique statistique.
L'architecture hybride devrait combiner les avantages de ces approches.
La technologie de traduction hybride implique l'utilisation de méthodes statistiques pour construire automatiquement des bases de données de vocabulaire basées sur des corpus parallèles, la formation de plusieurs traductions possibles, tant au niveau lexical qu'au niveau de la structure syntaxique de la phrase de la langue cible, l'utilisation de post- montage dans mode automatique et le choix de la meilleure (la plus probable) traduction possible basée sur un modèle de langue construit sur un corpus de langue cible spécifique.
La MT statistique cherche à utiliser des données linguistiques, tandis que les systèmes avec une approche basée sur des règles "classiques" appliquent des méthodes statistiques. L'ajout de certaines règles "de bout en bout", c'est-à-dire la création de systèmes hybrides, améliore quelque peu la qualité des traductions, notamment avec des données d'entrée insuffisantes utilisées pour construire des fichiers d'index pour stocker les informations linguistiques d'un traducteur automatique basé sur N -grammes.
Architecture technologique hybride "SMT et RBMT"[
Le système RBMT est complété par deux composants : un module de post-édition statistique et un module de modèle de langage. La post-édition statistique vous permet de lisser la traduction RB, en la rapprochant du langage naturel, tout en conservant une structure claire du texte synthétisé. Des modèles de langage sont utilisés pour évaluer la fluidité et l'exactitude grammaticale des traductions générées par le système hybride.
Architecture HMT typique:
- · Boîtier parallèle ;
- · Éducation;
- · Modèle de langage ;
- · Données pour la post-édition ;
- · Règles de synthèse ;
- · Glossaire de terminologie.
Avantages de la traduction hybride :
- · Ajustement automatique rapide basé sur les mémoires de traduction du client ;
- · L'exactitude terminologique de la traduction, ainsi que l'unité de style ;
- · Obtenir des données supplémentaires utiles - un dictionnaire terminologique bilingue.
Conclusion
Le principal avantage de la traduction automatique est qu'elle permet de traiter rapidement de très gros volumes de texte et s'avère donc parfois plus rentable que la traduction manuelle. Dans le même temps, il convient de rappeler que la qualité de la traduction automatique sera toujours inférieure à la traduction humaine. Par conséquent, il est conseillé de ne l'utiliser que dans certains cas.
De nombreux types de documents ne sont en principe pas destinés à la traduction automatique. Ainsi, les textes ne peuvent pas être confiés à la machine, où l'imprécision de la traduction peut mettre en danger la santé humaine, la performance d'un appareil complexe ou d'un gros contrat - le temps gagné ici ne justifie pas le risque. Tout document impliquant une responsabilité légale nécessite un contrôle humain. La traduction automatique ne convient pas aux supports marketing, où le texte est en fait repensé dans un nouveau contexte culturel et recréé.
Une qualité acceptable peut être attendue lors de la traduction de textes techniques strictement formalisés, tandis que les textes littéraires et publicitaires ne se prêtent pas à la traduction automatique.
Lorsque vous recourez à la traduction automatique, il est important non seulement d'avoir une idée claire du résultat souhaité et de comprendre les limites de cette méthode, mais également de prendre en compte un facteur supplémentaire. Les systèmes MT nécessitent généralement un réglage et un raffinement individuels complexes, y compris une "formation" sur un sujet spécifique - sans cela, ils affichent des résultats bien pires. À cet égard, il est logique d'utiliser la traduction automatique uniquement si vous devez traduire d'énormes volumes du même type de textes. Dans ce cas, il sera économiquement faisable de passer un peu de temps à former le système, puis d'appliquer la traduction automatique et d'obtenir le texte adapté à la post-édition en sortie. Si nous parlons de plusieurs dizaines de pages, essayer de mettre en place une traduction automatique est inutile et tout simplement non rentable.
Par conséquent, la traduction automatique avec post-édition peut être vraiment bénéfique si des textes du bon type sont traduits en très gros volumes. Étant donné que de gros volumes de traductions passent par des sociétés de traduction, souvent spécialisées dans des domaines spécifiques, l'introduction de systèmes de traduction automatique de dernière génération, assez efficaces mais coûteux, est économiquement justifiée dans ces sociétés : ni les fournisseurs de contenu, même les plus importants, ni les particuliers les traducteurs pourront utiliser efficacement la traduction automatique.
Livres d'occasion
- 1. http://www.logrus.ru
- 2. http://www.moluch.ru/
- 3.https://www.academia.edu
- 4. http://study-english.info/
Conférence 13. Traduction automatique de texte. Dictionnaires de langage informatique
Fondamentaux de la traduction automatique
Traduction- Il s'agit d'un type de médiation linguistique, qui se concentre sur un original en langue étrangère. La traduction est considérée comme une forme d'existence en langue étrangère du message contenu dans l'original. La communication interlingue réalisée par la traduction, dans la plupart plus reproduit le processus de direct communication verbale, dans lequel les communicants utilisent la même langue.
Traduction automatique est l'extraction automatique de connaissances et de textes écrits en langage naturel à l'aide de programmes informatiques basés sur un support linguistique.
Processus de traduction automatique sont les actions d'un ordinateur pour convertir un texte dans une langue naturelle en un texte équivalent en contenu dans une autre langue, ainsi que le résultat d'une telle action.
Système de compréhension de texte automatique, vient du fait que le texte en langage naturel, construit conformément aux dictionnaires, grammaires et algorithmes du langage naturel, basé sur le réseau sémantique, les cadres et les thésaurus, est compris par l'utilisateur du fait qu'il possède des connaissances linguistiques - des structures syntaxiques-sémantiques, ainsi que des connaissances spécialisées.
La plupart des systèmes de traitement automatique du langage visent à analyser des textes pré-divisés en phrases. Cependant, les données linguistiques nous sont le plus souvent disponibles sous la forme de textes balisés en paragraphes, chapitres et autres unités plus grandes. Par conséquent, des algorithmes de segmentation appropriés sont nécessaires pour leur analyse automatique efficace.
Tâches de création d'un système de compréhension automatique de texte :
analyse du texte naturel d'origine, qui fournit la construction de structures linguistiques, y compris diverses structures sémantiques, complètes, partielles, compressées, cherchant à présenter le contenu du texte sous forme de bases de données,
comparaison des structures linguistiques du texte avec des connaissances particulières ou individuelles, également présentées sous forme de base de données
· généralisation de textes basés sur des informations contenues dans des bases de données relationnelles traditionnelles, ainsi que dans des structures textuelles conceptuelles ou dans des bases de données individuelles.
Pour traduction automatique un programme spécial est entré dans l'ordinateur qui met en œuvre algorithme de traduction, qui s'entend comme une séquence d'actions définies sans ambiguïté et strictement sur le texte pour trouver des correspondances de traduction dans une paire de langues donnée pour un sens de traduction donné (d'une langue spécifique à une autre). Il existe également des systèmes de traduction automatique autonomes conçus pour traduire dans trois langues ou plus, mais ils sont actuellement expérimentaux.
La traduction automatique ou automatique moderne est réalisée avec l'aide d'une personne : un pré-éditeur qui pré-traite le texte à traduire d'une manière ou d'une autre, un inter-éditeur qui participe au processus de traduction, ou un post-éditeur qui corrige les erreurs et les lacunes dans le texte traduit par machine .
Le système de traduction automatique comprend des dictionnaires bilingues dotés des informations grammaticales nécessaires (morphologiques, syntaxiques et sémantiques), qui assurent le transfert des correspondances de traduction équivalentes, variantes et transformationnelles, des dictionnaires explicatifs et thématiques spéciaux, ainsi que des outils algorithmiques d'analyse grammaticale qui implémentent n'importe laquelle des grammaires formelles adoptées pour le traitement automatique de texte.
Le plus courant est le suivant suite d'opérations formelles, fournir une analyse et une synthèse dans le système de traduction automatique :
saisie de texte et recherche de formes de mot d'entrée dans le dictionnaire d'entrée accompagnée d'une analyse morphologique, au cours de laquelle l'appartenance d'une forme de mot donnée à un certain lexème est établie. Dans le processus d'analyse, des informations relatives à d'autres niveaux d'organisation du système linguistique peuvent également être obtenues à partir de la forme du mot.
· traduction de phrases idiomatiques, d'unités phraséologiques ou de timbres d'un domaine donné, détermination des principales caractéristiques grammaticales des éléments du texte d'entrée, résolution de l'homographie, analyse lexicale et traduction des lexèmes. Habituellement, à ce stade, les mots à valeur unique sont séparés des mots polysémantiques, après quoi les mots à valeur unique sont traduits selon des listes d'équivalents, et des dictionnaires dits contextuels sont utilisés pour traduire les mots polysémantiques, dont les entrées de dictionnaire sont des algorithmes. pour interroger le contexte sur la présence / l'absence de déterminants de valeur contextuels.
· Analyse grammaticale finale, au cours de laquelle les informations grammaticales nécessaires sont redéfinies, en tenant compte des données de la langue cible.
· Synthèse des formes de mots de sortie et des phrases en général dans la langue cible.
L'analyse et la synthèse peuvent être effectuées à la fois par phrase et pour l'ensemble du texte entré dans la mémoire de l'ordinateur; dans ce dernier cas, l'algorithme de traduction prévoit la définition de liens dits anaphoriques.
Qualité de la traduction automatique dépend de:
Le volume des dictionnaires
la quantité d'informations attribuées aux unités lexicales,
la minutie de compilation et de test des travaux d'algorithmes d'analyse et de synthèse,
l'efficacité du logiciel.
Cependant, aucun des programmes ne peut encore attendre une traduction littéraire «correcte» d'un texte composé de phrases complexes.
Le matériel et les logiciels modernes permettent l'utilisation de grands dictionnaires contenant des informations grammaticales détaillées. Les informations peuvent être présentées comme déclaratif(descriptif) et de procédure(en tenant compte des besoins de l'algorithme) forme.
Amélioration des programmes de traduction automatique associé au concept de soft text comprehension, selon lequel différents utilisateurs extraient leurs informations et leur signification individuelle d'un même texte. Modèle de compréhension de texte souple consiste en la capacité de générer diverses interprétations significatives de l'objet d'origine, en fonction de conditions différentes et les composantes de sa perception.
Des "moyens machine" plus privés pour aider le traducteur et l'éditeur - il s'agit de dictionnaires automatiques et de bases de données terminologiques, de thésaurus informatiques, d'outils d'édition d'écran, de systèmes de correction orthographique, terminologique et grammaticale des textes.
La traduction automatique moderne doit être distinguée de l'utilisation d'ordinateurs pour aider le traducteur humain. Dans ce dernier cas, cela signifie dictionnaire automatique, qui aide une personne à sélectionner rapidement l'équivalent de traduction souhaité. Bien que dans les deux cas l'ordinateur travaille en collaboration avec une personne (traducteur ou éditeur), le contenu du terme "traduction automatique" inclut l'idée que la machine prend l'essentiel du travail de traduction et de recherche d'équivalents de traduction et de correspondances de traduction sur eux-mêmes, ne laissant à la personne que le contrôle et la correction des erreurs.
dictionnaire informatique pour aider une personne - il s'agit d'un outil auxiliaire pour trouver rapidement des correspondances traduites ; En même temps, dans de tels dictionnaires, dans une mesure limitée, certaines fonctions inhérentes aux systèmes de traduction automatique peuvent également être mises en œuvre.
La technologie de l'information est différente 2 approches principales de la traduction automatique :
familiarisation superficielle avec le contenu d'un document dans une langue non familière
L'utilisation de la traduction automatique au lieu de l'habituelle "humaine". Cela implique une édition et une personnalisation minutieuses du système de traduction pour un domaine particulier.
L'exhaustivité du dictionnaire, sa concentration sur le contenu et l'ensemble des moyens linguistiques des textes traduits, l'efficacité des méthodes de résolution de la polysémie lexicale, l'efficacité des algorithmes d'extraction d'informations grammaticales, la recherche de correspondances de traduction et les algorithmes de synthèse jouent ici un rôle.
Comme type d'activité langagière la traduction affecte tous les niveaux de la langue - de la reconnaissance des graphèmes (et des phonèmes dans la traduction de la parole orale) au transfert du sens de l'énoncé et du texte. De plus, la traduction automatique permet de tester des hypothèses théoriques sur la structure de certains niveaux de langue et l'efficacité des algorithmes proposés.
Besoin d'amélioration la traduction automatique est en constante augmentation, car c'est la condition la plus importante pour assurer la communication interlinguistique, dont le volume augmente chaque année.
D'autres moyens de surmonter les barrières linguistiques dans la communication - le développement ou l'adoption d'une langue commune, ainsi que l'étude de langues étrangères - ne peuvent être comparés à la traduction en termes d'efficacité.
date de naissance la traduction automatique en tant que domaine de recherche est généralement considérée comme mars 1947 ; c'est alors que le cryptographe Warren Weaver, dans sa lettre à Norbert Wiener, pose pour la première fois le problème de la traduction automatique, en le comparant au problème du déchiffrement.
traite les problèmes de traduction automatique linguistique computationnelle, qui est né en janvier 1954, lorsque la première expérience publique mondiale sur la traduction automatique a été menée à l'Université de Georgetown (États-Unis). Dans le même temps, sous la direction du plus grand mathématicien et cybernétique Alexei Lyapunov, un travail actif sur la traduction automatique a commencé à Moscou. Au début de 1956, le premier système national de traduction automatique du français vers le russe a commencé à fonctionner à l'Institut de mathématiques appliquées (IPM) du nom de M.V. Keldysh.
Les leaders parmi les programmes de traduction automatique modernes en Russie sont le système PROMT (développé par PROMT, www.e-promt.ru) et le système SOCRAT (développé par Arsenal, www.ars.ru).
DANS dernière version PROMT a une fonctionnalité fondamentalement nouvelle, "Mémoire associée". Le mécanisme de "mémoire associée" vous permet de former le système. Avec son aide, vous pouvez enregistrer la traduction du texte qui vous satisfait dans la base de connaissances et utiliser ultérieurement ses fragments lors de la traduction de textes similaires.
SOCRATES essaie de trouver une solution sans ambiguïté et ne donne pas de variance dans les termes : un mot qui n'est pas dans le dictionnaire reste dans l'orthographe originale. PROMT propose généralement plusieurs options pour traduire des mots et des phrases.
La traduction automatique, qui a traversé plusieurs étapes de son développement, se concentre actuellement sur l'idée de modéliser les actions d'un traducteur humain. Le processus de traduction est très difficile et l'utilisation correcte des avantages du logiciel détermine en grande partie la qualité de la traduction. Les systèmes de traduction automatique modernes incluent de nombreux dictionnaires supplémentaires. Sur la base des caractéristiques des solutions architecturales pour les algorithmes linguistiques, les systèmes sont divisés en deux types - "Transfert" et "Interlingua". Les programmes de traduction automatique sont construits conformément à cette division. Ainsi, par exemple, le programme "Socrates" se traduit beaucoup mieux que, disons, "Magic Goody" car le support linguistique du premier programme est beaucoup plus fort et les dictionnaires sont beaucoup plus volumineux.
Les résultats de la traduction automatique doivent toujours être modifiés. Ainsi, par exemple, le programme "Pars" prévoit la fonction de connexion supplémentaire de dictionnaires de divers sujets. Après tout, la qualité de la traduction produite par la machine dépend aussi de la qualité du logiciel. Mais même ajuster le système au vocabulaire du texte traduit ne prend pas en compte toutes ses caractéristiques, donc les mots traduits qui ont plusieurs synonymes sont marqués d'un astérisque, ou sont donnés entre parenthèses en option.
Technologies Internet a donné un nouveau développement à la traduction automatique, a contribué à l'amener à un nouveau stade de développement. La traduction automatique est un outil efficace pour visualiser et rechercher des informations dans une langue étrangère, et c'est la fonction principale lorsque l'on travaille sur Internet. État actuel La traduction automatique vous permet d'obtenir une traduction textuelle relativement correcte des pages Web dans la plupart des langues. Bien qu'une traduction entièrement automatique de haute qualité ne soit pas possible, il existe déjà des logiciels qui facilitent le processus de traduction lui-même.
Grâce à la personnalisation du domaine et à l'intégration avec d'autres programmes de traitement de documents, la traduction automatique vous permet d'automatiser la réception du texte traduit.
Problème principal de tous les programmes de traduction automatique est bon choix dictionnaire thématique, ainsi que la construction de dictionnaires auxiliaires.
La traduction dépend en partie du niveau de connaissances de l'utilisateur (connaissance de la langue, compétences dans l'utilisation de programmes, sens de la langue), ainsi que, dans une plus large mesure, de sa capacité à travailler correctement avec un éditeur de texte, des utilitaires auxiliaires , dictionnaires et ouvrages de référence phraséologiques. Les variantes de traductions réalisées avec la connexion de dictionnaires thématiques donnent une bonne traduction, le choix correct du sens du mot et l'utilisation des phrases dans le texte. En effet, la machine ajuste son vocabulaire pour sélectionner les synonymes qui seraient plus pertinents pour le sujet de la langue d'entrée et traduiraient conformément au sujet de la langue cible.
2 approches du problème du développement de la traduction automatique:
réglage pour utiliser la langue universelle du sens, approche directe de la traduction, conversion du texte original dans le texte cible
mise en langue intermédiaire, modélisation de la maîtrise du langage humain
Le problème est que le sens d'un texte en langue naturelle dépend non seulement de la phrase elle-même, mais aussi du contexte, qui est lié à l'ambiguïté des mots et des constructions syntaxiques, à l'impossibilité pratique d'une description globale de la structure sémantique de la monde même dans un domaine limité et le manque de méthodes formelles efficaces.
Les questions non résolues la traduction automatique est
résolution d'ambiguïté de l'analyse syntaxique formelle de phrases isolées de texte
surmonter l'incomplétude structurelle et sémantique des sections (fragments) du texte
organisation d'une connexion flexible de différents domaines
la nécessité de comprendre le texte dans son ensemble
Les programmes de traduction automatique traitent mieux les textes scientifiques, techniques et éducatifs, qui se caractérisent par une présentation stricte du matériel.
Le style familier et journalistique, où il y a beaucoup de tournures spécifiques, mais la plupart des mots sont utilisés au sens littéral, convient à la traduction d'introduction, cependant, une édition manuelle est nécessaire pour obtenir un texte de sortie compétent. La traduction qui en résulte est une sorte de texte d'introduction, où seule l'orientation thématique générale du texte est transmise.
Traduction fiction et la poésie ne répond pas aux exigences de la machine. Le sens d'un texte construit sur des expressions allégoriques est déformé lors de la traduction automatique et n'est même pas disponible pour révision. La machine ne comprend pas l'ambiguïté, ce qui conduit à son tour à une mauvaise interprétation du texte traduit, qui se transforme en absurdité.
Vous pouvez essayer de minimiser ces malentendus en observant règles suivantes:
Construire correctement des dictionnaires thématiques
vérifier le texte original au stade de la pré-préparation de sa traduction
modifier à l'étape finale de la traduction
bon usage des programmes de dictionnaire
bonne connaissance de la grammaire et du vocabulaire, ainsi que du sujet du texte source
Utilisation correcte du vocabulaire, des clichés et des formes de mots
réapprovisionner en temps opportun les dictionnaires spéciaux avec de nouveaux termes
SUJET, OBJET ET TÂCHES DE LA THÉORIE LINGUISTIQUE DE LA TRADUCTION
À l'heure actuelle, la théorie linguistique de la traduction s'est solidement établie en tant que discipline scientifique indépendante. Cependant, un certain nombre de questions fondamentales qui déterminent le statut de la théorie de la traduction restent encore non résolues. L'une de ces questions est la question du sujet et de l'objet de la théorie de la traduction.
Divers points de vue, souvent opposés, ont été exprimés dans la littérature sur ce qui devrait être considéré comme le sujet et l'objet de la théorie de la traduction. Ainsi, I.I. Revzin et V.Yu.Rozentsveig soutiennent que l'objet de la traduction est le processus de traduction lui-même, au cours duquel a lieu le passage d'un système de signes à un autre et qui peut être décrit en termes sémiotiques 86 . Ces auteurs établissent une distinction fondamentale entre le processus de traduction et le résultat de la traduction. Elles procèdent du fait que traditionnellement la science de la traduction s'est construite comme une science normative dont les principaux objectifs étaient d'établir le résultat de la traduction et de développer des critères d'évaluation de la qualité de la traduction. La théorie normative de la traduction s'est construite empiriquement, sur la base d'une analyse comparative des originaux et des traductions. Les dispositions théoriques sont empruntées à la lexicologie, à la grammaire, à la stylistique et à la critique littéraire. Avec une telle approche, selon I.I. Revzin et V.Yu. Rozentsvey, une compréhension théorique du processus de traduction ne peut pas être atteinte. La science cherche à décrire
"Revzin I. I., Rozentsveig V. Yu. M. : Plus haut. école, 1964. P.21.
68 VV Sdobnikov, OV Petrova♦ THÉORIE DE LA TRADUCTION
La traduction en tant que processus ne doit pas être normative, mais théorique. C'est-à-dire qu'elle doit décrire non pas ce qui devrait être, mais ce qui est inhérent à la nature même du phénomène 87 .
A.D. Schweitzer n'est pas d'accord avec ce point de vue et il estime qu'une opposition aussi nette entre les approches théoriques et normatives n'est guère justifiée. L'exclusion de l'examen des résultats du processus de traduction rétrécit indûment le sujet de la théorie de la traduction et n'aide guère à révéler son essence. Selon A.D. Schweitzer, la traduction est une activité ciblée qui répond à certaines exigences et normes et se concentre sur l'obtention d'un certain résultat. Ces normes reflètent l'orientation des valeurs du traducteur, sans laquelle il est impossible d'expliquer de manière satisfaisante la logique des décisions de traduction 88 . Ainsi, A.D. Schweitzer inclut à la fois le processus de traduction lui-même et le résultat du processus de traduction dans le sujet de la théorie de la traduction.
Il semble que les chercheurs en traduction, essayant de désigner le sujet de la théorie de la traduction, n'aient pas pleinement pris en compte le fait que la traduction est un phénomène complexe, complexe, qui est influencé par de nombreux facteurs très divers. La compréhension de cette circonstance s'obtient dans une plus large mesure dans les travaux de VN Komissarov, qui note à juste titre qu'il n'est guère légitime d'opposer le processus de traduction à son résultat. C'est le résultat de la traduction qui représente cette réalité directement observable, sur la base de l'analyse de laquelle on peut indirectement juger du déroulement du processus de traduction, qui est inaccessible à l'observation directe.
"Revzin I. I., Rosenzweig V. Yu. Principes fondamentaux de la traduction générale et automatique. M. : Plus haut. école, 1964. P.21.
"Schweitzer A.D. Théorie de la traduction : statut, problèmes, aspects. M : Nauka, 1988. P.7.
DEUXIEME PARTIE. La théorie de la traduction comme discipline scientifique 69
La théorie linguistique de la traduction traite à la fois des textes en langue source (SL) et en langue cible (TL), ainsi que du processus de conversion du texte original en texte cible. Mais cette approche n'est pas tout à fait suffisante. L'activité de traduction, par définition, est de nature intermédiaire. La traduction offre la possibilité d'une communication interlinguistique. Et cela signifie que pour créer une traduction à part entière, le traducteur doit tenir compte des particularités de l'auteur du message original et des destinataires de ce message, de leurs connaissances, de leur expérience, ainsi que des particularités de la perception de les personnes à qui la traduction est destinée, etc. tous les autres aspects de la communication interlinguistique qui affectent le déroulement et le résultat du processus de traduction. Cela signifie que le sujet de la théorie de la traduction est complexe et ne se limite pas au processus de traduction et à son résultat. La théorie linguistique de la traduction considère la traduction dans le cadre large de la communication interlinguistique et étudie tous ses aspects et facteurs déterminants, linguistiquement propres et extérieurs à la langue, mais influençant directement ou indirectement le choix des unités linguistiques dans le processus de traduction 89 .
De cette présentation du problème, on constate qu'il n'y a pas d'unité parmi les chercheurs en traduction quant à la terminologie utilisée. Tout d'abord, l'attention est attirée sur l'absence de distinction claire entre les concepts de sujet de recherche scientifique et d'objet de recherche scientifique. Soit dit en passant, l'analyse des définitions proposées par les dictionnaires de la langue russe n'apporte pas non plus plus de clarté à cette question. Par exemple, sujet la recherche scientifique est définie comme « le sujet, ce qui sert de contenu à la pensée, à la parole, auquel le savoir cognitif ou créatif
89 Komissarov V.N. Théorie de la traduction (aspects linguistiques). M. : Plus haut. école., 1990. S.40-41.
70 VV Sdobnikov, OV Petrova♦ THÉORIE DE LA TRADUCTION
Activités » 99 . Un objet il est défini comme « ce qui s'oppose au sujet, vers lequel se dirige son activité substantielle pratique et cognitive » 100 . Comme nous pouvons le voir, les deux concepts sont définis comme quelque chose vers lequel l'activité pratique, cognitive et créative du sujet de recherche est dirigée. En même temps, il serait opportun de considérer comme objet d'étude quelque chose qui appartient réellement au cercle des phénomènes matériels du monde, et comme sujet d'étude - un certain problème, pour la résolution duquel Recherche scientifique effectivement dirigé. Basé sur ceci, En tant qu'objet de la théorie linguistique de la traduction, nous comprendrons l'activité de traduction intermédiaire dans le cadre de la communication interlinguistique, présentée à la fois directement (le processus) et indirectement, c'est-à-dire reflétée dans les résultats du processus de traduction. Le sujet de la théorie de la traduction est l'étude des régularités du processus de traduction, des facteurs qui influencent le déroulement du processus de traduction et déterminent le résultat de la traduction.
V.N. Komissarov 101 formule ce qui suit Tâches théorie linguistique de la traduction :
1) révéler et décrire l'OS linguistique général
nouvelles traductions, c'est-à-dire indiquer quelles caractéristiques de la langue
systèmes kovy et modèles de fonctionnement
Les langues sont au cœur du processus de traduction
sa, rendre ce processus possible et déterminer
son caractère et ses limites;
2) définir la traduction comme un objet de langage
qui étudient, indiquent sa différence avec les autres
types de médiation linguistique;
3) développer la base de la classification des types de pe
activités de traduction;
99 Dictionnaire de la langue russe en 4 volumes. Tome III. M. : Rus yaz., 1983. P.366. "Dictionnaire de la langue russe en 4 volumes. Tome 11. M : Rus. yaz., 1983. S.579. 101 K o m i s s a r o v V. N. Théorie de la traduction (aspects linguistiques). M. : Plus haut école., 1990. S.35-36.
DEUXIEME PARTIE. La théorie de la traduction comme discipline scientifique 71
4) révéler l'essence de l'équivalence de traduction comme base de l'équivalence communicative des textes de l'original et de la traduction ;
5) développer des principes généraux et des fonctionnalités
construction de théories privées et spéciales de la traduction
Oui pour diverses combinaisons langues;
6) développer des principes généraux de description scientifique
du processus de traduction comme les actions d'un traducteur
pour convertir le texte original en texte réimprimé
eau;
7) révéler l'impact sur le processus de traduction
facteurs pragmatiques et sociolinguistiques;
8) définir la notion de "taux de traduction" et de temps
travailler les principes d'évaluation de la qualité de la traduction.
Conformément à ces tâches, notre cours de théorie générale de la traduction sera construit. Mais d'abord, nous devrions considérer la question de la composition provisoire des études de traduction et de la théorie linguistique de la traduction.
La traductologie en tant que discipline scientifique est plus large que la théorie de la traduction et comprend plusieurs disciplines ou sections scientifiques. Les études de traduction comprennent la théorie de la traduction, l'histoire de l'activité de traduction, la critique de la traduction, la lexicographie de la traduction, la didactique de la traduction (méthodes d'enseignement de la traduction). Comme nous pouvons le voir, la théorie linguistique de la traduction n'est qu'une des sections des études de traduction, mais en même temps elle a un caractère complexe et comprend les sections suivantes :
Théorie générale de la traduction- une section de la théorie linguistique de la traduction qui étudie les modèles linguistiques les plus généraux de la traduction, quelle que soit la paire de langues spécifique impliquée dans le processus de traduction, la manière dont ce processus est effectué, et caractéristiques individuelles acte spécifique de transfert.
Théorie spéciale de la traduction- une branche de la théorie linguistique de la traduction qui étudie les caractéristiques du processus de traduction des textes type différent et influencer
72 VV Sdobnikov, OV Petrova♦ THÉORIE DE LA TRADUCTION
Nie sur ce processus de formes de discours et les conditions de sa mise en œuvre. Il existe plusieurs théories particulières de la traduction : la théorie de la traduction littéraire, la théorie de la traduction scientifique et technique, la théorie de la traduction orale, la théorie de la traduction automatique, etc.
Théorie privée de la traduction- une section de la théorie linguistique de la traduction qui étudie les aspects linguistiques de la traduction d'une langue donnée vers une autre langue donnée. Il peut y avoir de nombreuses théories privées de la traduction : la théorie de la traduction de l'anglais vers le russe, la théorie de la traduction de l'allemand vers le japonais, la théorie de la traduction de Français en swahili, etc.
RELATION DE LA THÉORIE DE LA TRADUCTION AVEC D'AUTRES DISCIPLINES LINGUISTIQUES
La théorie linguistique de la traduction est étroitement liée à des disciplines linguistiques telles que la linguistique contrastive, la sociolinguistique, la psycholinguistique, la linguistique textuelle.
Théorie de la traduction et linguistique contrastive
La linguistique contrastive est une direction de recherche en linguistique générale, dont le but est une étude comparative de deux, moins souvent plusieurs langues afin d'identifier leurs similitudes et leurs différences à tous les niveaux de la structure de la langue 102. Comme le note A.D. Schweitzer, la question de la relation entre la linguistique contrastive et la théorie de la traduction continue d'être un sujet de controverse. Dans le passé, il n'y avait souvent pas de distinction claire
102 Dictionnaire encyclopédique linguistique. M : Hiboux. encyclopédie, 1990. S.239.
. La théorie de la traduction comme discipline scientifique 73
La restitution de ces disciplines. JI Retsker écrivait en 1950 que « la traduction... est inconcevable sans une base linguistique solide. Une telle base devrait être une étude comparative des phénomènes linguistiques et l'établissement de certaines correspondances entre la langue d'origine et la langue cible. Ces correspondances dans le domaine du vocabulaire, de la phraséologie, de la syntaxe et du style doivent constituer la base linguistique de la théorie de la traduction » 103 . Ainsi, la comparaison des langues et des phénomènes linguistiques était en fait identifiée à la théorie linguistique de la traduction.
Parfois, la théorie de la traduction s'identifie non pas à la linguistique contrastive en général, mais à l'une de ses sections, à savoir la stylistique comparée. Cette tradition a été fondée par les travaux de J.-P. Vine et J. Darbelnet « Style comparé du français et Anglais» (1958), dans lequel les auteurs mettent en fait un signe égal entre les concepts de stylistique comparée et de théorie de la traduction. I.I. Revzin et V.Yu. Rozentsveig ont ensuite prêté attention à cette caractéristique des études de traduction linguistique: «Reconnaissant la valeur des travaux de cette direction pour la théorie de la traduction, ... en même temps, on ne peut manquer de remarquer la confusion en eux des concepts de stylistique et de théorie de la traduction » 104 . Et pourtant, même une décennie plus tard, certains chercheurs soutenaient que « la théorie linguistique de la traduction n'est rien d'autre qu'une « linguistique textuelle comparative », c'est-à-dire une étude comparative de textes multilingues sémantiquement identiques » 105 .
La description même de la méthode indique le lien étroit entre la linguistique contrastive et la théorie de la traduction.
103 Shveytser A.D. M :
Nauka, 1988. S.Yu.
104 R e v z i n I. I., R o z ents v e g V. Yu. Fondamentaux du général et de la machine
traduction. M.\ Plus haut école, 1964. P.32.
105 B a r k h u d a r o v L. S. Langue et traduction (questions de droit général et privé)
théorie de la traduction). M. : International relations, 1975. P.28.
74 VV Sdobnikov, OV Petrova♦ THÉORIE DE LA TRADUCTION
Étude comparée des langues. Les principes de la description comparative sont formulés par A.V. Fedorov comme suit: «Ce qui est spécifique à une langue particulière, ce n'est pas le sens exprimé qui lui est commun avec une autre langue, mais les catégories formelles dans lesquelles il s'exprime, les traits structurels. A partir d'une catégorie formelle, comme à partir d'un objectif donné (par exemple, à partir d'un certain type de mots, de modèles de formation de mots, d'ordre des mots, de phrases à deux voix avec un certain type de sujet, etc.), le chercheur passe à déterminer ses sens dans une langue, puis ceux qui expriment ces sens aux moyens formels d'une autre langue (mots coïncidents ou d'autres types, dans le même ordre des mots ou dans un ordre différent, phrases à deux ou à une partie, etc.). Naturellement, avec un tel mode d'analyse, le matériel des traductions est très reconnaissant... » 106 . De cette définition de la méthode de recherche, il s'ensuit que les linguistes, dans l'intérêt d'une étude comparative des langues, ont utilisé la méthode de comparaison d'œuvres de discours spécifiques dans différentes langues, qui sont en fait des originaux et des traductions. Ceci est parfaitement cohérent avec l'affirmation d'E.Koseriu selon laquelle la linguistique contrastive au niveau de la norme linguistique, qui examine l'utilisation réelle des unités fonctionnelles, couvre exactement le domaine dans lequel le processus de traduction a lieu et coïncide avec lui. Pour la théorie de la traduction, selon E.Koseriu, le domaine de la linguistique contrastive, qui se concentre sur le langage en action, est le plus proche de tous. Comme la théorie de la traduction, ce domaine traite des réalisations verbales de la structure de la langue, du domaine du fonctionnement de la langue dans la parole, et, comme la théorie particulière de la traduction, il est unidirectionnel (par exemple, le problème de découverte
106 Op. par : RevzinI. I., Rosenzweig, V. TU. Principes fondamentaux de la traduction générale et automatique. M. : Plus haut. école., 1964. P.33
PARTIE //. Théorie la traduction comme discipline scientifique 75
La correspondance au gérondif n'est pertinente que pour la traduction à partir du russe et pour la linguistique contrastive, dont la langue d'origine est le russe) 107 .
Les données de la linguistique contrastive sont sans aucun doute utiles pour la théorie linguistique de la traduction. En explorant la relation entre les unités fonctionnelles de la langue A et de la langue B, la linguistique contrastive crée les bases nécessaires à la construction d'une théorie de la traduction. En effet, de nombreuses transformations de la traduction qui composent la « technologie » de la traduction renvoient finalement à des différences fonctionnelles et structurelles entre les langues qui « se heurtent » les unes aux autres dans le processus de traduction. La linguistique contrastive répond dans un certain nombre de cas à la question de savoir pourquoi telle ou telle opération est effectuée en traduction 107 . L'une des raisons de l'utilisation des transformations de traduction est la présence dans l'une des langues en interaction des formes dites "non équivalentes", dont l'identification est facilitée par les données de la linguistique contrastive.
On peut dire que la théorie de la traduction a besoin de la linguistique contrastive comme source de données initiales. Ces données, qui mettent en lumière les écarts entre les types structurels, les systèmes et les normes des langues, servent de point de départ pour une analyse appropriée de la traduction 108 .
Malgré la relation étroite entre la linguistique contrastive et la théorie de la traduction, elles ne peuvent être assimilées l'une à l'autre. La tâche de la linguistique contrastive est la comparaison des langues, l'identification de leurs similitudes et de leurs différences. La théorie de la traduction, à son tour, explore la traduction comme un type spécifique de communication interlinguistique, la médiation linguistique. Son but est de révéler l'essence, la traduction, son
107 Shveytser A.D. Théorie de la traduction : statut, problèmes, aspects M :
Nauka, 1988. SP.
108 Idem. C.12.
76 VV Sdobnikov, OV Petrova♦ THÉORIE DE LA TRADUCTION
Mécanismes, modalités de mise en œuvre, facteurs linguistiques et extralinguistiques l'affectant. La théorie de la traduction, en plus des textes source et de destination, tient compte des différences socioculturelles et psychologiques entre les communicants multilingues, ainsi que d'un certain nombre d'autres déterminants socioculturels et psycholinguistiques du processus de traduction. En même temps, il est pris en compte que la traduction n'est pas un simple changement du code de la langue, mais aussi l'adaptation d'un texte à sa perception à travers le prisme d'une autre culture.
Comment fonctionne le programme de traduction ?
Il est basé sur l'algorithme de traduction - une séquence d'actions définies de manière unique et stricte sur le texte pour trouver des correspondances dans une paire donnée de langues L1 - L2 pour une direction de traduction donnée (d'une langue spécifique à une autre). Dictionnaires et grammaires ordinaires différentes langues ne sont pas applicables à la traduction automatique, car ils décrivent le sens des mots et les schémas grammaticaux sous une forme non stricte, ce qui n'est en aucun cas acceptable pour un usage « machine ». Par conséquent, une grammaire formelle de la langue est nécessaire, c'est-à-dire logiquement cohérent et clairement exprimé (sans sous-entendus ni omissions). Dès que des descriptions formelles de divers domaines de la langue ont commencé à apparaître - principalement la morphologie et la syntaxe - des progrès ont été réalisés dans le développement de systèmes de traduction automatique. Pour fonctionner avec succès, le système de traduction automatique comprend, d'une part, des dictionnaires bilingues munis des informations nécessaires (morphologiques, liées aux formes du mot, syntaxiques, décrivant les manières de combiner les mots dans une phrase, et sémantiques, c'est-à-dire chargées de le sens), et d'autre part, les moyens d'analyse grammaticale, qui s'appuient sur l'un des formel, c'est-à-dire stricte, grammaire. La plus courante est la séquence suivante d'opérations formelles qui fournissent une analyse et une synthèse dans un système de traduction automatique.
- 1. Lors de la première étape, le texte est saisi et les formes de mot d'entrée (mots sous une forme grammaticale spécifique, par exemple, le datif pluriel) sont recherchées dans l'entrée avec une analyse morphologique d'accompagnement, au cours de laquelle l'appartenance de cette forme de mot à un certain lexème (un mot comme unité du dictionnaire) est établi. Dans le processus d'analyse, des informations relatives à d'autres niveaux d'organisation du système linguistique peuvent également être obtenues à partir de la forme d'un mot, par exemple, quel membre d'une phrase un mot donné peut être. Pour une machine, la combinaison de ces deux opérations - à la fois analyse grammaticale et appel au sens des mots - est une tâche difficile. Il vaut mieux rendre l'analyse syntaxique indépendante du sens des mots, et utiliser le dictionnaire à d'autres étapes de la traduction.
- 2. Qu'est-ce qu'une analyse syntaxique indépendante, vous pouvez comprendre si vous essayez d'analyser la phrase, à partir de laquelle les significations de mots spécifiques sont «supprimées». Un exemple brillant d'une phrase de ce genre est inventé par l'académicien L.V. Une suggestion astucieuse : le kuzdra scintillant a soulevé le bokra et ondule le bokra. Phrase insensée ? Comme si oui: en russe, il n'y a pas de mots qui le composent (à l'exception de l'union et). Et pourtant, dans une certaine mesure, nous le comprenons.
- 3. C'est-à-dire que la machine effectue une analyse syntaxique de la phrase sans s'appuyer sur la signification de ses mots constitutifs, en utilisant uniquement des informations sur leurs propriétés grammaticales. À la suite de l'analyse syntaxique, une structure syntaxique apparaît, qui est représentée comme un arbre de dépendance : la « racine » est le prédicat et les « branches » sont ses relations syntaxiques avec les mots dépendants. Chaque mot de la phrase est écrit sous sa forme de dictionnaire, et avec lui les caractéristiques grammaticales que ce mot a dans la phrase analysée sont indiquées.
- 4. 2. L'étape suivante comprend la traduction de phrases idiomatiques, d'unités phraséologiques ou de timbres d'un domaine donné (par exemple, dans la traduction anglais-russe, des phrases comme en cas de, conformément à reçoivent un seul équivalent numérique et sont exclues d'une analyse grammaticale plus poussée) ; détermination des principales caractéristiques grammaticales (morphologiques, syntaxiques, sémantiques et lexicales) des éléments du texte d'entrée (par exemple, le nombre de noms, le temps verbal, leur rôle dans cette phrase, etc.), produits au sein de la langue d'entrée ; désambiguïsation (par exemple, le rond anglais peut être un nom, un adjectif, un adverbe, un verbe ou une préposition); Analyse et traduction de mots. Habituellement, à ce stade, les mots à valeur unique sont séparés des mots polysémantiques (ayant plus d'un équivalent de traduction dans la langue cible), après quoi les mots à valeur unique sont traduits selon des listes d'équivalents, et des dictionnaires dits contextuels sont utilisés. pour traduire des mots polysémantiques dont les entrées de dictionnaire sont des algorithmes d'interrogation du contexte en présence/absence de déterminants de valeur de contexte.
- 5. 3. L'analyse grammaticale finale, au cours de laquelle les informations grammaticales nécessaires sont en outre déterminées, en tenant compte des données de la langue cible.
- 6. 4. Synthèse des formes de mots de sortie et des phrases en général dans la langue cible. Ici, il ne sera pas possible de se contenter d'une simple traduction des "nœuds" de l'arbre dans une autre langue. La syntaxe de chaque langue est arrangée à sa manière : ce qui est sujet dans une phrase russe peut (ou doit) être exprimé par un objet dans une autre langue, et l'objet, au contraire, doit être transformé en sujet ; ce qui dans une langue est désigné par un groupe de mots est traduit dans une autre par un seul mot, et ainsi de suite. Cette transition de la structure à la phrase réelle est appelée synthèse syntaxique.
- 7. En fonction des caractéristiques de la morphologie, de la syntaxe et de la sémantique d'une paire de langues particulière, ainsi que du sens de la traduction, l'algorithme général de traduction peut inclure d'autres étapes, ainsi que des modifications de ces étapes ou de leur ordre, mais des variations de ce genre dans les systèmes modernes sont généralement insignifiants. L'analyse de contexte est utilisée pour résoudre le problème de l'ambiguïté des mots. Le fait est que chacune des plusieurs significations d'un mot polysémantique est dans la plupart des cas réalisée dans son propre ensemble de contextes. C'est-à-dire que chacune des significations "concurrentes" (en cours d'interprétation) a son propre ensemble de contextes. Et c'est précisément cette dépendance du sens à l'environnement qui permet à l'auditeur de comprendre correctement l'énoncé. Pour une compréhension correcte de l'énoncé, il faut aussi bien prendre en compte les règles de conditionnalité du sens choisi par l'environnement lexical (opérant dans l'interprétation « phraséologique » du mot), les règles de conditionnalité du sens sens choisi par le contexte sémantique (les lois dites d'accord sémantique) et les règles de conditionnalité du sens choisi par le contexte grammatical (morphologique et syntaxique).
- 8. Les systèmes de traduction automatique existants ont tendance à cibler des paires de langues spécifiques (par exemple, français et russe ou japonais et anglais) et ont tendance à utiliser des correspondances de traduction soit à un niveau superficiel, soit à un niveau intermédiaire entre les langues d'entrée et de sortie. La qualité de la traduction automatique dépend du volume du dictionnaire, de la quantité d'informations attribuées aux unités lexicales, de la minutie de la compilation et de la vérification du fonctionnement des algorithmes d'analyse et de synthèse, et de l'efficacité du logiciel. Le matériel et les logiciels modernes permettent l'utilisation de grands dictionnaires contenant des informations grammaticales détaillées. Les informations peuvent être présentées à la fois sous forme déclarative (descriptive) et procédurale (en tenant compte des besoins de l'algorithme).
- 9. Dans la pratique de la traduction et dans les technologies de l'information, il existe deux approches principales de la traduction automatique. D'une part, les résultats de la traduction automatique peuvent être utilisés pour une connaissance superficielle du contenu d'un document dans une langue inconnue. Dans ce cas, il peut être utilisé comme information de signal et ne nécessite pas d'édition minutieuse. Une autre approche implique l'utilisation de la traduction automatique au lieu de l'habituel "humain". Cela implique une édition et une personnalisation minutieuses du système de traduction pour un domaine particulier. L'exhaustivité du dictionnaire, sa concentration sur le contenu et l'ensemble des moyens linguistiques des textes traduits, l'efficacité des méthodes de résolution de la polysémie lexicale, l'efficacité des algorithmes d'extraction d'informations grammaticales, la recherche de correspondances de traduction et les algorithmes de synthèse jouent ici un rôle. En pratique, une traduction de ce type devient économiquement viable si le volume de textes traduits est suffisamment important (au moins plusieurs dizaines de milliers de pages par an), si les textes sont suffisamment homogènes, si les dictionnaires du système sont complets et permettent une extension ultérieure, et le logiciel est pratique pour la post-édition.