L'expression « reconnaissance avancée » a été formulée par la TAUS (Translation Association User Society) pour décrire la prochaine génération d'outils de mémoire de traduction (MT), dont les fonctionnalités surpassent celles des MT classiques. Le perfectionnement des fonctionnalités a pour but de surmonter certains obstacles rattachés à la technologie des MT classiques, notamment le nombre limité de correspondances repérées puisque, contrairement à la logique du processus de traduction humaine, elles ne reconnaissent que des correspondances de phrases complètes (ou segments). Or les humains peuvent facilement établir des correspondances entre des phrases, mais également entre des paragraphes et des sous-segments – dans l'agencement des parties du discours, telles les expressions et les phrases classiques, qui caractérisent le style. La mémoire de traduction à reconnaissance avancée (MTRA) est conçue pour accomplir les mêmes tâches qu'une MT classique et plus encore. Ses fonctionnalités complémentaires aident les traducteurs à établir les correspondances dans leur contexte.
Saviez-vous que :
Les mémoires de traduction (MT) classiques transforment les traductions antérieures en base de données en extrayant et en alignant automatiquement les phrases du document source à celle du document cible. Pour ce faire, elles segmentent tous les documents pour créer une base de données de phrases alignées (généralement composées de phrases uniques) sans tenir compte du contexte. Vu l'absence de référence au contexte, la technologie des MT classiques nécessite généralement une importante intervention de la part d'un linguiste qualifié qui doit valider et corriger les désalignements, en particulier dans le cas des alignements 1 : N et N : 1 qui sont évidents pour l'humain, mais pas pour les outils automatisés. De plus, puisque ces outils traditionnels alignent les segments comme des paquets de données, ils ne sont pas en mesure de relier des ensembles (plusieurs phrases) ou des sous-segments (phrases ou expressions). La MTRA exploitée par MultiTrans PRISM établit toutefois cette correspondance et ne requiert aucune intervention humaine pour aligner les segments d'un texte, car le document complet (non segmenté) est stocké dans la base de données. Ainsi, elle tient compte du contexte et récupère les segments de la mémoire contextuelle d'une manière efficace – en reproduisant la MT classique seulement lorsque cela est nécessaire. Puisque ce processus ne nécessite pas l'intervention humaine, vous serez à même de créer des mémoires de traduction de taille plus importante, maximisant ainsi la valeur de chaque traduction.
La mémoire de traduction à reconnaissance avancée permet de pallier les lacunes des outils de MT classiques, non seulement en alignant des phrases, mais aussi en alignant des documents entiers par l'alignement de textes intégraux, de paragraphes et même de sous-segments. En plus d'établir les correspondances entre documents complets, paragraphes, segments et sous-segments, la solution MultiTran se sert de ces correspondances pour préserver, repérer et aligner plus facilement les combinaisons 1 : N et N : 1 tout en tenant compte du contexte. Ce modèle procure des résultats d'alignement supérieurs et ne requiert pratiquement aucune intervention. Grâce aux correspondances granulaires fournies par la MTRA, les clients de MultiCorpora sont plus productifs parce qu'ils récupèrent un plus grand nombre de répétitions de leurs traductions antérieures. La MTRA fournit donc aux utilisateurs les mêmes fonctions que les MT classiques, en plus de correspondances supplémentaires et d'une plus grande fiabilité d'alignement, le tout sans intervention humaine.
Un autre avantage de la MTRA réside dans sa capacité à chercher des correspondances dans l'ensemble du document afin que le contexte linguistique des correspondances de sous-segments (ou même de paragraphes) puisse être examiné pour en comprendre le sens, le style et le ton. Cette capacité de recherche avancée offre la possibilité de trouver dans la MT d'importants sous-segments de texte identiques ou semblables, mais dont les éléments peuvent être dans un ordre différent de ceux des sous-segments correspondants du texte source. La MTRA permet également la recherche simultanée dans plusieurs mémoires de traduction pour trouver et classer les traductions les plus appropriées. Comparativement aux MT classiques, la MTRA obtient des taux élevés de correspondances totales ou partielles.
Le concept de correspondance des sous-segments peut sembler obscur aux yeux des habitués des MT classiques. La correspondance des paragraphes est plus facile à comprendre, car plusieurs MT classiques imitent la correspondance des paragraphes par l'intermédiaire de la correspondance contextuelle – bien qu'il ne s'agisse pas réellement de correspondance de paragraphes entiers. Pour mieux comprendre comment la correspondance de sous-segments fonctionne, voici un exemple simple. Vous disposez d'une MT et devez traiter la phrase suivante (et sa traduction) :
Il était une fois, une belle princesse.
Vous avez maintenant un nouveau document avec la phrase suivante :
Il était une fois, un méchant dragon vivant dans une grotte.
La méthode de MT classique afficherait alors une non-correspondance – puisque le taux de correspondance se situerait sous les 75 pour cent. Pourtant, pour le lecteur, il apparaît évident que ces deux phrases sont composées de deux éléments, dont l'un obtient une correspondance de 100 pour cent (« Il était une fois ») et l'autre une correspondance de zéro pour cent (« une belle princesse » et « un méchant dragon vivant dans une grotte »). Cet exemple est fort simple. Or, le principe est le même pour les phrases composées de propositions répertoriées dans les différents paragraphes d'un document antérieur. De même, si un document antérieur est réécrit et que des propositions sont coupées puis placées ailleurs dans le texte, la MTRA sera encore en mesure de reconnaître les composantes du nouveau texte et de les faire correspondre aux éléments de la MT. En général, les outils de MT classiques ne saisissent pas ces changements résultant du couper-coller, car les propositions n'atteignent pas leurs seuils de correspondance; par conséquent, elles ne peuvent pas repérer les extraits de texte identiques ou semblables. Grâce à la reconnaissance avancée, ces correspondances de sous-segments peuvent être repérées et réutilisées facilement pendant le travail de traduction. Cet avantage accélère le travail du traducteur, qui n'a pas à retraduire les extraits répétitifs, en plus d'assurer l'uniformité.
La langue écrite est composée d'une part considérable de phrases et de propositions courantes. « Il était une fois » n'est qu'un simple exemple d'une expression figée que de nombreux auteurs écrivent encore et toujours. Un de nos clients a tenté une expérience avec les correspondances d'un sous-segment afin d'en déterminer le nombre d'occurrences. Pour ce faire, il a constitué une importante mémoire de traduction (composée de plus de six millions de mots) en réunissant les contenus de tous ses clients financiers. Il a ensuite analysé le document d'une société financière (non cliente) à l'aide de cette MT. Sans surprise, l'analyse n'a relevé aucune correspondance totale, tout en obtenant un ou deux pour cent de correspondances partielles (de 75 à 99 pour cent). Toutefois, le client a constaté avec étonnement que la MT avait établit des correspondances de sous-segments pour plus de 20 pour cent de l'ensemble du contenu! Une autre expérience a révélé l'existence d'une corrélation entre la quantité de contenu dans la MT et le pourcentage de correspondance; plus il y a de contenu, plus il y aura de correspondances de sous-segments. L'émergence des MT « collectives », telles que MyMemory et TAUS TDA, ouvre de nouveaux horizons quant à l'utilisation des MT, surtout qu'elles permettent de réutiliser les textes n'ayant pas de MT associés pour de nouveaux clients.
En effectuant l'indexation intégrale de textes, la MTRA vous permet de rechercher et de récupérer des chaînes de texte, de toute longueur, semblables ou identiques, qu'il s'agisse de segments, de paragraphes, de termes ou même de sous-segments. Aussi cette technologie repère-elle jusqu'à 30 pour cent plus de correspondances dans les documents traduits antérieurement que les mémoires de traduction classiques. Comme la technologie MTRA analyse les traductions antérieures à un niveau plus granulaire, les utilisateurs peuvent voir les différentes traductions antérieures de sous-segments, de termes et de mots. Cette technologie extrait de votre corpus de traductions antérieures les différentes façons dont un sous-segment, un terme ou un mot a été traduit en plus d'en donner la fréquence en pourcentage. Ce niveau de granularité analytique aide également les utilisateurs à normaliser leur terminologie afin d'accroître l'efficacité et d'améliorer la qualité.
En fournissant le contexte de vos traductions antérieures, fort utile pour la traduction de documents complexes composés de styles de paragraphes complets, la MTRA vous permet de constituer des corpus entiers de textes bruts indexés tout en gardant le contexte intact pour l'affichage rapide de la traduction, parfois ambiguë, de certains termes, phrases et paragraphes. En fournissant le contexte intégral pendant la traduction, la MTRA devient un énorme dictionnaire contextuel contenant des exemples d'usage et de style pour les divers termes et expressions recherchés. Une interface utilisateur intuitive présente, dans des fenêtres distinctes, la correspondance entre un texte source antérieur et les traductions antérieures de même qu'entre le texte cible et les traductions antérieures, chaque correspondance étant accompagnée de son contexte naturel.
Les MT classiques contiennent généralement moins de documents traduits antérieurement en raison de l'effort requis pour constituer et tenir à jour le corpus. Même en déployant les efforts nécessaires, vous accuserez encore un retard de 30 pour cent comparativement à la granularité poussée que seule la MTRA peut offrir. La MTRA vous permettra de créer des mémoires de traduction très rapidement – en fait, avec la MTRA, vous serez en mesure de créer automatiquement de nouvelles mémoires de traduction de plus de 100 000 segments par heure (ou plus de un million de segments par jour). La MTRA peut aligner un nombre illimité de documents à un taux de réussite de 95 pour cent, de sorte que vous pouvez vous fier à la qualité des alignements automatisés et utiliser immédiatement votre MT.
Une étude de référence indépendante, subventionnée par la TDA (TAUS Data Association) et réalisée par le Centre des études de traduction de l'Université de Leeds, révèle qu'en moyenne la MTRA augmente de 30 pour cent le nombre de correspondances repérées dans des documents traduits antérieurement comparativement aux mémoires de traduction classiques. Toute organisation qui ne gère pas déjà ses avoirs linguistiques pourrait recycler jusqu'à 50 pour cent de ses traductions antérieures grâce à la MTRA.
La technologie TextBase TM exploitée par MultiTrans Prism possède une capacité d'indexation plein texte, ce qui signifie que vous pouvez chercher et extraire des chaînes de caractères de toute longueur, comme des termes, des sous-segments, des segments flous et des paragraphes. Grâce à la technologie de MultiTrans Prism, les utilisateurs peuvent également créer des mémoires de traduction de plus de 10 000 nouveaux segments en moins de cinq minutes – vos ressources ne perdront plus de temps à vérifier les alignements avant l'utilisation de chaque mémoire de traduction.
Ne vous contentez plus d'une MT classique de capacité modeste qui contient généralement moins de 30 pour cent de vos traductions antérieures pertinentes en raison de l'effort exigé par la constitution de telles mémoires. Dotez-vous d'un système qui vous permet d'importer facilement et automatiquement toutes vos traductions antérieures ainsi que tous vos documents de référence. En effet, MultiTrans Prism peut, sans intervention humaine, aligner un nombre illimité de documents avec un taux de réussite de 95 pour cent. Pour corriger le cinq pour cent restant, tout dépendant de vos besoins opérationnels, vous pouvez décider d'investir dans la main‑d'œuvre nécessaire, mais cela n'est même pas nécessaire : grâce à la TextBase TM qui affiche toujours les textes dans leur contexte intégral, vous pouvez corriger plus tard les rares alignements erronés – tout cela pendant que vous traduisez!
MultiTrans peut également importer les fichiers TMX et rentabiliser les mémoires de traduction antérieures. En raison de la simplicité d'utilisation et de la capacité d'alignement rapide des documents, ses utilisateurs peuvent exploiter tous leurs documents – et non plus une partie – en recourant à la TextBase MT de MultiTrans sans qu'il soit nécessaire d'effectuer l'analyse coûts-avantages, comme c'est le cas avec les outils de MT classiques. En bénéficiant d'un plus vaste corpus de traductions de qualité duquel vous pouvez puiser plus de répétitions, non seulement vous améliorez la productivité, mais aussi la qualité et l'uniformité terminologiques de vos prochaines traductions.
MultiTrans Prism n'est pas le seul produit de MTRA sur le marché, mais il a été le premier à voir le jour – et nous pensons qu'il est aujourd'hui le meilleur. Sa gamme de fonctionnalités est supérieure à celle des produits de MTRA concurrents. Pour vous donner une idée de l'importance des fonctionnalités de notre MTRA comparativement à une MT classique, nous vous invitons à consulter le tableau ci-dessous. Ce tableau peut également vous guider au moment d'acquérir une MTRA en vous aidant à déterminer quelles fonctionnalités de cet outil conviennent à vos besoins.

MultiCorpora voudrait partager avec vous les avantages de la MTRA. Pour assister à une démonstration en direct de la MTRA, rendez-vous sur notre page de demande de démonstration en direct et remplissez le formulaire. Laissez-nous calculer le rendement réel de votre capital investi avec de vraies données. Vous serez surpris des résultats!
Pour de plus amples renseignements, veuillez communiquer avec nous.
Robert J. Kuhns, « Advanced Leveraging: The New Generation of TMs, » A TAUS Report, De Rijp, Pays-Bas, 2007
Centre for Translation Studies of the University of Leeds, « Increasing leveraging from shared industry data » disponible au http://www.translationautomation.com/technology/increasing-leveraging-from-shared-industry-data.html