Microsoft a annoncé qu'il mettra en œuvre l'intelligence artificielle (IA) et les réseaux de neurones profonds pour améliorer la traduction en temps réel de trois des langues les plus utilisées dans le sous-continent: l'hindi, le bengali et le tamoul. On s'attend à ce que l'utilisation de réseaux de neurones profonds fournisse des traductions plus précises et plus naturelles, ce qui serait un soulagement bienvenu pour quiconque a essayé de traduire une langue étrangère dans une langue indienne, seulement pour trouver des traductions étranges, non naturelles et souvent manifestement incorrectes.
Dans un communiqué de presse publié à l'occasion, Sundar Srinivasan, directeur général-AI et recherche chez Microsoft Inde, a déclaré que «Microsoft célèbre la diversité des langues en Inde et souhaite rendre le vaste Internet encore plus accessible. Nous soutenons les langues indiennes dans l’informatique depuis plus de deux décennies et, plus récemment, nous avons fait des progrès significatifs en matière d’accès vocal et de traduction automatique dans toutes les langues. ».
Si vous parlez l'une des trois langues susmentionnées et que vous souhaitez essayer les traductions basées sur l'IA de Microsoft, vous pouvez vous rendre sur le site Web de Bing Translate pour voir les traductions basées sur le réseau neuronal de Microsoft en action. La nouvelle technologie est également mise en œuvre dans l'application Microsoft Translator de la société, disponible sur Andriod et iOS. La technologie sera également utilisée pour améliorer les traductions sur Skype, ainsi que sur divers logiciels Office 365, tels que Word, Excel, PowerPoint et Outlook..
J'ai personnellement essayé de traduire le premier paragraphe de cet article en bengali (en utilisant Bing Translate), et les résultats étaient tout aussi déconcertants et incompréhensibles que n'importe quelle traduction en langue indienne. Si vous vous demandez comment il se compare à Google Translate et connaît le bengali, jetez un œil à la comparaison côte à côte ci-dessous. Notez qu'il s'agit d'une image composite avec la traduction de Google à droite et la traduction de Bing en bas.
Bien qu'il ne semble pas y avoir beaucoup de différence entre les deux à ce stade, la chose à noter ici est qu'avec les réseaux de neurones profonds, les traductions sont susceptibles de s'améliorer considérablement avec le temps, car la technologie a la capacité d'intégrer Compte "Des concepts comme le sexe (féminin, masculin, neutre), le niveau de politesse (argot, décontracté, écrit, formel) et le type de mot (verbe, nom, adjectif)".
Dans l'état actuel des choses, cependant, les traductions vers et depuis les langues indiennes continueront de rester insatisfaisantes, bien que les six premières langues indiennes figurent parmi les 20 langues les plus utilisées dans le monde. C'est parce que "Il n'y a pas assez de matériel sur Internet que nous pourrions utiliser pour former le système", selon Krishna Doss Mohan, Senior Program Manager, Microsoft India.
Espérons que, avec la plus grande population indienne commençant à utiliser Internet, nous aurons plus de contenu vernaculaire qui devrait aider à former ces réseaux de neurones profonds à fournir de meilleures traductions à l'avenir.