Losse woorden vertalen gaat via Google Translate over het algemeen prima, maar zodra er complexe zinsstructuren of cultureel specifieke uitdrukkingen bij komen kijken, is de kans op gekke zinsconstructies erg groot.

De afgelopen 13 jaar heeft Google al behoorlijk wat gecompliceerde technieken uit de kast getrokken om de kwaliteit van hun online vertaalmachine, Google Translate, te verbeteren. Tenminste, ik vind het vrij gecompliceerd klinken allemaal, maar ik heb dan ook weinig verstand van ICT en verwante ongein. Technieken als neural machine translation, rewriting-based paradigms en on-device processing (het klinkt allemaal als futuristisch Star Trek-geneuzel in mijn oren, maar zoals ik al zei, ik heb geen verstand van ICT) hebben zeker bijgedragen aan de kwaliteit en nauwkeurigheid van Google Translate. Toch levert Google Translate over het algemeen niet dezelfde kwaliteit als een menselijke vertaler. En dat is niet alleen onze mening, maar een opvatting die veel Language Service Providers (LSP’s) delen. Losse woorden vertalen gaat via Google Translate over het algemeen prima, maar zodra er complexe zinsstructuren of cultureel specifieke uitdrukkingen bij komen kijken, is de kans op gekke zinsconstructies erg groot.

Nu staan we bij Ludejo zeker niet negatief tegenover technologische ontwikkelingen die het vertaalproces sneller, nauwkeuriger en makkelijker kunnen maken. Hoewel we zelf geen gebruik maken van machine translation (tenzij de klant daar specifiek om heeft gevraagd, en dan besteden we altijd extra veel zorg aan het checken van de uiteindelijke vertaling), zijn we ons ervan bewust dat online vertaaltools zoals Google Translate voor sommige vertaalprojecten een uitkomst kunnen zijn (maar daarover straks meer). We waren dan ook erg blij met het nieuws dat Google weer een aantal aanpassingen heeft gemaakt om hun online vertaalmachine te verbeteren. Zo maken ze nu gebruik van een transformer encoder in combinatie met een recurrent neural network (RNN), een combinatie waardoor Google Translate ook ‘rommelige’ zinnen (bijvoorbeeld informele taal) kan vertalen zonder dat het vertaalproces vertraging oploopt (tenminste, dat is de theorie). En dat is slechts een van de nieuwe aanpassingen die het team van Google heeft doorgevoerd.  

Mocht je meer willen weten over alle technische snufjes die Google Translate gebruikt en hoe deze precies werken, check dan deze blog op VentureBeat over de manier waarop Google Artificial Intelligence gebruikt om het vertaalproces van hun online vertaalmachine te verbeteren (online content over alles wat met taal te maken heeft vind ik erg interessant, maar informatievoorziening over ICT en transformative technology laat ik liever aan de professionals over).

Nu hoor ik je denken: “Als je er zo weinig vanaf weet, waarom dan toch deze blog over Google Translate?” Vooral omdat ik wil benadrukken hoe belangrijk en waardevol technologische ontwikkelingen en AI zijn, zeker in de vertaalsector. “Huh, maar je zei net nog dat jullie geen gebruik maken van machine translation?” Klopt, maar het gaat hier over iets dat veel groter is dan online vertaaltools zoals Google Translate.

Iedereen die ons kent, weet dat we een sociaal betrokken vertaal- en communicatiebureau zijn (ons logo is niet voor niets een hart). Ludejo is gebouwd op een fundament van liefde. We houden van ons beroep, onze klanten en ons team. Ook vinden we het belangrijk om terug te geven. Dit doen we onder andere door het organiseren van fundraisers voor liefdadigheids- en non-profitorganisaties zoals Translators Without Borders (TWB).

Een van de dingen die TWB doet, is het verbeteren van communicatie tussen in crisis verkerende bevolkingsgroepen en humanitaire hulpverleners. Juist in crisissituaties is het belangrijk om snel te handelen; elke seconde telt. Het snel kunnen leveren van een vertaling is dan ook van het allergrootste belang, wat me weer terugbrengt bij de technologische ontwikkelingen op het gebied van machine translation. Want zolang we blijven streven naar snellere en nauwkeurigere vertaaltools, kunnen organisaties zoals TWB sneller hulp bieden waar nodig.

Daarnaast kan machine translation TWB helpen bij het verbeteren van tweerichtingscommunicatie bij gemarginaliseerde talen. In 2019 ontving TWB financiële steun van The Cisco Foundation om datasets voor machine translation te ontwikkelen voor twee gemarginaliseerde talen. Aanleiding voor de donatie was een geslaagd pilot project van TWB’s Gamayun programma waarbij TWB speciaal voor het World Food Programme een machine translation tool ontwikkelde voor het Levantijns Arabisch. En alsof het allemaal nog niet indrukwekkend en bewonderenswaardig genoeg is, lukte het ze om het project in slechts zes weken af te ronden (je snapt waarschijnlijk wel waarom het thema van onze volgende fundraiser voor TWB ‘With Great Power for TWB’ is, want deze mensen zijn gewoon superhelden).