08-07-13

CAT en MT

cat, mt, spelling check, spelling checker, spellingcontroleDe discussie over automatisch vertalen is vaak verwrongen.

Het wordt dikwijls naar voren gebracht alsof automatisch vertalen een radicale breuk met het verleden betekent, waardoor vertalers plotseling overbodig zouden worden.

De discussie wordt tegenwoordig gevoed door MT, of "machine translation".

Maar om te beginnen ontwikkelt automatisch vertalen zich in werkelijkheid al decennialang.

Puur automatisch vertalen, genaamd machinevertalen, waarbij de tekst in de machine wordt gestoken en er kraakhelder en correct vertaald weer uitkomt, was al minstens twintig jaar geleden een onderzoeksterrein van universiteiten en hogescholen.

Maar het leverde niets op.

Tegelijk werd gewerkt aan CAT: "computer assisted translation".

De keuze voor CAT lag voor de hand: veel vertaalbureaus werken voor telkens dezelfde klanten, en vertalen telkens dezelfde typen teksten.

Die teksten veranderen weinig.

Een voorbeeld: toen de bluray-schijven verschenen, kwamen er ook toestellen voor op de markt. De eerste toestellen waren BD-lezers. Daarvoor moesten handleidingen worden geschreven. Pas later kwamen de BD-recorders. Die toestellen waren in de grond niets anders dan de oorspronkelijke lezers met extra functies. De handleidingen waren dus ook de oorspronkelijke handleidingen, aangevuld met de opnamefuncties.

Dat betekende dat de vertaler alleen maar de oorspronkelijke tekst moest aanvullen met de nieuwe vertaling. Waardoor een goede organisatie van al uitgevoerde vertalingen een grote hulp is.

En aangezien een computer in de eerste plaats vooral wordt gebruikt om grote hoeveelheden informatie te klasseren en te bewaren, ligt het voor de hand dat computers konden worden ingezet voor het bewaren en klasseren van al gemaakte vertalingen.

Het was dus een kwestie van twee teksten samen te brengen: de brontekst en de vertaling ervan. Dat leverde een bestand op van twee kolommen: in de ene kolom een bronzin, en in de tweede kolom de vertaling. Dat is zowat de meest eenvoudige databasestructuur die je kunt bedenken.

De flexibiliteit is niet erg groot, maar bij veel terugkerende klanten kan het wel degelijk tijd besparen.

Geleidelijk werden de CAT-programma's ingewikkelder door ze meer mogelijkheden te bieden.

Een tweede stap is dat het CAT-programma je niet alleen een vertaling heeft als de bronzin precies gelijk is aan een zin die al in het bestand met vertalingen staat, maar ook als de zin licht afwijkt. De eerdere zin krijg je dan als voorbeeldzin, die je moet aanpassen. Iedere eerstejaarsstudent informatica kan zoiets al in elkaar boksen.

De volgende truc was het samenvoegen van bestaande vertalingen. Bijvoorbeeld doordat een nieuwe zin gedeelten gemeenschappelijk heeft met twee andere zinnen. Of bijvoorbeeld door een extra bestand toe te voegen met vertalingen van termen.

Het sneller de computers werden, hoe meer functies CAT-programma's konden krijgen, en hoe beter de resultaten werden.

Toen CAT al gesofisticeerd was geworden, stond MT nog nergens, en op het moment dat de zuivere MT echt interessant werd, slaagde het er enkel in om het even goed te doen als CAT.

Qua toegepaste technieken evolueren de twee systemen in dezelfde richting.

Het is een trage evolutie, omdat ze gebonden wordt door de rekenkracht van computers.

In feite is het hele MT-idee mislukt doordat men hoopte MT-programma's te schrijven die over taal denken zoals een mens. Maar de programmaregels die daarvoor nodig waren, bleken veel ingewikkelder dan verwacht. Bovendien zijn die programmaregels afgeleid van de regels die zich in het hoofd van menselijke taalgebruikers bevinden, en had men over het hoofd gezien dat niet precies bekend is hoe die regels in ons hoofd zitten.

De huidige buzz over MT is dan ook vooral een hype, in het leven geroepen door mensen die iets proberen te verkopen.

MT levert geen betere resultaten dan CAT. Lange tijd waren de resultaten zelfs veel slechter. Het is een typische IT-hype: ze verkopen producten door ze aan te prijzen met behulp van de vage, theoretische ideeën die erachter zitten, maar verzwijgen wat de beperkingen zijn van wat je uiteindelijk koopt.

Het is zoals spellingcontrole: geen enkele computer doet eigenlijk echt aan spellingcontrole. Wat spellingcontrole in werkelijkheid doet, is niets anders dan controleren of de woorden die je typt ook in zijn woordenboek zitten, aangevuld met enkele regeltjes over tekencombinaties die niet voorkomen in de taal waarin je typt, zoals bijv. "aaa" in het Nederlands. Maar de spellingcontrole past niet de spellingregels toe, want die begrijpt hij niet. Vandaar dat wie de spellingregels niet kent en volledig vertrouwd op spellingcontrole, massa's spellingfouten riskeert.

MT en CAT zijn in hetzelfde bedje ziek.

13:57 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Actualiteit, Algemeen, taal | Permalink | Commentaren (0) | Tags: cat, mt, spelling check, spelling checker, spellingcontrole, machinevertalen, computer assisted translation, computer aided translation | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

22-06-13

Bruce Maylath (NDSU) op bezoek bij Vertaalbureau Motte

vertaalbureau motte, translaton office motte, bureau des traductions motte, bruce maylath, north dakota state university, cat, mt, glossariaVrijdagmiddag 21 juni kreeg Vertaalbureau Motte bezoek van prof. Bruce Maylath van de North Dakota State University (VS) om te spreken over technische vertalingen en technische communicators.

Prof. Maylath werkt aan een boek over het onderwerp, en toert momenteel door Europa.
In België lag in het bijzonder Vlaanderen op zijn route, in Frankrijk waren het Parijs en omgeving en de Alsace, in Denemarken Jutland, in Spanje Catalonië, en in Italië Venetië en omgeving.
Hij sluit zijn rondreis af in Oostenrijk, waar hij het Europese symposium over taal voor specifieke doeleinden bezoekt.

We wezen vooral op het belang van glossaria van de klant, zowel om het werk van de vertaler te vergemakkelijken, als het gebruik van de handleiding door wie het product koopt.
Al te vaak merken we dat handleidingen moeilijk kunnen zijn voor de eindgebruiker, omdat hij niet elke dag met die toestellen bezig is. Een tv of recorder stel je normaliter maar één keer in, nl. bij aankoop. De terminologie kan dan soms verwarrend zijn.
Ook bij machinevertalingen zou een glossarium al veel tijdwinst opleveren. Goede MT's steunen vaak op voorkeurtermen van de opdrachtgever, maar de vertaler moet dan wel weten dat die termen de voorkeur krijgen. Als hij dat niet weet, zal hij overbodig alles nogmaals controleren, en soms zelfs vervangen door andere woorden.

Maar we hadden het over veel meer dan dat: CAT, MT, computers, onderwijs, communicatieproblemen met tussenpersonen en projectmanagers, localisatie, de gevolgen van beroerde vertalingen... het passeerde allemaal de revue.

13:56 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Actualiteit, taal | Permalink | Commentaren (0) | Tags: vertaalbureau motte, translaton office motte, bureau des traductions motte, bruce maylath, north dakota state university, cat, mt, glossaria | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |