08-07-13

CAT en MT

cat, mt, spelling check, spelling checker, spellingcontroleDe discussie over automatisch vertalen is vaak verwrongen.

Het wordt dikwijls naar voren gebracht alsof automatisch vertalen een radicale breuk met het verleden betekent, waardoor vertalers plotseling overbodig zouden worden.

De discussie wordt tegenwoordig gevoed door MT, of "machine translation".

Maar om te beginnen ontwikkelt automatisch vertalen zich in werkelijkheid al decennialang.

Puur automatisch vertalen, genaamd machinevertalen, waarbij de tekst in de machine wordt gestoken en er kraakhelder en correct vertaald weer uitkomt, was al minstens twintig jaar geleden een onderzoeksterrein van universiteiten en hogescholen.

Maar het leverde niets op.

Tegelijk werd gewerkt aan CAT: "computer assisted translation".

De keuze voor CAT lag voor de hand: veel vertaalbureaus werken voor telkens dezelfde klanten, en vertalen telkens dezelfde typen teksten.

Die teksten veranderen weinig.

Een voorbeeld: toen de bluray-schijven verschenen, kwamen er ook toestellen voor op de markt. De eerste toestellen waren BD-lezers. Daarvoor moesten handleidingen worden geschreven. Pas later kwamen de BD-recorders. Die toestellen waren in de grond niets anders dan de oorspronkelijke lezers met extra functies. De handleidingen waren dus ook de oorspronkelijke handleidingen, aangevuld met de opnamefuncties.

Dat betekende dat de vertaler alleen maar de oorspronkelijke tekst moest aanvullen met de nieuwe vertaling. Waardoor een goede organisatie van al uitgevoerde vertalingen een grote hulp is.

En aangezien een computer in de eerste plaats vooral wordt gebruikt om grote hoeveelheden informatie te klasseren en te bewaren, ligt het voor de hand dat computers konden worden ingezet voor het bewaren en klasseren van al gemaakte vertalingen.

Het was dus een kwestie van twee teksten samen te brengen: de brontekst en de vertaling ervan. Dat leverde een bestand op van twee kolommen: in de ene kolom een bronzin, en in de tweede kolom de vertaling. Dat is zowat de meest eenvoudige databasestructuur die je kunt bedenken.

De flexibiliteit is niet erg groot, maar bij veel terugkerende klanten kan het wel degelijk tijd besparen.

Geleidelijk werden de CAT-programma's ingewikkelder door ze meer mogelijkheden te bieden.

Een tweede stap is dat het CAT-programma je niet alleen een vertaling heeft als de bronzin precies gelijk is aan een zin die al in het bestand met vertalingen staat, maar ook als de zin licht afwijkt. De eerdere zin krijg je dan als voorbeeldzin, die je moet aanpassen. Iedere eerstejaarsstudent informatica kan zoiets al in elkaar boksen.

De volgende truc was het samenvoegen van bestaande vertalingen. Bijvoorbeeld doordat een nieuwe zin gedeelten gemeenschappelijk heeft met twee andere zinnen. Of bijvoorbeeld door een extra bestand toe te voegen met vertalingen van termen.

Het sneller de computers werden, hoe meer functies CAT-programma's konden krijgen, en hoe beter de resultaten werden.

Toen CAT al gesofisticeerd was geworden, stond MT nog nergens, en op het moment dat de zuivere MT echt interessant werd, slaagde het er enkel in om het even goed te doen als CAT.

Qua toegepaste technieken evolueren de twee systemen in dezelfde richting.

Het is een trage evolutie, omdat ze gebonden wordt door de rekenkracht van computers.

In feite is het hele MT-idee mislukt doordat men hoopte MT-programma's te schrijven die over taal denken zoals een mens. Maar de programmaregels die daarvoor nodig waren, bleken veel ingewikkelder dan verwacht. Bovendien zijn die programmaregels afgeleid van de regels die zich in het hoofd van menselijke taalgebruikers bevinden, en had men over het hoofd gezien dat niet precies bekend is hoe die regels in ons hoofd zitten.

De huidige buzz over MT is dan ook vooral een hype, in het leven geroepen door mensen die iets proberen te verkopen.

MT levert geen betere resultaten dan CAT. Lange tijd waren de resultaten zelfs veel slechter. Het is een typische IT-hype: ze verkopen producten door ze aan te prijzen met behulp van de vage, theoretische ideeën die erachter zitten, maar verzwijgen wat de beperkingen zijn van wat je uiteindelijk koopt.

Het is zoals spellingcontrole: geen enkele computer doet eigenlijk echt aan spellingcontrole. Wat spellingcontrole in werkelijkheid doet, is niets anders dan controleren of de woorden die je typt ook in zijn woordenboek zitten, aangevuld met enkele regeltjes over tekencombinaties die niet voorkomen in de taal waarin je typt, zoals bijv. "aaa" in het Nederlands. Maar de spellingcontrole past niet de spellingregels toe, want die begrijpt hij niet. Vandaar dat wie de spellingregels niet kent en volledig vertrouwd op spellingcontrole, massa's spellingfouten riskeert.

MT en CAT zijn in hetzelfde bedje ziek.

13:57 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Actualiteit, Algemeen, taal | Permalink | Commentaren (0) | Tags: cat, mt, spelling check, spelling checker, spellingcontrole, machinevertalen, computer assisted translation, computer aided translation | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

12-10-11

Kana-site is verhuisd

logo.pngDe url van de site van de Nederlandse manga-uitgeverij Kana is verhuisd naar
http://www.mangakana.com/nl/

Eigenlijk is dat el een hele tijd het geval, maar sommige fans merken het nu pas.
Kana NL was vroeger van het Franse bedrijf Kana, en op de site van Kana FR stonden ook de gegevens van Kana NL.
Toen werd Kana NL overgenomen door Ballon Media.
De pagina's van Kana NL moesten dus vroeg of laat wel verdwijnen van de site van de Franse Kana.
De Franse Kana heeft echter nog zowat drie jaar doorverwezen naar de Nederlandse Kana, om de tijd te geven om ons aan te passen.
Alleen heeft blijkbaar niemand de links aangepast, en alle oude verwijzingen via de Franse Kana werken sinds een week of zo niet meer.
Nu moet het dus rechtstreeks via http://www.mangakana.com/nl/, maar alles is er dus nog.

Kana NL

13:50 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Actualiteit, Algemeen, Vrije tijd, Web | Permalink | Commentaren (0) | Tags: manga, kana, kana nl | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

09-05-07

Taalprobleem: schuld

FOUT Het was de fout van zijn impresario dat hij het niet had gemaakt als entertainer.
GOED Het was de schuld van zijn impresario dat hij het niet had gemaakt als entertainer.

VERKLARING
Iets is iemands schuld. Vaak zie je fout staan, onder invloed van het Engels en het Frans, maar dat is fout (en niemands schuld).

13:56 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Algemeen | Permalink | Commentaren (0) | Tags: taal, taalprobleem, taalkunde | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

05-05-07

tisgodgeklaagd, tekeningen en teksten door Johnny Bekaert

Er is een nieuw boek verschenen van Johnny Bekaert: "tisgodgeklaagd".
In "Karamellosofie" waren alleen de tekeningen van Johnny Bekaert, maar nu heeft hij in dezelfde stijl zijn eigen teksten geïllustreerd.
De tekeningen kunnen alleen maar geslaagd zijn.
Wie een voorproefje van de teksten wil, vindt die op de site van Poespaproducties.
Kijken kost niks.

20:38 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Algemeen | Permalink | Commentaren (0) | Tags: literatuur, poezie, bekaert | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

29-12-06

Recensie "Het oude Egypte in woord en beeld", door Toby Wilkinson

Recensie: Het oude Egypte in woord en beeld, door Toby Wilkinson

recensent: Peter Motte

onder auspiciën van De voormalige Tijdlijn en Vertaalbureau Motte

Voor mijn gevoel valt de wereldgeschiedenis uiteen in twee delen: alles van Egypte, en alles daarna. Het Oud-Egyptische rijk begint in de mist der tijden rond 3000 voor Christus, met nog zelfs daarvoor farao's met misschien farao Ka en misschien farao Schorpioen. De zekerheden beginnen pas vanaf ongeveer 2950 voor onze jaartelling, met farao Narmer, de 1e heerser van de 1e dynastie. Andere bronnen kunnen andere data vermelden, wat deze bron, Het oude Egypte in woord en beeld, door Toby Wilkinson, ook erkent.

De laatste dynastie eindigde met de mysterieuze dood van Cleopatra VII en Antonius in 30 voor Christus, waarna het gebied definitief bij het Romeinse rijk werd ingelijfd*. Maar terwijl het Oude Egypte zowat 3000 jaar onafhankelijk was geweest, en in die periode enorme culturele monumenten verwezenlijkte die ook nu nog tot de verbeelding spreken en zelfs zo veel mummies produceerde dat ze eeuwen later werden gebruikt als brandstof voor stoomtreinen, hield de jonge parvenu het nog geen duizend jaar uit. En de rijken die volgden deden het niet veel beter.

Het hoeft dan ook niet te verwonderen dat de geschiedenis van het Imperium van de Nijl een onoverzichtelijke schat aan gegevens opleverde: farao's, bouwwerken, geschriften, gebruiksvoorwerpen, historische gebeurtenissen... Ondanks het lange bestaan was het rijk verbluffend stabiel. Religieuze veranderingen kwamen voor, maar in geringe mate. Het isolement van Egypte beschutte het eeuwenlang tegen invallers en invloeden. Zelfs tot in de tijd van Cleopatra VII kon het slechts langs smalle corridors worden aangevallen.

Het was trouwens niet door haar schoonheid dat Cleopatra indruk maakte op de Romeinse toppolitici, maar door haar intelligentie: ze sprak ongeveer 6 talen, waardoor ze met heel veel heersers zonder tussenkomst van tolken kon onderhandelen. Dat was in die tijd erg uitzonderlijk. Ze oogde wat plomp, maar haar geest was kwiek genoeg om te weten hoe ze indruk moest maken op de Romeinen.**

Wie al eens een programma over het Eeuwenoude Zandrijk volgt, er een van de talrijke boeken van Christian Jacq over leest, of een van de vele stripverhalen, kan best een woordenboek over de periode gebruiken, en dat is wat dit "Het oude Egypte in woord en beeld" is. Het is een alfabetische behandeling van de belangrijkste begrippen uit de egyptologie, voorzien van dwarsdoorsnedetekeningen van de belangrijkste gebouwen en kaarten van de archeologische sites. De lemma zijn geïllustreerd met z/w- en kleurenfoto's van beelden, gebouwen, en reproducties van schilderijen en tekeningen.

De hiërogliefen worden nogal kort behandeld. Daarvoor geef ik de voorkeur aan "Writing Systems" van Florian Coulmas***. Niettemin is dit "Het oude Egypte in woord en beeld" een handige verzameling basisbegrippen geworden. We betreuren wel dat zelfs de literatuurlijst geen aandacht besteedt aan de Franse werken. Frankrijk heeft sinds Napoleon een enorme traditie op het gebied van egyptologie opgebouwd. Was het niet een Fransman, Champollion, die uiteindelijk de hiëroglyfen ontcijferde?

* en **: zie "Cleopatra. Politiek en propaganda in de Oudheid", door prof. dr. H. Volkmann, 1969, Antwerpen/Brussel/Gent/Leuven, Uitgeversmaatschappij W. De Haan N.V. - N. V. Standaard Boekhandel

***: "The Blackwell Encyclopedia of Writing Systems", door Florian Coulmas, 1999, 1996, Oxford, Blackwell Publishers Ltd., 108 Cowley Road, Oxford OX4 1JF, VK

Het oude Egypte in woord en beeld, door Toby Wilkinson, 2006, Tirion, geïllustreerd in kleur met kaarten, lijst met literatuursuggesties, gebonden met fotocollega op platten, collage herhaald op de omslag met flappen, oorspronkelijk: "The Thames & Hudson Dictionary of Ancient Egypte". 26,3 x 19 x 2,5 cm, 271 p's, ISBN 90-4390-909-9.

Prijs: 39,95 euro

21:26 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Algemeen | Permalink | Commentaren (0) | Tags: geschiedenis, egyptologie | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

08-12-06

Humor ??

Ik weet niet of dit onder humor klasseert: link
Je kunt het ook als visionair zien, maar louter zo bekeken lijkt het me wat inspiratieloos.

12:06 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Algemeen | Permalink | Commentaren (0) | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |

26-10-06

Taalprobleem: te veel / teveel

FOUT Ik rook misschien wel teveel sigaretten tijdens het koffie-uur, maar anders word ik slechtgehumeurd.

GOED Ik rook misschien wel te veel sigaretten tijdens het koffie-uur, maar anders word ik slechtgehumeurd.

VERKLARING
'Te veel' schrijf je hier in twee woorden. 'Teveel' in één woord is het zelfstandig naamwoord dat 'overmaat' betekent, zoals in 'Er is een teveel aan soaps op de tv.' Maar: 'Er zijn te veel soaps op de tv.'
Referentie: "Handboek Spelling" door J. De Schrijver en A. Neijt, Wolters Plantyn, 2005

17:05 Gepost door Peter Motte, vertaler van Vertaalbureau Motte in Algemeen | Permalink | Commentaren (0) | Tags: taal, taalprobleem, taalkunde | |  del.icio.us | | Digg! Digg |  Facebook | | Pin it! |  Print | | |