Det er nesten deilig å se at allmektige Google innimellom gjør helt menneskelige feil (rent bortsett fra at deres menneskelige feil trolig er helt maskinell i akkurat dette tilfellet): Gawker har oppdaget at Googles engelsk til spansk-oversetter, bytter navnet Heath Ledger med Tom Cruise.
Per 24.1.2006 kl 17.37 stemmer dette fortsatt: I'll miss Heath Ledger oversettes til "Voy a perder Tom Cruise".
Hadde det ikke vært for at Heath Ledger døde natt til i går, er vel ikke dette noe mange ville brydd seg med. Men feilen er snodig uansett.
Google har en statistisk tilnærming til maskinoversettelse, i motsetning til gamle travere som Babelfish som er regelbaserte. Google sammenligner tekstmasser som eksisterer i original og i oversettelse, og prøver å lage automatiske regler ut fra statistikk på hvordan ord og fraser skal oversettes. Språk reduseres dermed på sett og vis til matematikk.
Hvilke spanske tekstkorpus de har tatt for seg som så systematisk bytter Heath Ledger med Tom Cruise, vet jeg ikke. Jeg har allerede funnet én post fra en av nettets sedvanlige konspiratorikergalninger, og han anklager scientologene for å ha tatt livet av Ledger. Siden Tom Cruise er verdens mest kjente scientolog, vil jeg anta at den teorien får påfyll etter Googles oversetter-tabbe :-)
Oppdatert kl. 23:07: Google oversetter nå Heath Ledger med Heath Ledger.
Comments