Denna artikel är ett exempel på vilken
kvalitet man får när man översätter en text från
engelska till svenska med en automatisk
översättningstjänst.
Programmet är
mycket begränsat och vi anser att
maskinöversättning endast är lämpligt för en
överblick av vad texten handlar om. Oavsett
hur bra ett program för automatisk översättning
är kommer det aldrig att nå upp till den
standard man får när man anlitar en
professionell översättare.
Automatiskt översatt text
Historia
maskinöversättning
Historien om
maskinöversättning börjar i allmänhet på
1950-talet, även om arbetet finns från
tidigare perioder. Georgetown experiment i
1954 deltar fullt automatisk översättning av
mer än sextio ryska meningar till engelska.
Försöket var en stor framgång och blev
verklighet i en tid av betydande
finansiering för maskinöversättning
forskning. Författarna hävdade att inom tre
eller fem år, maskinöversättning skulle vara
ett löst problem.
Men den verkliga mycket långsammare, och
efter ALPAC rapport 1966, som konstaterade
att de tio år lång forskning hade underlåtit
att uppfylla de förväntningar, var
finansieringen minskar dramatiskt. Med
början i slutet av 1980, som beräkningskraft
ökade och blev billigare, började mer
intresse för att visas i statistiska
modeller för maskinöversättning.
Idag finns det fortfarande inget system som
ger den heliga-graal som "helt automatisk
hög kvalitet översättning" (FAHQT). Men det
finns många program nu tillgängliga som kan
ge användbara resultat inom stränga
begränsningar, flera av dem finns på nätet,
såsom Google Översätt och SYSTRAN-systemet
som driver AltaVistas Babelfish.
Innehåll
1 Början
2 De första åren
3 1960-talet, den ALPAC rapporten och
sjuttiotalet
4 1980-talet och början av 1990
5 Ny forskning
6 Se även
7 Anteckningar
8 Referenser
9 Se även
Början
Historien om
maskinöversättning går tillbaka till det
sjuttonde århundradet, då filosofer som
Leibniz och Descartes lägga fram förslag
till regler som skulle gälla ord mellan
språken. Alla dessa förslag förblev
teoretisk och inget resulterat i
utvecklingen av en verklig maskin.
De första patenten för "översätta maskiner"
översätta maskiner ansökan i mitten av
1930-talet. Ett förslag, av Georges
Artsrouni var helt enkelt en automatisk
tvåspråkig ordbok med papperstejp. Det andra
förslaget, av Peter Troyanskii, en ryska,
var mer detaljerad. Den omfattade både
tvåspråkig ordbok, och en metod för att
hantera grammatiska roller mellan språken,
baserat på esperanto. Systemet har delats
upp i tre faser: den första var för en
infödd som talar redaktör i källorna språk
att organisera ord till deras logiska former
och funktioner syntaktiska, den andra var
för maskinen att "översätta" dessa former
till målspråket och den tredje var för en
infödd som talar redaktör på målspråket för
att normalisera denna produktion. Hans
system förblev okända fram till slutet av
1950-talet, då datorer var väl kända.
De första åren
De första
förslagen till maskinöversättning som
använder datorer har lagts fram av Warren
Weaver, en forskare vid Rockefeller
Foundation, i hans juli, 1949 promemorian.
Dessa förslag grundades på uppgifter teori,
framgångar kod bryta under andra
världskriget och spekulationer om
universella grundläggande principerna för
naturligt språk.
Några år efter dessa förslag, började forska
på allvar vid många universitet i USA. Den 7
januari 1954, Georgetown-IBM experiment var
den första offentliga demonstration av ett
MT-system, som hölls i New York vid
huvudkontoret för IBM. Demonstrationen var
stor uppmärksamhet i tidningar och fick
mycket allmänt intresse. Själva systemet var
dock inte mer än vad som idag skulle kallas
en "leksak" system, med bara 250 ord och
översätta bara 49 noga utvalda ryska
meningar till engelska - främst inom området
kemi. Trots det uppmuntras anser att
maskinöversättning var nära förestående -
och särskilt bidragit till finansieringen av
forskning, inte bara i USA utan i hela
världen.
Tidiga system som används stora tvåspråkiga
ordböcker och hand-kodade bestämmelser för
fastställande av ordföljden i den slutliga
kvaliteten. I förlängningen visade sig vara
alltför restriktiva, och utvecklingen i
lingvistik vid den tiden var till exempel
generativ lingvistik och transformerande
grammatik föreslagits för att förbättra
kvaliteten på översättningarna.
Under denna tid var funktionsdugliga system
installerade. United States Air Force
används ett system som produceras av IBM och
Washington University, medan Atomic Energy
Commission i Förenta staterna och Euratom i
Italien används ett system som utvecklats
vid Georgetown University. Även kvaliteten
på produktionen var dålig, mötte det ändå
många av kundernas behov, främst när det
gäller snabbhet.
I slutet av 1950-talet var ett argument som
framförts av Yehoshua Bar-Hillel, en
forskare som ställts av den amerikanska
regeringen att undersöka maskinöversättning
mot uppkomsten av "helautomatisk High
Quality översättning" av maskiner.
Argumentet är en av semantisk tvetydighet
eller dubbel innebörd. Tänk på följande
mening:
Little John letade efter hans leksakslådan.
Till slut fann han den. Lådan var i pennan.
Ordet penna
kan ha två betydelser, den första betydelsen
något du använder för att skriva med, den
andra betydelsen en behållare av något slag.
För att en människa, är innebörden
självklart, men han hävdade att utan en
"universell encyklopedin" en maskin aldrig
skulle kunna hantera detta problem. Idag kan
denna typ av semantisk oklarhet lösas genom
att skriva källtexter för maskinöversättning
på ett kontrollerat språk som använder ett
ordförråd där varje ord har exakt en mening.
1960-talet, den ALPAC rapporten och
sjuttiotalet
Forskning på
1960-talet i både Sovjetunionen och USA
framför allt fokuserat på den rysk-engelska
par. Främst föremål för översättning var
vetenskapliga och tekniska dokument, t.ex.
artiklar från vetenskapliga tidskrifter. Den
grova översättningar som var tillräckliga
för att få en grundläggande förståelse av
artiklarna. Om en artikel diskuteras ett
ämne som anses vara av säkerhetsintresse att
den har överlämnats till en översättare för
en fullständig översättning, om inte, det
var kasseras.
Ett stort slag kom till maskinöversättning
forskning i 1966 med offentliggörandet av
ALPAC rapporten. Rapporten var beställd av
den amerikanska regeringen och som utförs av
ALPAC, Automatic Language Processing
rådgivande kommittén, en grupp med sju
vetenskapsmän som sammankallats av den
amerikanska regeringen 1964. Den amerikanska
regeringen var oroad över att det fanns en
brist på framsteg görs, trots stora
utgifter. Kommissionen drog slutsatsen att
maskinöversättning var dyrare, mindre
noggranna och långsammare än mänsklig
översättning, och detta trots att
kostnaderna var maskinöversättning inte kan
nå kvaliteten på en översättare inom den
närmaste framtiden.
I rapporten rekommenderas dock att verktyg
tas fram för stöd översättare - automatisk
lexikon, till exempel - och att en del
forskning inom datorlingvistik bör få
fortsatt stöd.
Offentliggörandet av rapporten hade stor
inverkan på forskning om maskinöversättning
i USA, och i mindre utsträckning
Sovjetunionen och Storbritannien. Forskning,
åtminstone i USA, var nästan helt övergivna
i över ett decennium. I Kanada fortsatte
Frankrike och Tyskland, men forskning, 1970,
var Systran system installerade för United
States Air Force och sedan 1976 av
kommissionen för Europeiska gemenskaperna.
Den Meteo, utvecklat vid Université de
Montréal, installerades i Kanada 1977 för
att översätta väderprognoser från engelska
till franska, och översatte nära 80.000 ord
per dag eller 30 miljoner ord ett år tills
det ersattes av en konkurrerande system på
den 30 September, 2001.
Medan forskningen på 1960-talet koncentrerad
till ett begränsat antal språk par och
ingång, efterfrågan under 1970-talet var för
låga priser system som kan översätta en rad
tekniska och kommersiella handlingar. Denna
uppmaning sporrade av ökningen av
globaliseringen och efterfrågan på
översättning i Kanada, Europa och Japan.
1980-talet och början av 1990
Genom
1980-talet hade både mångfalden och antalet
installerade system för maskinöversättning
ökat. Ett antal som förlitar sig på
stordatorer teknik var i bruk, såsom Systran
och logotyper.
Som en följd av förbättrad tillgång till
mikrodatorer, det fanns en marknad för
mindre slutet system för maskinöversättning.
Många företag drog fördel av detta i Europa,
Japan och USA. Man kom också kommer ut på
marknaden i Kina, Östeuropa, Sydkorea och
Sovjetunionen.
Under 1980-talet fanns det en hel del
aktivitet i MT i Japan i synnerhet. Med den
femte generationen datorn Japan för att
hoppa över sin konkurrens inom hårdvara och
mjukvara, samt ett projekt som många stora
japanska elektronikföretag hittades själva
är inblandade i var att skapa programvara
för att översätta till och från engelska
(Fujitsu, Toshiba, NTT, broder, Catena ,
Matsushita, Mitsubishi, Sharp, Sanyo,
Hitachi, NEC, Panasonic, Kodensha, Nova,
Oki).
Forskning under 1980-talet typiskt åberopade
översättning genom några olika mellanhänder
språklig representation med morfologiska
tillsammans med syntaktisk och semantisk
analys.
I slutet av 1980-talet fanns det en stor
ökning i ett antal nya metoder för
maskinöversättning. Ett system utvecklades
på IBM som var baserad på statistiska
metoder. Andra grupper används metoder som
bygger på ett stort antal exempel
översättningar, en teknik som nu kallas
exempel baserad maskinöversättning. Ett
utmärkande drag för båda dessa synsätt var
bristen på syntaktiska och semantiska regler
och tillit i stället på manipulering av
stora textkorpusar.
Under 1990-talet, uppmuntrade av framgångar
inom taligenkänning och talsyntes, forskning
började i tal översättning.
Det fanns betydande ökning i användningen av
maskinöversättning som en följd av
införandet av billiga och mer kraftfulla
datorer. Det var i början av 1990-talet som
maskinöversättning började göra övergången
från stora stordatorer mot persondatorer och
arbetsstationer. Två företag som ledde till
att PC-marknaden under en tid var Globalink
och MicroTac, varefter en sammanslagning av
de båda företagen (i december 1994) har
befunnits vara i företagens intresse av
båda. Intergraph och Systran började också
att erbjuda PC-versioner vid denna tid.
Webbplatser blev också tillgänglig på
Internet, till exempel AltaVista's Babel
Fish (med hjälp av Systran teknik) och
Google Språkverktyg (också inledningsvis med
Systran teknik enbart).
Ny forskning
Området
maskinöversättning har under de senaste åren
genomgått betydande förändringar. Närvarande
en stor del av forskningen sker i statistisk
maskinöversättning och exempel-baserade
maskinöversättning. Idag är det bara ett
fåtal företag använder statistisk
maskinöversättning kommersiellt, t.ex. Språk
Weaver (säljer översättning produkter och
tjänster), använder Google (deras egen
statistiskt MT-system för vissa
språkkombination i Googles språkverktyg) och
Microsoft (använder deras egen statistiskt
MT-system för att översätta artiklar
kunskapsbas). Det har varit ett förnyat
intresse för hybridisering, med forskare som
kombinerar syntaktiska och morfologiska
(dvs, språkliga) kunskap till
statistiksystem samt kombinera statistik med
befintlig regel baserade system.