Denna artikel är ett exempel på vilken kvalitet man får när man översätter en text från engelska till svenska med en automatisk översättningstjänst. Programmet är mycket begränsat och vi anser att maskinöversättning endast är lämpligt för en överblick av vad texten handlar om. Oavsett hur bra ett program för automatisk översättning är kommer det aldrig att nå upp till den standard man får när man anlitar en professionell översättare.

 

Automatiskt översatt text

 

Historia maskinöversättning

 

Historien om maskinöversättning börjar i allmänhet på 1950-talet, även om arbetet finns från tidigare perioder. Georgetown experiment i 1954 deltar fullt automatisk översättning av mer än sextio ryska meningar till engelska. Försöket var en stor framgång och blev verklighet i en tid av betydande finansiering för maskinöversättning forskning. Författarna hävdade att inom tre eller fem år, maskinöversättning skulle vara ett löst problem.

Men den verkliga mycket långsammare, och efter ALPAC rapport 1966, som konstaterade att de tio år lång forskning hade underlåtit att uppfylla de förväntningar, var finansieringen minskar dramatiskt. Med början i slutet av 1980, som beräkningskraft ökade och blev billigare, började mer intresse för att visas i statistiska modeller för maskinöversättning.

Idag finns det fortfarande inget system som ger den heliga-graal som "helt automatisk hög kvalitet översättning" (FAHQT). Men det finns många program nu tillgängliga som kan ge användbara resultat inom stränga begränsningar, flera av dem finns på nätet, såsom Google Översätt och SYSTRAN-systemet som driver AltaVistas Babelfish.

 

Innehåll

 

1 Början
2 De första åren
3 1960-talet, den ALPAC rapporten och sjuttiotalet
4 1980-talet och början av 1990
5 Ny forskning
6 Se även
7 Anteckningar
8 Referenser
9 Se även

 

Början

 

Historien om maskinöversättning går tillbaka till det sjuttonde århundradet, då filosofer som Leibniz och Descartes lägga fram förslag till regler som skulle gälla ord mellan språken. Alla dessa förslag förblev teoretisk och inget resulterat i utvecklingen av en verklig maskin.

De första patenten för "översätta maskiner" översätta maskiner ansökan i mitten av 1930-talet. Ett förslag, av Georges Artsrouni var helt enkelt en automatisk tvåspråkig ordbok med papperstejp. Det andra förslaget, av Peter Troyanskii, en ryska, var mer detaljerad. Den omfattade både tvåspråkig ordbok, och en metod för att hantera grammatiska roller mellan språken, baserat på esperanto. Systemet har delats upp i tre faser: den första var för en infödd som talar redaktör i källorna språk att organisera ord till deras logiska former och funktioner syntaktiska, den andra var för maskinen att "översätta" dessa former till målspråket och den tredje var för en infödd som talar redaktör på målspråket för att normalisera denna produktion. Hans system förblev okända fram till slutet av 1950-talet, då datorer var väl kända.

 

De första åren

 

De första förslagen till maskinöversättning som använder datorer har lagts fram av Warren Weaver, en forskare vid Rockefeller Foundation, i hans juli, 1949 promemorian. Dessa förslag grundades på uppgifter teori, framgångar kod bryta under andra världskriget och spekulationer om universella grundläggande principerna för naturligt språk.

Några år efter dessa förslag, började forska på allvar vid många universitet i USA. Den 7 januari 1954, Georgetown-IBM experiment var den första offentliga demonstration av ett MT-system, som hölls i New York vid huvudkontoret för IBM. Demonstrationen var stor uppmärksamhet i tidningar och fick mycket allmänt intresse. Själva systemet var dock inte mer än vad som idag skulle kallas en "leksak" system, med bara 250 ord och översätta bara 49 noga utvalda ryska meningar till engelska - främst inom området kemi. Trots det uppmuntras anser att maskinöversättning var nära förestående - och särskilt bidragit till finansieringen av forskning, inte bara i USA utan i hela världen.

Tidiga system som används stora tvåspråkiga ordböcker och hand-kodade bestämmelser för fastställande av ordföljden i den slutliga kvaliteten. I förlängningen visade sig vara alltför restriktiva, och utvecklingen i lingvistik vid den tiden var till exempel generativ lingvistik och transformerande grammatik föreslagits för att förbättra kvaliteten på översättningarna.

Under denna tid var funktionsdugliga system installerade. United States Air Force används ett system som produceras av IBM och Washington University, medan Atomic Energy Commission i Förenta staterna och Euratom i Italien används ett system som utvecklats vid Georgetown University. Även kvaliteten på produktionen var dålig, mötte det ändå många av kundernas behov, främst när det gäller snabbhet.

I slutet av 1950-talet var ett argument som framförts av Yehoshua Bar-Hillel, en forskare som ställts av den amerikanska regeringen att undersöka maskinöversättning mot uppkomsten av "helautomatisk High Quality översättning" av maskiner. Argumentet är en av semantisk tvetydighet eller dubbel innebörd. Tänk på följande mening:

Little John letade efter hans leksakslådan. Till slut fann han den. Lådan var i pennan.

 

Ordet penna kan ha två betydelser, den första betydelsen något du använder för att skriva med, den andra betydelsen en behållare av något slag. För att en människa, är innebörden självklart, men han hävdade att utan en "universell encyklopedin" en maskin aldrig skulle kunna hantera detta problem. Idag kan denna typ av semantisk oklarhet lösas genom att skriva källtexter för maskinöversättning på ett kontrollerat språk som använder ett ordförråd där varje ord har exakt en mening.

1960-talet, den ALPAC rapporten och sjuttiotalet

 

Forskning på 1960-talet i både Sovjetunionen och USA framför allt fokuserat på den rysk-engelska par. Främst föremål för översättning var vetenskapliga och tekniska dokument, t.ex. artiklar från vetenskapliga tidskrifter. Den grova översättningar som var tillräckliga för att få en grundläggande förståelse av artiklarna. Om en artikel diskuteras ett ämne som anses vara av säkerhetsintresse att den har överlämnats till en översättare för en fullständig översättning, om inte, det var kasseras.

Ett stort slag kom till maskinöversättning forskning i 1966 med offentliggörandet av ALPAC rapporten. Rapporten var beställd av den amerikanska regeringen och som utförs av ALPAC, Automatic Language Processing rådgivande kommittén, en grupp med sju vetenskapsmän som sammankallats av den amerikanska regeringen 1964. Den amerikanska regeringen var oroad över att det fanns en brist på framsteg görs, trots stora utgifter. Kommissionen drog slutsatsen att maskinöversättning var dyrare, mindre noggranna och långsammare än mänsklig översättning, och detta trots att kostnaderna var maskinöversättning inte kan nå kvaliteten på en översättare inom den närmaste framtiden.

I rapporten rekommenderas dock att verktyg tas fram för stöd översättare - automatisk lexikon, till exempel - och att en del forskning inom datorlingvistik bör få fortsatt stöd.

Offentliggörandet av rapporten hade stor inverkan på forskning om maskinöversättning i USA, och i mindre utsträckning Sovjetunionen och Storbritannien. Forskning, åtminstone i USA, var nästan helt övergivna i över ett decennium. I Kanada fortsatte Frankrike och Tyskland, men forskning, 1970, var Systran system installerade för United States Air Force och sedan 1976 av kommissionen för Europeiska gemenskaperna. Den Meteo, utvecklat vid Université de Montréal, installerades i Kanada 1977 för att översätta väderprognoser från engelska till franska, och översatte nära 80.000 ord per dag eller 30 miljoner ord ett år tills det ersattes av en konkurrerande system på den 30 September, 2001.

Medan forskningen på 1960-talet koncentrerad till ett begränsat antal språk par och ingång, efterfrågan under 1970-talet var för låga priser system som kan översätta en rad tekniska och kommersiella handlingar. Denna uppmaning sporrade av ökningen av globaliseringen och efterfrågan på översättning i Kanada, Europa och Japan.

1980-talet och början av 1990

 

Genom 1980-talet hade både mångfalden och antalet installerade system för maskinöversättning ökat. Ett antal som förlitar sig på stordatorer teknik var i bruk, såsom Systran och logotyper.

Som en följd av förbättrad tillgång till mikrodatorer, det fanns en marknad för mindre slutet system för maskinöversättning. Många företag drog fördel av detta i Europa, Japan och USA. Man kom också kommer ut på marknaden i Kina, Östeuropa, Sydkorea och Sovjetunionen.

Under 1980-talet fanns det en hel del aktivitet i MT i Japan i synnerhet. Med den femte generationen datorn Japan för att hoppa över sin konkurrens inom hårdvara och mjukvara, samt ett projekt som många stora japanska elektronikföretag hittades själva är inblandade i var att skapa programvara för att översätta till och från engelska (Fujitsu, Toshiba, NTT, broder, Catena , Matsushita, Mitsubishi, Sharp, Sanyo, Hitachi, NEC, Panasonic, Kodensha, Nova, Oki).

Forskning under 1980-talet typiskt åberopade översättning genom några olika mellanhänder språklig representation med morfologiska tillsammans med syntaktisk och semantisk analys.

I slutet av 1980-talet fanns det en stor ökning i ett antal nya metoder för maskinöversättning. Ett system utvecklades på IBM som var baserad på statistiska metoder. Andra grupper används metoder som bygger på ett stort antal exempel översättningar, en teknik som nu kallas exempel baserad maskinöversättning. Ett utmärkande drag för båda dessa synsätt var bristen på syntaktiska och semantiska regler och tillit i stället på manipulering av stora textkorpusar.

Under 1990-talet, uppmuntrade av framgångar inom taligenkänning och talsyntes, forskning började i tal översättning.

Det fanns betydande ökning i användningen av maskinöversättning som en följd av införandet av billiga och mer kraftfulla datorer. Det var i början av 1990-talet som maskinöversättning började göra övergången från stora stordatorer mot persondatorer och arbetsstationer. Två företag som ledde till att PC-marknaden under en tid var Globalink och MicroTac, varefter en sammanslagning av de båda företagen (i december 1994) har befunnits vara i företagens intresse av båda. Intergraph och Systran började också att erbjuda PC-versioner vid denna tid. Webbplatser blev också tillgänglig på Internet, till exempel AltaVista's Babel Fish (med hjälp av Systran teknik) och Google Språkverktyg (också inledningsvis med Systran teknik enbart).

Ny forskning

 

Området maskinöversättning har under de senaste åren genomgått betydande förändringar. Närvarande en stor del av forskningen sker i statistisk maskinöversättning och exempel-baserade maskinöversättning. Idag är det bara ett fåtal företag använder statistisk maskinöversättning kommersiellt, t.ex. Språk Weaver (säljer översättning produkter och tjänster), använder Google (deras egen statistiskt MT-system för vissa språkkombination i Googles språkverktyg) och Microsoft (använder deras egen statistiskt MT-system för att översätta artiklar kunskapsbas). Det har varit ett förnyat intresse för hybridisering, med forskare som kombinerar syntaktiska och morfologiska (dvs, språkliga) kunskap till statistiksystem samt kombinera statistik med befintlig regel baserade system.

 

 

info@ce.se

 

08-55 11 07 00