Mer än 400 miljoner människor i Indien använder internet, och fler kommer på nätet varje dag. Men den stora majoriteten av Indiens innehåll på nätet är på engelska, som endast 20 procent av landets befolkning talar – vilket innebär att de flesta indier har svårt att hitta innehåll och tjänster på sitt eget språk.
Att bygga för alla innebär först och främst att saker och ting ska fungera på de språk som människor talar. Därför har vi nu tagit vår nya neurala maskinöversättningsteknik i bruk för översättningar mellan engelska och nio vanliga indiska språk – hindi, bengali, marathi, gujarati, punjabi, tamil, telugu, malayalam och kannada.
Neurala maskinöversättningar översätter hela meningar i taget i stället för delar av en mening och använder det bredare sammanhanget för att hitta den mest relevanta översättningen. Resultatet är översättningar av högre kvalitet och med mer mänsklig klang.
Precis som det är lättare att lära sig ett språk när man redan kan ett liknande språk, talar vår neurala teknik varje språk bättre när den lär sig flera språk samtidigt. Vi har till exempel mycket mer provdata för hindi än för dess släktingar marathi och bengali, men när vi tränar dem alla tillsammans förbättras översättningarna mer än om vi hade tränat var och en för sig.
Förbättringarna av Google Translate i Indien ansluter sig till flera andra uppdateringar som vi tillkännagav vid ett evenemang i New Delhi i dag, bland annat neural maskinöversättning i Chrome och att Rajpal & Sons hindiordbok är online så att det är lättare för hinditalare att hitta ordbetydelser direkt i sökresultaten. Alla dessa förbättringar bidrar till att göra webben mer användbar för hundratals miljoner indier, och hjälper dem att dra nytta av internets fulla värde.