Översättning - Framtidens Teknik

0 / 5 000

Vad är NMT?

2016 Gjorde Google en ny typ av översättningsteknik som heter Neural Machine Translation (NMT). det är ett system som lär sig översätta text på ett mycket smartare sätt än tidigare program. Innan NMT var översättningsprogram ganska dåliga på att förstå att samma ord kan betyda olika saker beroende på sammanhanget. Med NMT förbättrades till exempel översättningar från engelska till kinesiska med 55 procent, en enorm skillnad.

Systemet fungerar ungefär som en hjärna med två delar. Första delen läser och förstår texten som ska översättas, och den andra delen skriver ut översättningen. Emellan dessa processer finns något som kallas för en uppmärksamhets mekanism, vilket gör att systemet kan hålla koll på vilket ord i originaltexten det jobbar med just nu. Det är som att NMT läser en mening och håller fingret på ett ord medan du letar upp vad det betyder.

Att översättningarna blev så bra betyder också att fler människor kan ta del av information på webben. Innan NMT var automatiska översättningar ofta så dåliga att de var mer förvirrande än hjälpsamma. Detta stängde ut många människor som inte talar stora världsspråk som engelska.

Vilken roll har Stora Språkmodeller?

Efter NMT gjordes stora språkmodeller (LLM) tillgängliga till allmänheten. Några exempel på LLM:s är Chat GPT, Claude och Gemini. Dessa program har läst jättestora mängder text från internet och har lärt sig att förstå språk på en mycket djupare nivå.

Det som gör dessa modeller extra bra är bland annat att de förstår olika kulturella skillnader. De vet till exempel att ett uttryck som är roligt på svenska kanske inte fungerar direkt översatt till engelska, och kan hitta ett bättre alternativ. De kan också lära sig nya typer av översättningar väldigt snabbt om man ger dem några exempel. Dessutom kan moderna versioner av dessa program översätta text som finns i bilder eller videor, inte bara vanlig skriven text.

Det här är viktigt för tillgängligheten på webben eftersom att internet idag används för allt från att söka medicinsk information till att fylla i myndighetsblanketter. Om man inte förstår språket är man i princip utestängd. Med LLM:er kan webbplatser erbjuda bra översättningar till hundratals språk, vilket gör att fler människor faktiskt kan delta i samhället på lika villkor.

Hur mäts ett översättningsprograms förmåga?

Hur mäter man om en översättning är bra?

För att kunna jämföra hur bra olika översättningsprogram är behöver man något sätt att mäta kvaliteten. Det finns två vanliga metoder.

Den första kallas BLEU och uppfanns år 2002. Den fungerar genom att jämföra hur många ord och ordkombinationer som stämmer överens mellan programmets översättning och en översättning gjord av en människa. Det är ett praktiskt sätt att mäta, men det har en stor nackdel – det förstår inte riktigt betydelsen av meningar. En mening kan vara korrekt översatt men ändå få låga poäng om den inte använder exakt samma ord som referens översättningen.

Den andra metoden kallas COMET och är betydligt modernare. Den använder AI för att förstå om en översättning faktiskt betyder samma sak som originalet, inte bara om den använder samma ord. Det gör att den stämmer bättre överens med hur en riktig människa skulle bedöma en översättning. För tillgänglighet är det här extra viktigt, för det är ju förståelsen av innehållet som avgör om informationen faktiskt når fram till rätt person.

Källor

https://www.nimdzi.com/history-of-machine-translation/

https://arxiv.org/pdf/2304.04675

https://en.wikipedia.org/wiki/Neural_machine_translation

https://docs.cloud.google.com/translate/docs/advanced/nmt-model