Kynjahalli í vélþýðingum – Eiríkur Rögnvaldsson

Nýlega var mikið skrifað um ágæta grein sem Agnes Sólmundsdóttir, Dagbjört Guðmundsdóttir, Lilja Björk Stefánsdóttir og Anton Karl Ingason birtu í Ritinu í lok síðasta árs. Þar er sagt frá kynjahalla í þýðingum Google Translate, sem kemur fram á þann hátt að ensk lýsingarorð sem ekki beygjast í kynjum eru ýmist þýdd með karlkyns- eða kvenkynsformi á íslensku þegar ekki er hægt að ráða kynið af samhengi. Það virðist þó ekki vera tilviljanakennt hvort kynið er notað, heldur fer eftir því hvert lýsingarorðið er – sum lýsingarorð virðast vera karllæg en önnur kvenlæg. Þannig er t.d. I am clever þýtt sem Ég er snjall en I am stupid sem Ég er heimsk.

Það er auðvelt að lesa karlrembu og kvenfyrirlitningu úr þessu, en ástæðan fyrir þessu er sú að þýðingaforrit eins og Google Translate nota mállíkön sem byggjast á raunverulegum textum. Að baki þessum líkönum liggur gífurlegt textamagn og líkönin endurspegla málnotkun í þessum textum. Ef tiltekin lýsingarorð eru fremur notuð í kvenkyni í þýðingunum stafar það ekki af því að forritarar hjá Google séu karlrembur og hafi ákveðið að hafa það þannig, heldur af því að þannig eru textarnir sem mállíkönin grundvallast á. Í fljótu bragði gæti það virst eðlilegt – og raunar það eina rétta – að láta þýðingarnar endurspegla raunverulega málnotkun.

En þegar að er gáð er þetta kannski ekki æskilegt. Ef kynjahalli er í málinu, eins og mállíkönin virðast sýna, þá stuðlar notkun þeirra í þýðingum að því að viðhalda honum. Er það æskilegt? Kannski viljum við reyna að rétta þennan kynjahalla af með því að hræra eitthvað í mállíkönunum þannig að meira jafnvægi sé í þýðingunum og þær endurspegli ekki þann halla sem er í raunverulegum textum. En þá erum við komin út á hálan ís. Ef farið er að fikta í líkönunum á annað borð er þeirri hættu boðið heim að ýmsu öðru sé breytt í þeim, t.d. varðandi orðfæri og málnotkun um viðkvæma hópa o.fl. Einnig getur það leitt til þess að þýðingarnar hljómi ekki nógu eðlilega, vegna þess að þær stingi í stúf við venjulega málnotkun.

Þetta er sem sagt ekki einfalt mál og ég hef ekkert svar við því hvað eigi að gera í slíkum tilvikum. Hins vegar skiptir máli að við séum meðvituð um það að með síaukinni notkun gervigreindar verða tölvur sífellt virkari málnotendur, og að sama skapi fjölgar siðferðilegum álitamálum sem koma upp í sambandi við málnotkun þeirra. Það þýðir auðvitað ekki að við eigum að hætta að nota gervigreind í máltækni – hún skapar gífurlega möguleika sem gagnast okkur öllum á margvíslegan hátt. Það sem skiptir máli í þessu eins og í svo mörgu er gagnrýnin hugsun.