Máltækni í þágu samfélagsins

Þótt nokkur verkefni á sviði máltækni hafi verið unnin hér á landi undir lok 20. aldar má segja að skipuleg uppbygging íslenskrar máltækni hafi hafist fyrir rúmum 20 árum með út­tekt á ástandi og horfum í íslenskri tungu­tækni eins og sviðið var kallað þá. Tungu­tækni – skýrsla starfshóps kom út snemma árs 1999 en þar var áætlað að það kostaði u.þ.b. einn milljarð króna að gera íslenska mál­tækni sjálf­bæra. Að teknu tilliti til verðlagsbreytinga er þetta reyndar svipuð upphæð og nú er gert ráð fyrir að verja til verkefnisins.

Í kjölfar skýrslunnar kom ríkið á fót sérstakri tungutækniáætlun sem fékk sam­tals 133 milljónir króna á fjárlögum ár­anna 2000-2004. Fyrir það fé voru unn­in eða sett af stað ýmis verkefni sem sum lognuðust út af, önnur lögðu drög að seinni tíma starfi á þessu sviði, og enn önnur eru enn í fullu gildi. Því fór þó fjarri að íslensk máltækni væri orðin sjálf­bær þegar áætluninni lauk og næstu 10 ár var ekki sett neitt fé á fjárlögum í ís­lenska máltækni en með fáeinum styrkjum úr Rann­sóknasjóði, m.a. einum öndvegis­styrk, tókst að halda lífi í rannsóknar- og þróunarstarfi.

Þáttaskil urðu með þátttöku Íslands í evrópska META-NET verkefninu árin 2011-2013. Megin­markmið þess voru annars vegar að gera ítarlega úttekt á stöðu máltækni fyrir 30 evrópsk tungu­mál, og hins vegar að byggja upp og gera að­gengileg hvers kyns málleg gagnasöfn og hugbúnað fyrir þessi mál. Á Íslandi tókst að safna saman og byggja upp marg­vísleg gögn á þess­um tíma. Þau voru gerð aðgengileg í varðveislusafninu META-SHARE en einnig var settur upp vefurinn málföng.is þar sem hægt er að nálgast þessi gögn.

Auk þess var skrifuð ítarleg skýrsla, ein af 30 í sama sniði: Íslenska á stafrænni öld. Þegar niður­stöður skýrslnanna voru bornar saman kom í ljós að íslenska stæði næstverst málanna 30 hvað varðar mál­tækni. Þessar niðurstöður vöktu töluverða at­hygli hér á landi og voru m.a. rædd­ar á Alþingi. Það er óhætt að segja að skýrslan hafi verið einn helsti hvatinn að þings­álykt­un sem var samþykkt einróma 2014 um gerð áætlunar um uppbyggingu ís­lenskrar mál­tækni og leiddi að lokum til skýrslunnar Máltækni fyrir ís­lensku 2018-2022 – Verkáætlun.

Þátttakan í META-NET sýndi okkur mikilvægi alþjóðlegs samstarfs á þessu sviði og í mál­tækni­skýrslunni var lagt til að Ísland gerðist aðili að evrópska inn­viðaverk­efninu CLARIN ERIC. Það var sett á stofn til að staðla og gera aðgengi­leg gagna­söfn til nota í rann­sóknum á sviði félags- og hugvís­inda, en þessi gagna­söfn geta einnig nýst í mál­tækni og þess vegna er aðild að CLARIN mjög gagnleg. Ísland er þegar orðið áheyrnaraðili að sam­starf­inu og nú hefur íslenskum lögum verið breytt þannig að Ísland gæti sótt um fulla aðild.

Samstarfsnetið European Language Re­source Coordination hefur verið í gangi undanfarin fjögur ár. Það gengur einkum út á að afla mállegra gagna frá opinberum stofn­­un­um til nota í vél­rænum þýðing­um og nýta þau í opinberri þjónustu. Annað samstarfs­net er European Lan­guage Grid sem er nýtt og snýst aðallega um gögn sem nýt­ast fyrir­tækjum í iðnaði og við­skipta­­lífi. Ísland tekur þátt í báðum þessum netum sem skiptir gífurlegu máli til að geta fylgst með þróuninni, fengið aðgang að gögnum og þekkingu og komið okkar eigin gögnum á framfæri.

Máltækniáætlunin sem nú er verið að setja af stað mun kosta á þriðja milljarð króna. Þótt það sé ekki stór hluti af heild­ar­útgjöldum ríkissjóðs er þetta mikið fé, a.m.k. í samanburði við það sem við sem vinnum með íslenskt mál erum vön að sjá. Ég er samt sannfærður um að fáar fjár­fest­ingar borga sig betur og þjóðin á eftir að fá þetta margfalt til baka. Í huga margra tengist þetta verkefni fyrst og fremst verndun og varðveislu íslensk­unn­ar og hún verður vitanlega ekki metin til fjár. En máltækni er mikilvæg af fjöl­mörgum öðrum ástæðum og ég nefni örfá dæmi:

  • Fyrir jafnrétti og mannréttindi – máltækni getur skipt sköpum fyrir fjölmarga sem búa við ein­hvers kon­ar hömlun eða skerð­ingu, auðveldar þeim að ferðast um, bætir aðgengi þeirra að margs kyns þjón­ustu og lífsgæðum og getur gert þeim kleift að taka fullan þátt í daglegu lífi og starfi.
  • Fyrir tækniþróun og ný­sköp­un – máltækni er alþjóðleg og innan mál­tækniverkefnisins gefst íslensk­um fyrir­tækjum tækifæri til að vinna með vísindamönnum að þróun nýrrar tækni og af­urða sem geta nýst á alþjóðlegum mark­aði, auk þess sem aðferðirnar nýtast víðar en í máltækni.
  • Fyrir hagkvæmni og hagræð­ingu í rekstri – með hjálp talgreiningar, tal­gerv­ingar og gervi­greind­­ar geta fyrir­tæki sem reka þjón­ustu­ver t.d. látið tölvur sinna verulegum hluta aðstoðar­beiðna sem bæði lækkar kostnað og styttir biðtíma og eykur þannig ánægju viðskiptavina.
  • Fyrir skilvirkni í opinberri þjónustu – með notkun máltækni má hraða samskiptum milli opinberra aðila innbyrðis en fyrst og fremst stórbæta og auðvelda að­gengi almennings að þjónustu opin­berra stofnana og hraða afgreiðslu erinda og fyrirspurna.
  • Fyrir hraða og öryggi í heilbrigðisþjónustu – með notkun mál­tækni við greiningu og lýsingu rann­sókn­ar­­gagna og hvers kyns skráningu og miðlun upplýsinga má hraða upplýsinga­streymi og þannig flýta fyrir sjúk­dóms­grein­ingu og auka líkur á lækn­ingu.
  • Fyrir al­manna­varn­ir við náttúruvá – með sjálf­virk­um textaskrifum og vélrænum þýð­ing­um má t.d. koma upplýsingum um yfir­vof­andi eldgos eða flóð á fjölda tungumála til ferðamanna hvar sem þeir eru staddir og bæta samskipti milli viðbragðsaðila innbyrðis og við almenning.

Tölvutæknin er nú orðin fléttuð inn í flestar daglegar athafnir okkar. Tungu­málið er helsta sam­skiptatæki okkar á öllum sviðum mannlífsins og þess vegna þurfum við máltækni á öllum svið­um – íslenska máltækni. Uppbygging hennar og þróun er sannarlega í þágu samfélagsins.