Category: Málfar

Stigbreytist margur?

Orðið margur er talið lýsingarorð í öllum kennslubókum og tæplega er ástæða til að efast um þá greiningu – orðið hefur bæði dæmigerða beygingu og setningarstöðu lýsingarorða. Eina vafaatriðið er stigbreytingin, sem vissulega er eitt megineinkenni lýsingarorða, því að margur hefur ekki reglulegt miðstig eða efsta stig – myndirnar *margari og *margastur eru ekki til, heldur eru fleiri og flestur notaðar í staðinn. En það er svo sem ekkert einsdæmi að algeng lýsingarorð stigbreytist óreglulega – margur er þar í hópi með góður, gamall, lítill, mikill, slæmur og illur.

Skortur á reglulegri stigbreytingu dugir því ekki til að gera flokkun orðsins sem lýsingarorðs vafasama. En það er samt ekki alveg ljóst að það sé rétt að greina fleiri og flestur sem beygingarmyndir af margur. Setningarstaða miðstigsins og efsta stigsins virðist nefnilega vera verulega frábrugðin stöðu frumstigsins. Flest lýsingarorð geta staðið milli lauss greinis og nafnorðs, og hafa þá veika beygingu: Hinir góðu menn, Hinar skemmtilegu konur, Hið ágæta fólk. Þótt frumstigið sé vissulega algengast í þessari setningagerð – eins og í málinu yfirleitt – geta miðstig og einkum efsta stig einnig staðið þar: Hinir betri/bestu menn, Hinar skemmtilegri/skemmtilegustu konur.

Frumstig lýsingarorðsins margur er mjög algengt í þessari setningagerð: Hin mörgu andlit Indlands, Hinir mörgu aðdáendur Einars Áskels, o.s.frv. Hins vegar koma miðstigið fleiri og efsta stigið flestir varla eða ekki fyrir í þessu sambandi, og raunar virðist veik beyging efsta stigs (sem ætti að vera *flestu) ekki vera til. Á tímarit.is eru dæmin um lausan greini + fleiri/flestir + nafnorð teljandi á fingrum annarrar handar, og í Risamálheildinni sem hefur að geyma á aðra milljón orða finnast engin dæmi um miðstigið eða efsta stigið í þessu sambandi en aftur á móti tæp 800 dæmi um frumstigið. Hjá öllum öðrum algengum lýsingarorðum má finna fjölda dæma um a.m.k. efsta stigið í þessu sambandi.

Setningafræðileg hegðun orðanna fleiri og flestur er því bæði frábrugðin hegðun frumstigsins margur, og einnig frábrugðin hegðun miðstigs og efsta stigs annarra lýsingarorða. Aftur á móti haga fleiri og flestur sér að þessu leyti eins og ótvíræð óákveðin fornöfn – það er ekki hægt að segja *Hinir sumu menn, *Hinir nokkru menn o.s.frv. frekar en *Hinir fleiri menn, *Hinir flestu menn. Það er freistandi að segja að fleiri og flestir séu ekki beygingarmyndir af lýsingarorðinu margur, heldur sjálfstæð orð – og raunar ekki einu sinni lýsingarorð, heldur óákveðin fornöfn.

Sú niðurstaða myndi í fyrsta lagi byggjast á því að þau eru orðmyndunarlega óskyld margur, í öðru lagi á ólíkri setningarstöðu þeirra, og í þriðja lagi á því að flestur hefur aðeins sterka beygingu eins og óákveðin fornöfn (fleiri er venjulega talið veik beyging en það er í raun merkingarlaust vegna þess að orðið hefur alltaf þetta sama form). En kannski væri þetta of djörf ályktun. Kannski er ekki hægt að ganga lengra en svo að taka undir með Gísla Jónssyni sem sagði einu sinni: „Auðvitað er ekkert hafdjúp á milli sumra orðflokka, og sum orð eru vanddregin í dilk.“ Kannski verða fleiri og flestur að fá að vera hálfpartinn í lausu lofti milli lýsingarorða og óákveðinna fornafna – eins og kannski ýmis.

Siðrof

Siðrof er ekki gamalt orð í málinu og finnst ekki í orðabókum, hvorki Íslenskri orðabókÍslenskri nútímamálsorðabók. Elsta dæmi um það á tímarit.is er í grein sem Loftur Guttormsson skrifaði í Sögu 1979 um kenningar félagsfræðingsins Émile Durkheim. Þar er skýringin „anomie“ sett í sviga fyrir aftan og orðið síðan skýrt: „Siðrof er e. k. upplausnarástand sem birtist í ýmsum myndum, t.d. viðskiptakreppum, stéttaátökum, hárri sjálfsmorðstíðni.“ Mér finnst ekki ólíklegt að Loftur hafi búið orðið til þótt ég geti ekkert fullyrt um það.

Orðið kemur nokkrum sinnum fyrir á næstu þremur áratugum og oftastnær í þessari merkingu að því er virðist. Notkun þess tók síðan stökk haustið 2008 í kjölfar efnahagshrunsins sem iðulega var tengt við siðferðilegt skipbrot og upplausn. Orðið var mikið notað næstu fimm árin eða svo en heldur virðist hafa dregið úr notkun þess á allra síðustu árum eftir því sem hrunið fjarlægist. Af orðum Karls Sigurbjörnssonar þáverandi biskups í Morgunblaðinu 2012 má ráða að kirkjan hafi líka notað orðið í áðurnefndri merkingu:

„Viðhorfin á árunum um og eftir aldamót voru þannig að fólk gaf ekki sem skyldi gaum að þessum gömlu og góðu gildum sem Íslendingum hafa dugað svo vel í aldanna rás, það er hógværð, auðmýkt, virðing og þrautseigja. Í staðinn komu og urðu áberandi lestir eins og oflæti, sjálfumgleði og hroki. Þetta voru atriði sem sköpuðu siðrof í íslensku samfélagi og stuðluðu að því áfalli sem við höfum enn ekki bitið úr nálinni með.“

Vissulega geta orð breytt um merkingu og gera það oft. Ef málnotendur, eða talsverður hluti þeirra, koma sér saman um að nota orð í annarri merkingu en það hafði áður er oft ekkert við það að athuga – það er hluti af eðlilegri málþróun. Fjöldi orða sem við notum daglega hefur aðra merkingu nú en áður, án þess að við gerum okkur grein fyrir því eða það trufli okkur á nokkurn hátt. En það skiptir máli hvernig merkingarbreytingin verður. Einn málnotandi eða lítill hópur getur ekki tekið það upp hjá sjálfum sér að nota orð í annarri merkingu en hefðbundin er – og ætlast til að aðrir átti sig á því og samþykki það.

Í þessu tilviki er þar að auki um að ræða orð sem er myndað sem fræðiorð, íðorð – gert til að tákna ákveðið fræðilegt hugtak. Íðorð lúta svolítið öðrum lögmálum en almennur orðaforði. Þau eru hluti af ákveðnu hugtakakerfi og það er mikilvægt að merking þeirra sé skýrt skilgreind og fari ekki á milli mála. Fram að efnahagshruninu 2008 er siðrof augljóslega fyrst og fremst íðorð, og iðulega notað í tengslum við kenningar Durkheims þaðan sem það er komið eins og áður segir. Eftir 2008 kemst orðið hins vegar í miklu almennari og víðtækari notkun og þá má e.t.v. segja að það færist yfir í almennan orðaforða málsins.

Eftir sem áður virðist merking þess undantekningarlítið vísa í einhvers konar umrót eða upplausn og vera neikvæð. Þegar spurningu um áhrif þess að kristinfræði sé ekki lengur kennd í skólum er svarað með því að segja „Það hefur orðið siðrof held ég“ er meðvitað eða ómeðvitað vísað í hina venjulegu og alþekktu merkingu orðsins siðrof, þótt eftir á sé sagt að siðrof sé ekki siðleysi heldur „rof við siðinn sem við höfum lifað eftir um aldir á Íslandi“. Sú skýring stenst því aðeins að átt sé við að því rofi fylgi það upplausnarástand sem að ofan er lýst.

Íslensk málgögn

„Íslensk málgögn“ eru safn stafrænna málgagna, þ.e. margvíslegra gagna um íslenskt mál (textagagna, tölfræðigagna, hljóðskráa, myndefnis), sem hafa orðið til á undanförnum árum í ýmsum rannsóknarverkefnum sem flest hafa verið styrkt af Rannsóknasjóði. Málfræðilegar rannsóknir hafa breyst mikið á undanförnum árum, samfara þróun upplýsinga- og tölvutækni. Breytingarnar koma ekki síst fram í því að vægi megindlegra rannsókna hefur aukist mjög og frá því um síðustu aldamót hafa langflestar íslenskar málfræðirannsóknir verið megindlegar að verulegu leyti – byggst á víðtækri gagnasöfnun og tölfræðilegri úrvinnslu gagnanna. Sem dæmi má nefna tvær viðamestu rannsóknir sem hafa verið gerðar á íslensku máli og báðar fengu öndvegisstyrk Rannsóknasjóðs – „Tilbrigði í setningagerð“ 2005-2007 og „Greining á málfræðilegum afleiðingum stafræns málsambýlis“ 2016-2019.

Í mörgum af þessum rannsóknum hafa orðið til gífurlega mikil og fjölbreytt gögn – málgögn – sem flest eru á stafrænu formi. Þessi gögn eru einkum af fernum toga. Í fyrsta lagi ýmiss konar textagögn, t.d. spurningakannanir af ýmsu tagi og svör við þeim, uppskriftir samtala og viðtala við börn og fullorðna, uppskriftir texta frá eldri málstigum o.fl. Í öðru lagi tölfræðileg gögn – einkum skrár úr SPSS, Excel og R, sem geyma töluleg gögn og margvíslega úrvinnslu úr ýmsum rannsóknum. Í þriðja lagi hljóðskrár – t.d. samtöl og viðtöl við börn og fullorðna, upptökur úr framburðarrannsóknum og hljóðfræðirannsóknum o.fl. Í fjórða lagi er svo myndefni, einkum myndir sem hafa verið notaðar í framburðarrannsóknum og myndir af framburðarspjöldum.

Þessi gögn eru nú yfirleitt varðveitt hjá stjórnendum þeirra verkefna þar sem þau urðu til, og eru þar ekki aðgengileg öðrum nema með sérstöku leyfi og atbeina verkefnisstjóranna (sem í sumum tilvikum eru hættir störfum). Skipulag á varðveislu gagnanna er oft laust í reipunum, gögnin eru á mismunandi formi, lýsigögn oftast af skornum skammti, og stundum er að finna í gögnunum persónugreinanlegar upplýsingar sem ekki er heimilt að gera opinberar. Það er því oft umtalsverð fyrirhöfn fyrir verkefnisstjóra að veita aðgang að gögnum sínum, og ekki síður fyrirhöfn fyrir notendur að setja sig inn í skipulag þeirra og átta sig á þeim.

„Íslensk málgögn“ munu skapa margvíslega nýja möguleika í rannsóknum. Söfnun og tölfræðileg úrvinnsla mállegra gagna er geysilega tímafrek og dýr. Í nokkrum af þeim rannsóknarverkefnum sem munu leggja til gögn hefur gagnasöfnun t.d. farið fram víða um land (og jafnvel erlendis, í Færeyjum og Vesturheimi) með tilheyrandi ferðakostnaði. Í þessum gögnum liggja því mikil verðmæti og það er til mikils að vinna að ná betri nýtingu út úr þessum gögnum. Umsækjendur telja að hér gefist einstakt tækifæri til að útvega þeim sem fást við rannsóknir á íslensku máli mikil verðmæt gögn með litlum tilkostnaði.

Í flestum tilvikum hafa gögnin nýst vel til þess sem þau voru upphaflega ætluð, og skilað fjölmörgum bókum og fræðigreinum. En mikið af þeim gæti nýst áfram, væru þau aðgengileg – bæði til áframhaldandi rannsókna á sama sviði og ekki síður til annars konar rannsókna en þau voru upphaflega ætluð til. Þeir sem búa yfir gögnunum eru oftast fúsir til að opna þau og gera þau aðgengileg en skortir bolmagn og aðstöðu til þess. Iðulega þarf að leggja talsverða vinnu í að tilreiða gögnin þannig að hægt sé að opna þau öllum – semja ítarleg lýsigögn, fjarlægja persónugreinanlegar upplýsingar, koma gögnunum á staðlað form o.fl. Þetta er vinna sem umráðamenn gagnanna geta ekki tekið á sig nema að litlu leyti.

Að auki þarf að tryggja örugga vistun gagnanna og varanlegt aðgengi að þeim. Með þátttöku Íslands í evrópska innviðaverkefninu CLARIN ERIC og uppsetningu CLARIN-miðstöðvar á Íslandi er kominn vettvangur til að vista gögnin varanlega og tryggja aðgang að þeim til frambúðar. Sá aðgangur verður með mismunandi móti eftir eðli gagnanna. Í flestum tilvikum verður hægt að hlaða þeim niður til áframhaldandi vinnslu án sérstakra takmarkana, en notendur verða þó að samþykkja sérstakt notkunarleyfi, sem getur verið misjafnlega takmarkandi, sem skilyrði fyrir niðurhali. Textagögn verða einnig gerð leitarbær í hugbúnaðinum Korp.

Aðstandendur verkefnisins fást við fjölbreyttar rannsóknir á sviði íslenskrar málfræði, talmeinafræði og máltækni og munu nýta gögnin í rannsóknum sínum og vísa nemendum sínum á þau. En einnig er ljóst að fjöldi annarra fræðimanna, innan lands og erlendis, mun nýta gögnin ef þau eru gerð aðgengileg. Þar skiptir máli vistun þeirra á CLARIN-miðstöðinni þar sem þau verða skráð í gagnagrunn CLARIN og lýsigögn þeirra – og í sumum tilvikum gögnin sjálf – þar með hluti af leitargrunni CLARIN. Til að auðvelda erlendum fræðimönnum notkun gagnanna verða lýsigögnin bæði á íslensku og ensku.

Í sumum tilvikum hafa möguleikarnir sem gögnin bjóða upp á til að rannsaka það sem þau voru upphaflega gerð fyrir ekki verið fullnýttir. Þannig má nefna að Margrét Guðmundsdóttir doktorsnemi hefur tölvuskráð upplýsingar á framburðarspjöldum Björns Guðfinnssonar frá því um 1940, sem varðveitt eru í Landsbókasafni – Háskólabókasafni, og sýnt fram á að úr þeim gögnum má lesa meiri og nákvæmari upplýsingar um íslenskar framburðarmállýskur fyrir miðja 20. öld en áður hafði verið gert, þótt á sínum tíma hafi verið gefnar út tvær bækur um niðurstöður rannsóknar Björns. Miklar ónýttar upplýsingar til viðbótar mætti enn vinna úr spjöldunum.

Einnig má nefna að Höskuldur Þráinsson prófessor emeritus hefur gert mikinn fjölda SPSS-skráa með tölfræðilegum gögnum úr verkefnunum „Tilbrigði í setningagerð“ sem unnið var að frá 2005-2007 og „Tilbrigði í færeyskri setningagerð“ sem unnið var að frá 2008-2009. Þótt gefnar hafi verið út þrjár bækur með niðurstöðum fyrrnefnda verkefnisins, auk fjölda greina og ritgerða um bæði verkefnin, er enn að finna miklar og fjölbreyttar upplýsingar í þessum skrám sem ekki hefur verið unnið úr.

Í öðrum tilvikum geta gögnin nýst til annars en þeim var upphaflega ætlað. Hér má aftur taka dæmi af framburðarrannsókn Björns Guðfinnssonar um 1940 og verkefninu „Rannsókn á íslensku nútímamáli“ (RÍN) upp úr 1980. Bæði þessi verkefni skiluðu niðurstöðum sem birtust á prenti á sínum tíma, í bókum og greinum. En vegna þess að frumgögn Björns voru varðveitt var hægt að nýta þau til samanburðar við RÍN-rannsóknina til að kortleggja breytingar á framburði Íslendinga yfir 40 ára tímabil mun betur en ef eingöngu hefði þurft að miða við útgefnar niðurstöður rannsókna Björns.

Gögn úr báðum þessum rannsóknum voru síðan notuð í verkefninu „Málbreytingar í rauntíma í íslensku hljóðkerfi og setningagerð“ (RAUN) á árunum 2010-2012. Þar var hægt að rekja breytingar á framburði sama fólks yfir 70 ára tímabil sem er einstakt í heiminum. Í síðastnefnda verkefninu var einnig athuguð þróun ákveðinnar setningafræðilegrar breytingar („nýju þolmyndarinnar“ eða „nýju ópersónulegu setningagerðarinnar“), sem Sigríður Sigurjónsdóttir og Joan Maling rannsökuðu fyrst í máli barna 1999-2000, og síðan var aftur rannsökuð í máli sumra sömu einstaklinganna – sem þá voru um tvítugt.

Þessi endurnýting rannsóknargagna var möguleg vegna þess að sömu fræðimenn stóðu að henni og höfðu unnið upphaflegu rannsóknirnar – eða þá að eldri gögn voru aðgengileg þótt mikla vinnu þyrfti að leggja í að gera þau nýtileg til samanburðar, eins og tilfellið var með gögn Björns Guðfinnssonar. En vitanlega er óæskilegt og hamlandi að endurnýting rannsóknargagna sé bundin við upphaflega safnendur gagnanna. Mikilvægt er að aðrir fræðimenn, innan lands og erlendis, hafi greiðan aðgang að þessum gögnum og geti nýtt þau í margvíslegum rannsóknum.

Það hefur sýnt sig að erlendir fræðimenn hafa nýtt sér íslensk málleg gögn sem hafa verið gerð aðgengileg. Gott dæmi um það er að tvær doktorsritgerðir sem varðar voru í lok síðasta árs, önnur við háskólann í Manchester á Englandi en hin við háskólann í Konstanz í Þýskalandi, byggjast algerlega á Sögulega íslenska trjábankanum (IcePaHC) sem var gerður innan öndvegisverkefnisins „Hagkvæm máltækni utan ensku“ sem Rannsóknasjóður styrkti árin 2009-2011. Trjábankinn hefur frá upphafi (2011) verið öllum aðgengilegur til niðurhals.

Á undanförnum árum og áratugum hafa gögn úr þeim rannsóknum sem munu leggja efni til „Íslenskra málgagna“ nýst á mjög fjölbreyttan hátt í námi og kennslu í íslensku og almennum málvísindum – í aragrúa námskeiðsritgerða og verkefna, fjölda BA- og MA-ritgerða, og stöku doktorsritgerðum. Í sumum tilvikum hafa ritgerðarhöfundar verið sjálfir að vinna við viðkomandi rannsókn og þannig haft beinan og milliliðalausan aðgang að gögnum, en í öðrum tilvikum hafa þeir fengið aðgang að gögnunum hjá verkefnisstjórum. Slíkt er þó oft snúið og getur kostað verulega vinnu bæði fyrir umsjónarmann gagnanna og ritgerðarhöfund, eins og áður er rakið.

Með opnu aðgengi að gögnum, samræmdu gagnasniði og stöðluðum lýsigögnum, verður margfalt auðveldara en áður að láta stúdenta vinna með gögnin á ýmsan hátt, bæði í smærri námskeiðsverkefnum og stærri ritgerðum – námskeiðsritgerðum, BA- og MA-ritgerðum og jafnvel doktorsritgerðum. En einnig skapast nýir möguleikar til vinnu með gögnin – hægt verður að láta stúdenta bera gögn úr mismunandi rannsóknum saman á ýmsan hátt, skoða þróun málbreytinga o.s.frv. Þetta verður því alger gullkista til þjálfunar stúdenta í sjálfstæðri vinnu með fjölbreytileg málleg gögn, og það er vitaskuld mjög hvetjandi fyrir stúdenta að fá tækifæri til að svara spurningum sem ekki hefur verið svarað áður.

Vistun gagnanna á CLARIN-miðstöðinni og tenging við gagnanet CLARIN gerir það að verkum að fræðimenn erlendis fá vitneskju um gögnin og eiga greiðan aðgang að þeim. CLARIN-miðstöðin sér um að koma gögnunum fyrir í því tæknilega umhverfi sem þar verður til staðar (CLARIN technical centre) og tengja þau við CLARIN-netið.

Enskættað orðalag

Erlend orðasambönd hafa alla tíð streymt inn í málið og yfirleitt klæðst íslenskum búningi að mestu eða öllu leyti, í þeim skilningi að þau innihalda engin framandi hljóð, öll orðin í þeim eru oftast íslensk og beygjast á hefðbundinn hátt. Þau bera það því ekki með sér að þau séu erlend að uppruna og til að átta okkur á því þurfum við að þekkja þau í upprunamálinu. Lengi vel komu slík sambönd úr dönsku og margir minnast þess úr skólagöngu sinni að amast hafi verið við algengum orðasamböndum eins og fyrst og fremst, til að byrja með og fjölmörgum öðrum sem eru hluti af daglegu máli okkar. Nú fá þessi sambönd og önnur álíka að vera í friði víðast hvar nema helst í MR.

Nú eru dönskuslettur alveg fyrir bí, eins og einhvern tíma var sagt, og jafnvel talað um að friða þær. En enskan er yfir okkur og allt um kring, og engin furða að ýmis ensk orðasambönd laumist inn í íslensku. Eitt þeirra er eins og enginn sé/væri morgundagurinn sem er augljóslega íslensk gerð af orðasambandinu as if there were no tomorrow eða like there is no tomorrow. Þetta er ekki gamalt í málinu – elsta dæmið á tímarit.is er frá 2005, en á síðustu 10 árum hefur notkunin stóraukist. Ég kunni ekki við þetta samband í fyrstu en er farinn að venjast því og sé svo sem ekkert athugavert við það.

Önnur nýjung í málinu, greinlega ættuð úr ensku, er að segja sama hvað, án nokkurs framhalds eða skilyrðis. Þrjú dæmi frá þessu ári af tímarit.is:

  • „Það er svo mikil gróska og samhugur hjá öllu þessu frábæra tónlistarfólki á Íslandi, að gera hlutina sama hvað.“
  • „En ef náttúra er á annað borð til þá er hún eitthvað sem lætur ekki alveg að stjórn, á það til að sullast út fyrir, sama hvað.“
  • „Mér finnst þetta ekki allt byggjast á því að búa til atvinnu sama hvað.“

Til skamms tíma hefði orðið að koma eitthvert framhald – sama hvað tautar og raular, sama hvað þú segir, sama hvað gerist, o.s.frv. Enginn vafi er á að þetta eru áhrif frá enska sambandinu no matter what sem einmitt er notað svona.

Enn eitt nýlegt orðalag sem er ættað úr ensku er að segja af ástæðu án þess að nokkurt ákvæðisorð – lýsingarorð eða fornafn – fylgi nafnorðinu. Þrjú nýleg dæmi af tímarit.is:

  • „Þeir ungu leikmenn sem eru komnir í liðið núna eru þar af ástæðu.“
  • „Lokið á salerninu er staðsett ofan á klósettinu af ástæðu en er ekki bara til skrauts.“
  • „Við erum í kór af ástæðu, við viljum alltaf vera að syngja.“

Í íslensku hefur fram til þessa þurft að skilgreina ástæðuna eitthvað nánar – segja af góðri ástæðu, af ákveðinni ástæðu, af þeirri ástæðu o.s.frv. En í ensku er hægt að segja for a reason án nánari útskýringa og þaðan er þetta væntanlega komið.

Erlendur uppruni einn og sér er ekki gild ástæða til að amast við einhverju orðalagi, og þótt samböndin eins og enginn væri morgundagurinn, sama hvað og af ástæðu séu greinilega öll komin úr ensku finnst mér ástæða til að gera upp á milli þeirra. Fyrstnefnda sambandið hvorki breytir né útrýmir einhverju sem fyrir er í málinu – það má alveg segja að það auðgi málið. Í síðarnefndu samböndunum tveimur er aftur á móti verið að breyta hefðbundnu íslensku orðalagi að ástæðulausu. Betra væri að halda sig við hefðina.

Kynusli

Eins og við vitum öll hefur íslenska þrjú kyn í fallorðum – karlkyn, kvenkyn og hvorugkyn. Við erum vön því og finnst það eðlilegt, vegna þess að við tengjum þetta við líffræðilegt kyn. Líffræðileg kyn hafa að vísu fram undir þetta bara verið talin tvö, karlkyn og kvenkyn, en við sættum okkur við að það sé til eitthvert þriðja gildi, eitthvað hlutlaust – hvorugkyn, hvorugt kynið.

Þessi tenging við líffræðilega kynið getur valdið því að okkur finnst oft að tungumál sem hafa færri kyn en íslenska séu á einhvern hátt ófullkomin – mál eins og danska með sitt samkyn í nafnorðum í stað karlkyns og kvenkyns, að ekki sé talað um ensku og finnsku með aðeins eitt kyn í nafnorðum (sem jafngildir því að hafa ekkert kyn). En þessi tungumál virðast komast vel af þrátt fyrir þessa kynjafátækt. Og tilfellið er að kyn í tungumálum eru mjög mismörg, allt frá engu sem er langalgengast upp í 20. Hvernig má það vera?

Málið er að kyn í tungumáli er málfræðileg flokkun en ekki líffræðileg. Vissulega eru sterk tengsl milli málfræðilegs og líffræðilegs kyns í mörgum tungumálum, þ. á m. íslensku, en þau eru alls ekki algild eins og alþekkt er. Það eru til hvorugkynsorð eins og fljóð og sprund sem vísa til kvenna, og hvorugkynsorðið skáld hefur svo sterka tengingu við karlmenn að nauðsynlegt hefur þótt að mynda orðin skáldkona og kvenskáld til að vísa til kvenna.

Sama máli gegnir um ýmiss konar aðra málfræðilega flokkun sem hefur tengsl við efnisheiminn – þau tengsl eru sjaldnast alveg föst. Við segjum t.d. að eintala sé notuð til að vísa til eins en fleirtala vísi til fleiri en eins. Samt þekkjum við öll orð eins og buxur og skæri sem vísa til eins hlutar og eru ekki til í eintölu. Orð eins og fólk og fjöldi eru eintöluorð en vísa vitanlega til fleiri en eins. Svo mætti lengi telja.

Því fer fjarri að kynin í íslensku séu öll jafnvæg. Á undanförnum árum hefur andstæðan markað : ómarkað oft verið notuð til að lýsa venslum innan málkerfisins. Ómarkað merkir þá hlutlaust, það sem er sjálfgefið, en markað er það sem er notað við einhverjar sérstakar aðstæður – það er eitthvað sem kallar á notkun þess. Hvorugkynið heitir á latínu neutrum, neuter á ensku, og það merkir 'hlutlaust'.

Það mætti því búast við að hvorugkynið væri ómarkað kyn í íslensku. Á það reynir t.d. þegar vísa þarf til bæði karlkyns- og kvenkynsorða með einu fornafni, eða þegar lýsingarorð í stöðu sagnfyllingar á við bæði karlkyns- og kvenkynsorð. Þá er vissulega oftast notað hvorugkyn – Jón og Gunna eru komin (en ekki komnir eða komnar). Þau eru skemmtileg. Þetta er samt ekki alveg einfalt, sérstaklega þegar um safnheiti er að ræða, en ég get ekki farið út í það hér.

En þarna er um að ræða málfræðileg vensl og vísun innan setninga eða milli setninga. Öðru máli gegnir um vísun út fyrir tungumálið – þegar vísað er til blandaðs hóps karla og kvenna án þess að þau hafi verið nefnd. Þar er yfirleitt notað karlkyn og við segjum Enginn má yfirgefa húsið og Allir tapa á verðbólg­unni án þess að meina að það séu bara karlmenn í þeim hópi. Í þessu felst ekki nein karlremba eða útilokun kvenna – svona virkar tungumálið bara. En hvers vegna notum við ekki hvorugkyn og segjum Öll eru mætt?

Fyrir því eru sögulegar ástæður. Í indóevrópska frummálinu voru tvö kyn – annað var notað um lífverur en hitt um dauða hluti. Hið fyrrnefnda mætti svo sem kalla samkyn en það er sögulega séð fyrirrennari karlkyns, í þeim skilningi að karlkynsbeygingu má hljóðsögulega rekja til þess. Það eru ein­göngu lífverur sem geta verið gerendur í setningum og vegna þess að nefnifall var fall gerandans voru það eingöngu karlkynsorð sem höfðu sérstaka nefnifallsmynd.

Hvorugkynsorðin gátu ekki táknað gerendur og þurftu því ekki á nefnifalli að halda. Þegar tengsl milli merkingar og setningagerðar breyttust og hvorugkynsorð fóru að geta staðið í stöðu sem krafðist nefnifalls urðu þau að koma sér upp nefnifallsmynd, og það var gert með því að taka þolfallsmyndina og láta hana líka þjóna sem nefnifall. Þetta er ástæðan fyrir því að hvorugkynsorð eru alltaf eins í nefnifalli og þolfalli, bæði í eintölu og fleirtölu.

Kvenkyn þróaðist síðan úr hvorugkyninu, en þótt kvenkyn væri komið til fékk það ekki jafnstöðu við karlkynið. Hið gamla samkyn, sem nú var orðið karlkyn af því að kvenkyn var komið til, hélt ýmsum samkynshlutverkum sínum, t.d. því að geta vísað til blandaðs hóps en ekki bara karla. Þess vegna segjum við enn Allir eru mættir og frá málfræðilegu sjónarmiði er ekkert athugavert við það, þótt verið sé að vísa bæði til karla og kvenna.

En málfræðin stjórnar ekki upplifun fólks, og þótt kynbeyging og flokkun orða í kyn sé í grunninn málfræðilegs eðlis verður ekki fram hjá því litið að hún hefur mjög sterk tengsl við líffræðilegt kyn í huga fólks. Ef mörg, bæði konur og þau sem skilgreina sig hvorki sem karl­kyns né kvenkyns, upplifa það þannig að þau séu á einhvern hátt sniðgengnin með notkun karl­kyns í slíkum dæmum, þá finnst mér eðlilegt að velta fyrir sér hvort og hvernig sé hægt að bregðast við því.

Tungumál breytast, líka íslenska. Það er ekkert því til fyrirstöðu að segja Öll eru mætt. Mörg hafa mælt með því. Hópur kvenna innan kirkjunnar hefur t.d. um tíma beitt sér fyrir því að breyta málnotkun í kirkjulegum athöfnum og ritum þannig að málið höfði betur til kvenna. Þetta er það sem hefur verið kallað „mál beggja kynja“. Mér finnst vel hægt að segja t.d. Mörg telja að …, Sum segja að … o.fl. Annað er erfiðara – mér finnst ekki hljóma vel að segja Ýmis vona að ….

Og sumt er alveg ómögulegt. Í staðinn fyrir Enginn vill að … er tæpast hægt að segja Ekkert vill að …. Það er samt hægt að snúa sig út úr þessu með því að nota fleirtöluna: Engin vilja að …. Ég sé ekki að það séu nein málspjöll þótt þetta breytist. Það er ekki verið að koma með neitt nýtt inn í málið – hvorugkynið er til. Þetta er ekki beinlínis breyting á málinu, heldur á notkun þess.

Það er aftur á móti snúnara að fást við karlkynsnafnorð, sambeygingu með þeim og vísun til þeirra. Mjög mörg starfsheiti, þjóðaheiti o.s.frv. eru karlkyns. Kennari er karlkynsorð, málfræðingur er karlkynsorð, Íslendingur er karlkynsorð, Akureyringur er karlkynsorð, o.s.frv. Við höfum þrjá kosti með slík orð. Einn er að búa til hvorugkynsorð í staðinn. Það er ekki einfalt, m.a. vegna þess að við höfum enga beygingarendingu sem gefi hvorugkyn ótvírætt til kynna eins og –ur og –i tákna (oftast) karlkyn og –a táknar (oftast) kvenkyn. En hvorugkynið er endingarlaust – nema veika beygingin, sem er eiginlega frátekin fyrir orð um líffæri og líkamshluta.

Annar kostur væri að halda orðunum óbreyttum en breyta tilvísun og sambeygingu. Þá gætum við t.d. sagt Ég hitti tvo kennara/Akureyringa áðan. Þau voru hress, þ.e. vísað til karlkyns­orðanna kennari og Akureyringur með fornafni í hvorugkyni, ef um fólk af fleiri en einu kyni væri að ræða. Þetta er vel hægt, vegna þess að vísun persónufornafna getur ýmist verið innan málsins eða út fyrir það, og ef við notum þau getum við sagt að við séum ekki að vísa í orðið kennari eða Akureyringur í setningunni á undan, heldur í hópinn sem um er að ræða.

En það versnar í því þegar við förum að skoða sambeygingu innan setningar. Það er eiginlega alveg ómögulegt að segja Bæði kennararnir eru hress eða eitthvað í þá átt, og þar væri raunverulega verið að misþyrma málkerfinu finnst mér. Í sumum tilvikum er hægt að nota eignarfallssamband í stað þess að láta fornafnið samræmast nafnorðinu – segja Sumar/Sum kennaranna eru hressar/ hress. Þriðji kosturinn er svo að halda þessu óbreyttu – segja að í þessu tilviki sé um málfræði­lega flokkun að ræða sem ekki þurfi að tengja við líffræðilegt kyn. Ég hef enga góða lausn á þessu sem trúlegt er að öllum líki.

En mér finnst sjálfsagt að fólk velti því fyrir sér hvort og hvernig hægt sé að draga úr karllægni tungumálsins, og prófi sig áfram með það. Líf íslenskunnar veltur á því að málnotendur tengi sig við hana, finnist hún vera sitt mál. Þess vegna þarf hún að breytast og endurnýja sig til að þjóna þörfum samfélagsins á hverjum tíma, eins og hún hefur alltaf gert. En það er staðreynd að í þeirri íslensku sem við höfum flest alist upp við er karlkyn ómarkað. Það er hluti af málkerfi okkar flestra og við breytum því ekki svo glatt, og mér finnst ekki hægt að ætlast til þess að fólk geri það.

Aðalatriðið í þessu er umburðarlyndi og virðing fyrir öðru fólki og málnotkun þess. Þau sem vilja hafna karlkyni sem ómörkuðu kyni þurfa að hafa í huga að við erum flest alin upp við að karlkynið hafi þetta hlutverk, og í þeirri málnotkun felst engin karlremba. Þau sem vilja halda í karlkynið sem ómarkað kyn þurfa að sýna því skilning að ýmsum finnst karlkynið eingöngu vísa til karlmanna og þar með vera útilokandi. Málið þolir alveg að mismunandi málvenjur séu í gangi samtímis.

Mannanafnalög og íslensk málstefna

Ein meginröksemd sem beitt er fyrir nauðsyn mannanafnalaga er verndun íslenskunnar og því er oft haldið fram að óheftur straumur erlendra nafna geti haft óæskileg áhrif á málið. Það er í sjálfu sér ekki óhugsandi að mikill fjöldi orða sem koma inn í málið og greina sig frá íslenskum erfðaorðum á einhvern hátt, t.d. í hljóðafari eða beygingum, hafi einhver áhrif á tilfinningu málnotenda fyrir reglum og einkennum íslenskunnar. En til þess þurfa orðin að vera mjög mörg og mikið notuð.

Þá er að hafa í huga að erlend nöfn hafa streymt inn í málið frá fyrstu tíð, og mörg þeirra hafa að geyma hljóðasambönd sem ekki finnast í erfðaorðum. Þar má nefna nöfn eins og Andrea, Lea, Magnea, Leó, Theódóra, William, Sebastian, Patricia, Sophus, Zophonías, Arthúr, Zoe, Nikolai, Laila, og ótalmörg fleiri. Öll þessi nöfn er hægt að gefa íslenskum ríkisborgurum óhindrað því að þau eru á mannanafnaskrá – sum hafa verið notuð lengi en önnur hafa verið heimiluð á starfstíma mannanafnanefndar. Ekki verður þess samt vart að þetta hafi haft neikvæð áhrif á tungumálið.

Auðvitað má hugsa sér nöfn sem innihalda meira framandi hljóðasambönd en þau sem hér hafa verið nefnd, s.s. Szczepan úr pólsku, Nguyen úr víetnömsku o.s.frv. En hljóðskipunarreglur tungumála breytast ekki svo glatt, og líkurnar á að slík nöfn hefðu einhver áhrif á íslenskt hljóðkerfi og hljóðskipunarreglur eru nákvæmlega engar. Og vegna þess að hljóðasambönd í þessum orðum eru nánast óframberanleg fyrir Íslendinga er ekki ólíklegt að nöfnin tækju fljótlega breytingum í átt að íslenskum hljóðskipunarreglum.

Því hefur einnig verið haldið fram að óheft innstreymi erlendra nafna gæti veikt beygingarkerfið. Eitt þeirra skilyrða sem nöfn þurfa að uppfylla samkvæmt gildandi lögum lýtur að þessu – nöfn þurfa að geta tekið eignarfallsendingu. Þó er fjöldi íslenskra erfðaorða eins í öllum föllum eintölu og hefur þar með enga sérstaka eignarfallsendingu. Þetta eru t.d. veik hvorugkynsorð (hjarta, nýra o.s.frv.), mörg kvenkynsorð sem enda á -i (gleði, keppni, lygi, reiði o.m.fl.), karlkyns- og hvorugkynsorð sem enda á löngu s (foss, koss, sess, hross, pláss o.fl.) eða samhljóði + s (háls, þurs, glans, gips o.fl.) – og sitthvað fleira mætti nefna. Þessi orð eru margfalt fleiri og algengari en þau mannanöfn sem ekki taka eignarfallsendingu – jafnvel þótt meðtalin væru öll nöfn sem hafnað hefur verið á þeirri forsendu. Samt hvarflar ekki að neinum að þessi orð stuðli að niðurbroti beygingarkerfisins eða hafi einhver óæskileg áhrif á málið.

En reyndar geta langflest nöfn tekið eignarfallsendingu og því er beygingarleysi sjaldan forsenda synjunar nafns. Það eru helst kvenmannsnöfn sem enda á –e sem erfitt getur verið að setja eignarfallsendingu á og nokkrum slíkum nöfnum hefur verið hafnað, s.s. Maxine, Aveline og Jette, þótt nöfnin Charlotte, Christine, Elsie, Irene, Kristine, Louise, Marie og Salome/Salóme hafi komist á mannanafnaskrá vegna hefðar. Af þessum nöfnum er aðeins það síðastnefnda notað eitthvað að ráði og hefur tæplega spillt beygingarkerfinu.

Annar hópur nafna sem ekki taka eignarfallsendingu eru karlmannsnöfn sem enda á samhljóði + sGils, HansJens o.fl. Aldrei er þó amast við slíkum nöfnum, væntanlega vegna þess að það er engin sérviska þeirra að taka ekki eignarfallsendingu heldur er það einfaldlega útilokað af hljóðafarslegum ástæðum – samhljóð getur ekki verið langt á eftir öðru samhljóði og þess vegna er ekki hægt að bæta eignarfalls-s við þessi nöfn. (Reyndar væri hægt að nota eignarfallsendinguna -ar í staðinn, en það er ekki gert.) En þegar að er gáð gegnir í raun og veru alveg sama máli um kvenmannsnöfnin sem enda á -e – það eru hljóðafarslegar ástæður fyrir því að þau geta ekki tekið eignarfallsendinguna -ar (sem er sú eina sem kemur til greina). Tvö grönn sérhljóð eins og e og a geta ekki með góðu móti staðið saman í íslensku. Það er því í raun fráleitt að hafna áðurnefndum kvenmannsnöfnum á þessari forsendu.

Meira að segja Jón, algengasta karlmannsnafn á Íslandi fyrr og síðar, fellur ekki fullkomlega að málkerfinu – til þess þyrfti það að vera Jónn, eins og prjónn, sónn og tónn – sem reyndar eru allt gömul tökuorð sem hafa aðlagast kerfinu. Þegar Jón hafði verið í málinu í margar aldir kom tökuorðið telefón inn í málið seint á 19. öld, en það tók ekki langan tíma að lagað það að málinu þannig að það varð (tele)fónn í nefnifalli. Þrátt fyrir tíðni og útbreiðslu nafnsins Jón hafði endingarleysi þess í nefnifalli sem sé ekki áhrif á þetta nýja tökuorð.

Því má bæta við að á undanförnum áratugum hafa nokkur erlend lýsingarorð sem beygjast lítið eða ekkert orðið algeng í málinu – orð eins og smart, töff, kúl, næs o.fl. Þau hafa samt ekki leitt til þess að fólk sé almennt hætt að beygja lýsingarorð. Enda er fyrir í málinu fjöldi alíslenskra lýsingarorða sem eru eins í öllum kynjum, tölum og föllum – orð sem enda á -a (andvaka, lífvana o.s.frv.) eða -i (hugsi, þurfi) og svo lýsingarháttur nútíðar þegar hann stendur sem lýsingarorð (sofandi, vakandi o.s.frv.). Engum dettur í hug að amast við þessum orðum eða gera því skóna að þau hafi óheppileg áhrif á beygingarkerfið.

En gefum okkur nú þrátt fyrir það að nöfn sem falla ekki að íslensku hljóð- og beygingarkerfi gætu „smitað út frá sér“ ef svo má segja – komið af stað eða hraðað breytingum á íslensku málkerfi. Þá hlýtur það að eiga við um öll nöfn sem eru notuð í málsamfélaginu, nöfn sem við heyrum og notum í daglegu lífi – ekki bara nöfn íslenskra ríkisborgara, sem eru þeir einu sem falla undir íslensk mannanafnalög. Hér búa nú og starfa tugir þúsunda útlendinga – fólk sem við tölum um og tölum við, og notum því í daglegu tali fjölda nafna sem ekki yrðu samþykkt. Ef íslensku málkerfi stafar hætta af erlendum nöfnum hlýtur sú hætta aðallega að stafa frá nöfnum þessa fólks en ekki þeim tiltölulega fáu nöfnum sem íslenskir ríkisborgarar sækja um að bera.

Einnig má benda á að mannanöfn eru ekki stór hluti af orðaforða málsins. Á mannanafnaskrá eru rúmlega 4100 nöfn, mörg þeirra mjög sjaldgæf og í mörgum tilvikum er örugglega bara einn nafnberi. Nú má auðvitað nota ýmsa mælikvarða á stærð íslensks orðaforða en í ritmálssafni Árnastofnunar eru t.d. dæmi um u.þ.b. 700 þúsund orð. Mörg þeirra eru líka sjaldgæf og jafnvel aðeins eitt dæmi um þau, þannig að það er ekki fráleitt að bera þetta saman. Samkvæmt því væru nöfn langt innan við 1% af heildarorðaforðanum.

Vissulega má reikna þetta á annan hátt en sama hvernig það er gert verða nöfnin alltaf bara brot af orðaforðanum. Og um önnur orð – allt að 99% orðaforðans – gilda engin lög. Enda eru erlend orð af ýmsu tagi sífellt að koma inn í málið, án þess að við höfum nokkra stjórn á því. Mörg þeirra falla ekki fullkomlega að íslensku málkerfi – eru óbeygð, brjóta hljóðskipunarreglur, eða hvort tveggja. Sum þessara orða eru lítið notuð eða um stuttan tíma, önnur haldast í málinu og laga sig þá iðulega að þeim orðum sem fyrir eru – breyta um framburð, fara að beygjast, o.s.frv. Önnur haldast í málinu án þess að laga sig að því – en án þess að „smita út frá sér“, þ.e. án þess að valda nokkrum breytingum á íslenskum orðum. Mér er ómögulegt að sjá tilganginn í því að koma lögum yfir lítið brot orðaforðans en líta fram hjá hugsanlegum áhrifum allra hinna orðanna.

Annar þáttur í mannanafnalögum sem varðar íslenska málstefnu eru ættarnöfnin. Ég tel reyndar að það mál falli miklu fremur undir íslenska menningu en íslenskt mál þótt auðvitað sé stutt þar á milli í þessu. Kenning til föður er vissulega rótgróinn þáttur í íslenskri menningu en kenning til móður hins vegar nýtilkomin, þótt hægt sé að benda á stöku eldri dæmi. En ættarnöfn eru í eðli sínu ekkert minni íslenska en föður- og móðurnöfn. Ýmis ættarnöfn eru af íslenskum rótum og ef upptaka ættarnafna yrði gefin frjáls má búast við að slíkum nöfnum myndi fjölga. En ég er hreint ekki sannfærður um að fólk myndi í stórhópum leggja niður föður- og móðurnöfn og taka upp ættarnöfn í staðinn, þótt slíkt yrði leyft.

Stundum er vísað til þess að föðurnöfn hafi horfið í Danmörku og Noregi á stuttum tíma, en slíkar vísanir til ólíkra samfélaga á öðrum tímum hafa takmarkað gildi. Nútímaviðhorf í jafnréttismálum eru t.d. líkleg til að valda því að konur séu ófúsari en áður að taka upp ættarnafn eiginmannsins. Hér má enn fremur benda á að vegna þess að Íslendingar hafa einir haldið þeim sið að kenna sig til föður (eða móður) er það ákveðið þjóðareinkenni sem vel má hugsa sér að margir vilji halda í þess vegna, en um slíkt var ekki að ræða í Danmörku og Noregi. Einnig má vísa til þess að í Færeyjum mun hafa færst í vöxt á seinustu árum að kenna sig til föður.

Ég tek heils hugar undir það að kenning til föður eða móður er menningarhefð sem æskilegt er að viðhalda. En hefðir eru lítils virði nema samfélagið þar sem þær gilda hafi áhuga á að halda í þær. Hefð sem þarf að viðhalda með lögum er ekki hefð – heldur nauðung. Hér vegur þó þyngst að núgildandi lög standast ekki með nokkru móti jafnræðiskröfur samtímans – og eru raunar að því er best verður séð brot á 65. grein stjórnarskrárinnar þar sem kveðið er á um að allir skulu vera jafnir fyrir lögunum. Það stenst því ekki að sumum sé leyft það sem öðrum leyfist ekki. Á þetta hefur oft verið bent, t.d. í athugasemdum nefndar sem samdi frumvarp að gildandi mannanafnalögum, og í athugasemdum Íslenskrar málnefndar við það frumvarp.

Að öllu samanlögðu er ég sannfærður um að aukið frelsi í nafngiftum er ekki skaðlegt fyrir íslenskt mál. Þvert á móti. Stífar reglur sem vísa í íslenska málstefnu en samræmast ekki jafnréttishugmyndum og stríða gegn réttlætiskennd fólks geta orðið til þess að ala á neikvæðum viðhorfum fólks til íslenskunnar. Því þarf hún síst af öllu á að halda um þessar mundir.

Máltækni í þágu samfélagsins

Þótt nokkur verkefni á sviði máltækni hafi verið unnin hér á landi undir lok 20. aldar má segja að skipuleg uppbygging íslenskrar máltækni hafi hafist fyrir rúmum 20 árum með út­tekt á ástandi og horfum í íslenskri tungu­tækni eins og sviðið var kallað þá. Tungu­tækni – skýrsla starfshóps kom út snemma árs 1999 en þar var áætlað að það kostaði u.þ.b. einn milljarð króna að gera íslenska mál­tækni sjálf­bæra. Að teknu tilliti til verðlagsbreytinga er þetta reyndar svipuð upphæð og nú er gert ráð fyrir að verja til verkefnisins.

Í kjölfar skýrslunnar kom ríkið á fót sérstakri tungutækniáætlun sem fékk sam­tals 133 milljónir króna á fjárlögum ár­anna 2000-2004. Fyrir það fé voru unn­in eða sett af stað ýmis verkefni sem sum lognuðust út af, önnur lögðu drög að seinni tíma starfi á þessu sviði, og enn önnur eru enn í fullu gildi. Því fór þó fjarri að íslensk máltækni væri orðin sjálf­bær þegar áætluninni lauk og næstu 10 ár var ekki sett neitt fé á fjárlögum í ís­lenska máltækni en með fáeinum styrkjum úr Rann­sóknasjóði, m.a. einum öndvegis­styrk, tókst að halda lífi í rannsóknar- og þróunarstarfi.

Þáttaskil urðu með þátttöku Íslands í evrópska META-NET verkefninu árin 2011-2013. Megin­markmið þess voru annars vegar að gera ítarlega úttekt á stöðu máltækni fyrir 30 evrópsk tungu­mál, og hins vegar að byggja upp og gera að­gengileg hvers kyns málleg gagnasöfn og hugbúnað fyrir þessi mál. Á Íslandi tókst að safna saman og byggja upp marg­vísleg gögn á þess­um tíma. Þau voru gerð aðgengileg í varðveislusafninu META-SHARE en einnig var settur upp vefurinn málföng.is þar sem hægt er að nálgast þessi gögn.

Auk þess var skrifuð ítarleg skýrsla, ein af 30 í sama sniði: Íslenska á stafrænni öld. Þegar niður­stöður skýrslnanna voru bornar saman kom í ljós að íslenska stæði næstverst málanna 30 hvað varðar mál­tækni. Þessar niðurstöður vöktu töluverða at­hygli hér á landi og voru m.a. rædd­ar á Alþingi. Það er óhætt að segja að skýrslan hafi verið einn helsti hvatinn að þings­álykt­un sem var samþykkt einróma 2014 um gerð áætlunar um uppbyggingu ís­lenskrar mál­tækni og leiddi að lokum til skýrslunnar Máltækni fyrir ís­lensku 2018-2022 – Verkáætlun.

Þátttakan í META-NET sýndi okkur mikilvægi alþjóðlegs samstarfs á þessu sviði og í mál­tækni­skýrslunni var lagt til að Ísland gerðist aðili að evrópska inn­viðaverk­efninu CLARIN ERIC. Það var sett á stofn til að staðla og gera aðgengi­leg gagna­söfn til nota í rann­sóknum á sviði félags- og hugvís­inda, en þessi gagna­söfn geta einnig nýst í mál­tækni og þess vegna er aðild að CLARIN mjög gagnleg. Ísland er þegar orðið áheyrnaraðili að sam­starf­inu og nú hefur íslenskum lögum verið breytt þannig að Ísland gæti sótt um fulla aðild.

Samstarfsnetið European Language Re­source Coordination hefur verið í gangi undanfarin fjögur ár. Það gengur einkum út á að afla mállegra gagna frá opinberum stofn­­un­um til nota í vél­rænum þýðing­um og nýta þau í opinberri þjónustu. Annað samstarfs­net er European Lan­guage Grid sem er nýtt og snýst aðallega um gögn sem nýt­ast fyrir­tækjum í iðnaði og við­skipta­­lífi. Ísland tekur þátt í báðum þessum netum sem skiptir gífurlegu máli til að geta fylgst með þróuninni, fengið aðgang að gögnum og þekkingu og komið okkar eigin gögnum á framfæri.

Máltækniáætlunin sem nú er verið að setja af stað mun kosta á þriðja milljarð króna. Þótt það sé ekki stór hluti af heild­ar­útgjöldum ríkissjóðs er þetta mikið fé, a.m.k. í samanburði við það sem við sem vinnum með íslenskt mál erum vön að sjá. Ég er samt sannfærður um að fáar fjár­fest­ingar borga sig betur og þjóðin á eftir að fá þetta margfalt til baka. Í huga margra tengist þetta verkefni fyrst og fremst verndun og varðveislu íslensk­unn­ar og hún verður vitanlega ekki metin til fjár. En máltækni er mikilvæg af fjöl­mörgum öðrum ástæðum og ég nefni örfá dæmi:

  • Fyrir jafnrétti og mannréttindi – máltækni getur skipt sköpum fyrir fjölmarga sem búa við ein­hvers kon­ar hömlun eða skerð­ingu, auðveldar þeim að ferðast um, bætir aðgengi þeirra að margs kyns þjón­ustu og lífsgæðum og getur gert þeim kleift að taka fullan þátt í daglegu lífi og starfi.
  • Fyrir tækniþróun og ný­sköp­un – máltækni er alþjóðleg og innan mál­tækniverkefnisins gefst íslensk­um fyrir­tækjum tækifæri til að vinna með vísindamönnum að þróun nýrrar tækni og af­urða sem geta nýst á alþjóðlegum mark­aði, auk þess sem aðferðirnar nýtast víðar en í máltækni.
  • Fyrir hagkvæmni og hagræð­ingu í rekstri – með hjálp talgreiningar, tal­gerv­ingar og gervi­greind­­ar geta fyrir­tæki sem reka þjón­ustu­ver t.d. látið tölvur sinna verulegum hluta aðstoðar­beiðna sem bæði lækkar kostnað og styttir biðtíma og eykur þannig ánægju viðskiptavina.
  • Fyrir skilvirkni í opinberri þjónustu – með notkun máltækni má hraða samskiptum milli opinberra aðila innbyrðis en fyrst og fremst stórbæta og auðvelda að­gengi almennings að þjónustu opin­berra stofnana og hraða afgreiðslu erinda og fyrirspurna.
  • Fyrir hraða og öryggi í heilbrigðisþjónustu – með notkun mál­tækni við greiningu og lýsingu rann­sókn­ar­­gagna og hvers kyns skráningu og miðlun upplýsinga má hraða upplýsinga­streymi og þannig flýta fyrir sjúk­dóms­grein­ingu og auka líkur á lækn­ingu.
  • Fyrir al­manna­varn­ir við náttúruvá – með sjálf­virk­um textaskrifum og vélrænum þýð­ing­um má t.d. koma upplýsingum um yfir­vof­andi eldgos eða flóð á fjölda tungumála til ferðamanna hvar sem þeir eru staddir og bæta samskipti milli viðbragðsaðila innbyrðis og við almenning.

Tölvutæknin er nú orðin fléttuð inn í flestar daglegar athafnir okkar. Tungu­málið er helsta sam­skiptatæki okkar á öllum sviðum mannlífsins og þess vegna þurfum við máltækni á öllum svið­um – íslenska máltækni. Uppbygging hennar og þróun er sannarlega í þágu samfélagsins.

Að og af

Forsetningarnar og af eru oft notaðar í sömu samböndum þótt önnur þyki venjulega réttari en hin. Í Málfarsbankanum er löng upptalning á samböndum þar sem talið er rétt að nota , og önnur samsvarandi fyrir af. Þessi dæmafjöldi sýnir glöggt að tilfinning málnotenda fyrir því hvora forsetninguna „eigi“ að nota er iðulega á reiki. Þótt ég sé í flestum tilvikum vanur að nota þá forsetningu sem er talin „rétt“ átta ég mig ekki á því hvort ég er alltaf alinn upp við þá notkun eða hef tileinkað mér hana í skóla.

Framburðarmunur og af er sáralítill og oft enginn í eðlilegu tali. Önghljóðin ð og f eru venjulega frekar veik í enda orða – sérstaklega áherslulítilla orða eins og forsetninga. Það er því mjög algengt að báðar forsetningarnar verði bara sérhljóðið a í framburði og þess vegna tökum við örugglega sjaldnast eftir því þótt einhver segi þar sem við ættum von á af og öfugt. En í rituðu máli kemur munurinn vitanlega fram. Þegar framburðarmunurinn er svona lítill verður að reiða sig á merkingu til að velja milli forsetninganna – eða hreinlega læra í hvaða samböndum hvor á að vera.

Grunnmerking er 'í áttina til' en grunnmerking af  er 'frá, burt'. Þar sem þessi grunnmerking er skýr verður þess ekki vart að forsetningunum sé blandað saman, svo að ég viti. Enginn segir *Ég gekk í átt af húsinu eða *Ég tók bókina að honum svo að ég viti. En þegar ekki liggur í augum uppi að þessi grunnmerking eigi við má búast við víxlum, þannig að af sé iðulega notað þar sem hefð er fyrir , og öfugt. Þetta sést greinilega ef maður skoðar dæmin í Málfarsbankanum sem hér var vísað til.

Ef þessum dæmum er flett upp á tímarit.is sést að víxlin má í mörgum tilvikum rekja aftur til 19. aldar. Í sumum tilvikum er „ranga“ notkunin eldri og/eða algengari en sú „rétta“. Þannig eru hátt í helmingi fleiri dæmi um ríkur af en ríkur að, og elsta dæmið um af er þremur áratugum eldra en elsta dæmið um . Heldur fleiri dæmi eru um auðugur af en auðugur að, og einnig heldur fleiri dæmi um snauður af en snauður að. Ýmis fleiri dæmi mætti nefna.

Eitt af því sem ýtir undir þessi víxl er það að stundum „á“ að nota mismunandi forsetningu með sama nafnlið eftir því hver sögnin er. Þannig er talið „rétt“ að segja hafa ánægju af, hafa gagn af, hafa gaman af o.fl., en hins vegar „á“ að segja það er ánægja að þessu, það er gagn að þessu, það er gaman að þessu o.s.frv. Svipað er með forsetningu með nafnorðinu tilefni – það „á“ að segja að gefnu tilefni, en hins vegar af þessu tilefni. Það er svo sem ekkert undarlegt að málnotendur blandi þessu saman.

Hvað á svo að segja um þessi víxl? Mér finnst mikilvægt að halda í merkingarmuninn milli og af, sem vísað er til hér að framan. En þar sem grunnmerkingin er óskýr eða alls ekki fyrir hendi finnst mér satt að segja ekki skipta miklu máli hvor forsetningin er notuð. Ef fólk hefur vanist notkun annarrar forsetningarinnar þótt hin sé talin „rétt“ sé ég enga ástæðu til að breyta því. Ég er t.d. vanur að tala um að gera mikið af einhverju og töluvert fleiri dæmi eru um það á tímarit.is en gera mikið sem er talið rétt. Ég held bara mínu striki.

Málvillur

Ég hef stundum fjallað um íslenskan málstaðal og frávik frá honum. Þessi frávik, þau tilbrigði sem samræmast ekki staðlinum, eru kölluð málvillur, þrátt fyrir að talsverður hluti þeirra sem eiga íslensku að móðurmáli – í sumum tilvikum meirihluti – noti þau. En hugum aðeins að því hvað við erum að segja með þessu. Erum við að segja að fólk sem elst upp í íslensku málumhverfi og tileinkar sér íslensku á máltökuskeiði kunni ekki íslensku? Getur málbreyting sem hefur náð til umtalsverðs hluta málnotenda verið villa? Hvaða vit er í því? Athugið að málstaðallinn sem notaður er til að skilgreina villurnar er mannanna verk, og það er á margan hátt tilviljanakennt hvað rataði inn í hann. Margar breytingar sem orðið hafa frá fornmáli komust inn í staðalinn og eru viðurkenndar og ekki taldar villur.

Þetta táknar ekki að rétt sé að viðurkenna öll afbrigði frá staðlinum, eða vísa hugtakinu málvilla út í hafsauga. Mér finnst alltaf best að nota skilgreiningu nefndar um „málvöndun og framburðarkennslu í grunnskólum“ frá 1986: „rétt mál er það sem er í samræmi við málvenju, rangt er það sem brýtur í bága við málvenju“. Í samræmi við þetta er alveg eðlilegt að kalla tilviljanakennd og einstaklingsbundin frávik frá staðlinum málvillur, en ef frávikin eru farin að ná til hóps af fólki og börn farin að tileinka sér þau á máltökuskeiði er eðlilegt að tala um málbreytingu en ekki villu. Það er að mínu mati mjög brýnt að breyta málstaðlinum sem hefur gilt undanfarna öld, viðurkenna staðreyndir og taka inn í staðalinn ýmsar breytingar sem hafa verið í gangi og verða ekki stöðvaðar.

Það má nefnilega ekki vera þannig að einhverjum hópum eða einstaklingum í samfélaginu finnist ís­lensk­an ekki gera ráð fyrir sér, og það má ekki heldur vera þannig að einhverjum finnist gert lítið úr því máli og þeirri málnotkun sem þau eru alin upp við eða hafa vanist. Þótt sumir tali svolítið öðruvísi íslensku en þá sem ég ólst upp við í norðlenskri sveit fyrir 50-60 árum gefur það mér engan rétt til að fordæma íslensku annarra eða líta niður á hana. Íslenskan er nefnilega alls konar. App er líka íslenska. Mér langar er líka íslenska. Hán er líka íslenska. Og síðast en ekki síst: Íslenska með hreim og beygingarvillum er líka íslenska.

Er íslenska erfið?

Í fyrra hafði blaðið Grapevine, sem gefið er út á ensku í Reykjavík, samband við mig og bað mig að svara spurningunni „Why is Icelandic such a difficult language to learn?“ eða „Hvers vegna er íslenska svona erfið?“. Þetta er goðsögn sem margir þekkja, að íslenska sé með erfiðustu málum. Vissulega er ýmislegt í íslensku sem getur verið snúið, en það fer þó að talsverðu leyti eftir móðurmáli málnemans og þeim tungumálum sem hann hefur haft kynni af.

Íslenska er t.d. talin tiltölulega erfið fyrir fólk með ensku að móðurmáli enda hefur hún ríkulegar beygingar miðað við ensku, en slíkt ætti ekki að koma t.d. fólki af slavneskum uppruna á óvart. Það eru ákveðin sérkenni í íslensku hljóðkerfi og setningagerð sem geta vafist fyrir útlendingum, en þegar á heildina er litið er varla hægt að segja að íslenska sé erfiðari en gengur og gerist um tungumál.

En hitt er vissulega rétt að mörgum útlendingum finnst íslenska erfið og hika við að tala hana við Íslendinga. Ég held að ein ástæðan fyrir því sé sú að Íslendingar eru ekki – eða hafa ekki verið – sérlega umburðarlyndir gagnvart beygingarvillum, erlendum hreim, og öðrum merkjum um ófullkomna íslensku. Ísland var til skamms tíma eintyngt samfélag og við vorum því ekki vön því að heyra útlendinga reyna að tala málið og hætti til að gagnrýna tilraunir þeirra til þess harkalega.

En málfærni fæst ekki nema með æfingu, og til að ná valdi á tungumáli þurfum við að fá tækifæri til að nota það við mismunandi aðstæður. Útlendingar kvarta oft yfir því að það sé ómögulegt að læra íslensku af Íslendingum því að þeir skipta svo oft yfir í ensku um leið og þeir átta sig á því að viðmælandinn talar íslensku ekki reiprennandi. Þetta þarf að breytast – við þurfum að vera þolinmóðari og umburðarlyndari gagnvart ófullkominni íslensku. Íslenska er alls konar.