Konuforseti

Í Málvöndunarþættinum á Facebook og víðar hefur oftar en einu sinni skapast umræða um orðið konuforseti sem kemur fyrir í titli á nýrri barnabók um Vigdísi Finnbogadóttur. Margir hafa hneykslast á þessu orði og sagt að það sé barnamál – þetta heiti kvenforseti á íslensku. Það er auðvitað rétt að það er hefð fyrir orðinu kvenforseti þótt sú hefð sé raunar ekki ýkja gömul – elsta dæmið um orðið á tímarit.is er 60 ára gamalt og orðið komst ekki í almenna notkun fyrr en með kjöri Vigdísar 1980.

Bæði orðin, kvenforseti og konuforseti, eru jafnrétt íslenska, í þeim skilningi að þau lúta orðmyndunarreglum málsins. Samsett orð í íslensku eru einkum af tvennum toga – í sumum er fyrri liðurinn orðstofn, eins og kven-, en í öðrum er fyrri liðurinn eignarfall (eintölu eða fleirtölu), eins og konu-. Það eru til ýmsar fullkomlega viðurkenndar samsetningar með konu- sem fyrri lið – konudagur, konukvöld, konuríki, konubíll, konuleit, konuefni, konukind, Konukot o.fl.

En þótt báðar orðmyndunaraðferðirnar sem nefndar eru hér að ofan séu jafnréttar er almennt séð eðlilegt að halda sig við hefðina – ef komin er hefð á aðra aðferðina er oftast ástæðulaust að mynda orð sömu merkingar eftir hinni aðferðinni. En það er samt ekki rangt.

Það er líka rétt að athuga að fjölbreytni í málnotkun þykir yfirleitt af hinu góða. Það er ekkert að því að hafa fleiri en eitt orð yfir sama hugtak. Í slíkum tilvikum hafa orðin oft með sér einhverja verkaskiptingu – barn er formlegra en krakki, bifreið er formlegra en bíll, fákur er formlegra en hestur o.s.frv. Það táknar ekki að annað orðið um hvert þessara hugtaka sé eitthvað betra eða réttara en hitt – þau henta bara mismunandi aðstæðum, mismunandi málsniði.

Þannig er það einmitt í þessu tilviki. Höfundur umræddrar bókar hefur skýrt titilinn fullkomlega: „Bókin er um barn sem fer í heimsókn til Vigdísar í þeim tilgangi að skrifa um hana bók. Titill bókarinnar er titill barnsins.“

Eitt af því merkilegasta og stórkostlegasta við börn er hvað þau eru óhrædd við að nota málið. Ef þau kunna ekki orð um eitthvað sem þau vilja tala um búa þau til sitt eigið orð, í samræmi við þær reglur málsins sem þau hafa tileinkað sér. Konuforseti er orð af því tagi. Kvenforseti er sjaldgæft orð sem ekki er hægt að búast við að ung börn þekki, og myndin kven- er svo fjarlæg orðinu kona að það er ekki við því að búast að börn hafi orðmyndun með henni á valdi sínu. En þau eru ekki í neinum vanda með að búa til orðið konuforseti – gott og gilt orð í fullu samræmi við íslenskar orðmyndunarreglur.

En hér hangir meira á spýtunni. Börn hafa gaman af tungumálinu og hæfileikar þeirra til nýsköpunar í máli eru dýrmætir fyrir íslenskuna og framtíð hennar. Með því að hafna nýsköpun barnanna, með því að vera sífellt að segja að þeirra orð séu ekki til, erum við að brjóta niður áhuga þeirra á málinu og vinna gegn íslenskunni. Þess í stað eigum við að taka nýmyndunum barnanna vel og nota þær til að kveikja umræður um tungumálið – umræður sem börnin eru móttækileg fyrir.

Höfundur umræddrar bókar segir að orðið konuforseti í titlinum sé valið í samráði við Vigdísi sjálfa. Enginn getur sakað Vigdísi um að vilja ekki veg íslenskunnar sem mestan. En hún skilur að ólík orð henta mismunandi aðstæðum. Hún skilur að framtíð íslenskunnar veltur á því að börnin hafi áhuga á að nota hana, og þann áhuga má ekki drepa með því að berja niður frjóa málnotkun þeirra.

Málfræðikennsla

Um daginn hringdi í mig framhaldsskólanemi sem ég kannast við og var að spyrja mig út í orðflokkagreiningu. Hann var á leið í íslenskupróf og var óviss á ýmsum atriðum en hafði lært utan að nokkrar þumalfingursreglur um einkenni ákveðinna orðflokka og var að bera undir mig hvort einhverjar líkur væru á að þær kæmu honum í gegnum prófið.

Það var greinilegt að íslenska var ekki uppáhaldsnámsgrein hans – hann er í iðnnámi og gat ómögulega séð nokkurn tilgang í þessari greiningu. Ég gat ekki annað en tekið undir það. Mér finnst fráleitt að verja takmörkuðum kennslutíma í íslensku í tilgangslausa og steingelda greiningu af þessu tagi, og í vonlausa baráttu gegn áratuga gömlum málbreytingum sem gera málinu engan skaða. Þetta þýðir alls ekki að ég sé á móti allri málfræðikennslu – skárra væri það nú. Málfræðin er gagnleg til að átta sig á uppbyggingu tungumálsins og til að auðveldara sé að leiðbeina um ýmis atriði í meðferð þess.

EN – og það er stórt EN – til að hún nýtist á þann hátt þarf að vera á einhverju að byggja. Það þarf að vera búið að þjálfa nemendur í að lesa margs konar texta og fjalla um hann frá ýmsum hliðum. Það þarf að vera búið að vekja áhuga nemenda á málinu og fjölbreytileik þess. Þá getur málfræðikennslan verið gagnleg – og jafnvel skemmtileg ef rétt er á haldið. Greiningarvinna án grundvallar er hins vegar bara til bölvunar.

Af tveimur ástæðum. Annars vegar vegna þess að hún tekur tíma frá mikilvægari hlutum – lestri margvíslegra texta, þjálfun í orðaforða og lesskilningi, ritun, munnlegri tjáningu o.þ.h. Hins vegar vegna þess að hún gerir nemendur fráhverfa íslensku sem námsgrein og elur á neikvæðum viðhorfum þeirra til málsins. Nú veit ég auðvitað að kennsla í grunn- og framhaldsskólum er með ýmsu móti og dettur ekki í hug að fullyrða að áherslur í kennslunni séu alls staðar á greiningu og rétt mál. En samræmdu prófin gera a.m.k. sitt til að viðhalda þessu. Ef við ætlum að bæta árangur okkar í PISA verður að breyta þessu.

PISA

Ég hjómaði yfir PISA-skýrsluna og fór á fund um hana á Menntavísindasviði  Það er auðvitað alvarlegt mál að útkoma íslenskra unglinga á lesskilningsprófi fari versnandi en það er athyglisvert að lesskilningurinn er sér á báti í þessu – útkoman í stærðfræði- og náttúrufræðilæsi er svipuð og síðast (en ekki góð). Þetta vekur þá spurningu hvort útkoman í lesskilningsprófinu endurspegli fyrst og fremst veikari stöðu íslenskunnar í málsamfélaginu á síðustu árum en áður – sem ýmsar vísbendingar eru um.

Það hefur margsinnis verið bent á það hvernig samfélags- og tæknibreytingar hafa þrengt að íslenskunni undanfarinn áratug – t.d. í grein minni í Skírni 2016, grein okkar Sigríðar Sigurjónsdóttur í Netlu í fyrra, og í ótal erindum sem við höfum haldið undanfarin ár í tengslum við rannsóknarverkefnið Greining á málfræðilegum afleiðingum stafræns málsambýlis. Þróunin ætti því ekki að koma á óvart.

Þetta kallar á önnur viðbrögð en ef um tæknileg atriði varðandi læsi er að ræða.  Læsisátakið sem hefur verið í gangi er gott og gilt en það er samt hætt við að það skili litlu ef ekki er um leið hugað að því að styrkja stöðu íslenskunnar í samfélaginu, ekki síst meðal barna og unglinga. Til þess þarf margvíslegar aðgerðir og það er mikilvægt að ráðast að rótum vandans. Máltækniátak er í gangi, en það þarf líka að stórauka útgáfu á góðu lestrarefni fyrir börn og unglinga, framleiðslu á íslensku sjónvarps- og margmiðlunarefni, tölvuleikjagerð á íslensku, o.fl.

Til að byggja upp traust málkerfi barna á máltökuskeiði skiptir öllu máli að tala sem mest við börnin, lesa fyrir þau og lesa með þeim, og láta þau lesa sjálf þegar þau hafa aldur til. En þetta dugir ekki til þegar kemur að því að þjálfa lesskilning, eins og hann er mældur t.d. í PISA-prófum. Til að öðlast góðan lesskilning þurfa börnin að læra annars konar orðaforða en fæst með venjulegum yndislestri, og ná valdi á fjölbreyttari og flóknari setningagerðum en notaðar eru í samtölum og afþreyingarefni.

Þennan orðaforða og þessar setningagerðir þarf að kenna sérstaklega, með því að láta börn og unglinga lesa viðeigandi texta. Ef við viljum bæta lesskilning ungs fólks held ég að það sé forgangsverkefni að efla rannsóknir á íslenskum orðaforða og setningagerð – setja fram rökstudd viðmið um það hvaða orðaforða og hvaða setningagerðir hver aldurshópur þarf að hafa á valdi sínu, og útbúa síðan viðeigandi kennsluefni fyrir hvern aldurshóp.

Við höfum núna miklar upplýsingar um orðaforða í mismunandi textategundum. Risamálheildin sem komið hefur verið upp hjá Árnastofnun hefur að geyma á annan milljarð orða úr fjölbreyttum textum – fréttum, lagatextum, dómum, þingræðum, fræðsluefni, bloggi o.fl. Þarna eru komnar forsendur til að útbúa skrá um orð sem mikilvægt er að börn og unglingar tileinki sér, og nýta þá skrá til að velja eða semja texta sem hægt er að láta þau lesa.

Það skiptir öllu máli að átta sig á að ábyrgðin á því að bæta úr verður ekki lögð á skólakerfið eitt og sér – þetta er ekki síður verkefni foreldra og annarra uppalenda, og samfélagsins í heild. Það er mjög mikilvægt að auka íslenskukennslu í skólum og endurskoða námsefni eins og mennta- og menningarmálaráðherra vill gera, en það dugir skammt ef grundvöllurinn, sem er lagður á máltökuskeiði á fyrstu árum barnsins, er of veikur. Samtal foreldra og barna, og lestur fyrir börn og með börnum, er frumforsendan.

Ef þessi grundvöllur er sterkur getur skólakerfið byggt ofan á hann. En þá skiptir máli að kennslutíminn sé nýttur vel – ekki í ófrjóa greiningarvinnu eða vonlausa baráttu við langt gengnar málbreytingar, heldur í lestur hvers kyns texta, eflingu orðaforða og þjálfun í ritun og munnlegri tjáningu.

 

Stigbreytist margur?

Orðið margur er talið lýsingarorð í öllum kennslubókum og tæplega er ástæða til að efast um þá greiningu – orðið hefur bæði dæmigerða beygingu og setningarstöðu lýsingarorða. Eina vafaatriðið er stigbreytingin, sem vissulega er eitt megineinkenni lýsingarorða, því að margur hefur ekki reglulegt miðstig eða efsta stig – myndirnar *margari og *margastur eru ekki til, heldur eru fleiri og flestur notaðar í staðinn. En það er svo sem ekkert einsdæmi að algeng lýsingarorð stigbreytist óreglulega – margur er þar í hópi með góður, gamall, lítill, mikill, slæmur og illur.

Skortur á reglulegri stigbreytingu dugir því ekki til að gera flokkun orðsins sem lýsingarorðs vafasama. En það er samt ekki alveg ljóst að það sé rétt að greina fleiri og flestur sem beygingarmyndir af margur. Setningarstaða miðstigsins og efsta stigsins virðist nefnilega vera verulega frábrugðin stöðu frumstigsins. Flest lýsingarorð geta staðið milli lauss greinis og nafnorðs, og hafa þá veika beygingu: Hinir góðu menn, Hinar skemmtilegu konur, Hið ágæta fólk. Þótt frumstigið sé vissulega algengast í þessari setningagerð – eins og í málinu yfirleitt – geta miðstig og einkum efsta stig einnig staðið þar: Hinir betri/bestu menn, Hinar skemmtilegri/skemmtilegustu konur.

Frumstig lýsingarorðsins margur er mjög algengt í þessari setningagerð: Hin mörgu andlit Indlands, Hinir mörgu aðdáendur Einars Áskels, o.s.frv. Hins vegar koma miðstigið fleiri og efsta stigið flestir varla eða ekki fyrir í þessu sambandi, og raunar virðist veik beyging efsta stigs (sem ætti að vera *flestu) ekki vera til. Á tímarit.is eru dæmin um lausan greini + fleiri/flestir + nafnorð teljandi á fingrum annarrar handar, og í Risamálheildinni sem hefur að geyma á aðra milljón orða finnast engin dæmi um miðstigið eða efsta stigið í þessu sambandi en aftur á móti tæp 800 dæmi um frumstigið. Hjá öllum öðrum algengum lýsingarorðum má finna fjölda dæma um a.m.k. efsta stigið í þessu sambandi.

Setningafræðileg hegðun orðanna fleiri og flestur er því bæði frábrugðin hegðun frumstigsins margur, og einnig frábrugðin hegðun miðstigs og efsta stigs annarra lýsingarorða. Aftur á móti haga fleiri og flestur sér að þessu leyti eins og ótvíræð óákveðin fornöfn – það er ekki hægt að segja *Hinir sumu menn, *Hinir nokkru menn o.s.frv. frekar en *Hinir fleiri menn, *Hinir flestu menn. Það er freistandi að segja að fleiri og flestir séu ekki beygingarmyndir af lýsingarorðinu margur, heldur sjálfstæð orð – og raunar ekki einu sinni lýsingarorð, heldur óákveðin fornöfn.

Sú niðurstaða myndi í fyrsta lagi byggjast á því að þau eru orðmyndunarlega óskyld margur, í öðru lagi á ólíkri setningarstöðu þeirra, og í þriðja lagi á því að flestur hefur aðeins sterka beygingu eins og óákveðin fornöfn (fleiri er venjulega talið veik beyging en það er í raun merkingarlaust vegna þess að orðið hefur alltaf þetta sama form). En kannski væri þetta of djörf ályktun. Kannski er ekki hægt að ganga lengra en svo að taka undir með Gísla Jónssyni sem sagði einu sinni: „Auðvitað er ekkert hafdjúp á milli sumra orðflokka, og sum orð eru vanddregin í dilk.“ Kannski verða fleiri og flestur að fá að vera hálfpartinn í lausu lofti milli lýsingarorða og óákveðinna fornafna – eins og kannski ýmis.

Siðrof

Siðrof er ekki gamalt orð í málinu og finnst ekki í orðabókum, hvorki Íslenskri orðabókÍslenskri nútímamálsorðabók. Orðið mun hafa verið búið til upp úr 1970 en elsta dæmi um það á tímarit.is er í grein sem Loftur Guttormsson skrifaði í Sögu 1979 um kenningar félagsfræðingsins Émile Durkheim. Þar er skýringin „anomie“ sett í sviga fyrir aftan og orðið síðan skýrt: „Siðrof er e. k. upplausnarástand sem birtist í ýmsum myndum, t.d. viðskiptakreppum, stéttaátökum, hárri sjálfsmorðstíðni.“

Orðið kemur nokkrum sinnum fyrir á næstu þremur áratugum og oftastnær í þessari merkingu að því er virðist. Notkun þess tók síðan stökk haustið 2008 í kjölfar efnahagshrunsins sem iðulega var tengt við siðferðilegt skipbrot og upplausn. Orðið var mikið notað næstu fimm árin eða svo en heldur virðist hafa dregið úr notkun þess á allra síðustu árum eftir því sem hrunið fjarlægist. Af orðum Karls Sigurbjörnssonar þáverandi biskups í Morgunblaðinu 2012 má ráða að kirkjan hafi líka notað orðið í áðurnefndri merkingu:

„Viðhorfin á árunum um og eftir aldamót voru þannig að fólk gaf ekki sem skyldi gaum að þessum gömlu og góðu gildum sem Íslendingum hafa dugað svo vel í aldanna rás, það er hógværð, auðmýkt, virðing og þrautseigja. Í staðinn komu og urðu áberandi lestir eins og oflæti, sjálfumgleði og hroki. Þetta voru atriði sem sköpuðu siðrof í íslensku samfélagi og stuðluðu að því áfalli sem við höfum enn ekki bitið úr nálinni með.“

Vissulega geta orð breytt um merkingu og gera það oft. Ef málnotendur, eða talsverður hluti þeirra, koma sér saman um að nota orð í annarri merkingu en það hafði áður er oft ekkert við það að athuga – það er hluti af eðlilegri málþróun. Fjöldi orða sem við notum daglega hefur aðra merkingu nú en áður, án þess að við gerum okkur grein fyrir því eða það trufli okkur á nokkurn hátt. En það skiptir máli hvernig merkingarbreytingin verður. Einn málnotandi eða lítill hópur getur ekki tekið það upp hjá sjálfum sér að nota orð í annarri merkingu en hefðbundin er – og ætlast til að aðrir átti sig á því og samþykki það.

Í þessu tilviki er þar að auki um að ræða orð sem er myndað sem fræðiorð, íðorð – gert til að tákna ákveðið fræðilegt hugtak. Íðorð lúta svolítið öðrum lögmálum en almennur orðaforði. Þau eru hluti af ákveðnu hugtakakerfi og það er mikilvægt að merking þeirra sé skýrt skilgreind og fari ekki á milli mála. Fram að efnahagshruninu 2008 er siðrof augljóslega fyrst og fremst íðorð, og iðulega notað í tengslum við kenningar Durkheims þaðan sem það er komið eins og áður segir. Eftir 2008 kemst orðið hins vegar í miklu almennari og víðtækari notkun og þá má e.t.v. segja að það færist yfir í almennan orðaforða málsins.

Eftir sem áður virðist merking þess undantekningarlítið vísa í einhvers konar umrót eða upplausn og vera neikvæð. Þegar spurningu um áhrif þess að kristinfræði sé ekki lengur kennd í skólum er svarað með því að segja „Það hefur orðið siðrof held ég“ er meðvitað eða ómeðvitað vísað í hina venjulegu og alþekktu merkingu orðsins siðrof, þótt eftir á sé sagt að siðrof sé ekki siðleysi heldur „rof við siðinn sem við höfum lifað eftir um aldir á Íslandi“. Sú skýring stenst því aðeins að átt sé við að því rofi fylgi það upplausnarástand sem að ofan er lýst.

Íslensk málgögn

„Íslensk málgögn“ eru safn stafrænna málgagna, þ.e. margvíslegra gagna um íslenskt mál (textagagna, tölfræðigagna, hljóðskráa, myndefnis), sem hafa orðið til á undanförnum árum í ýmsum rannsóknarverkefnum sem flest hafa verið styrkt af Rannsóknasjóði. Málfræðilegar rannsóknir hafa breyst mikið á undanförnum árum, samfara þróun upplýsinga- og tölvutækni. Breytingarnar koma ekki síst fram í því að vægi megindlegra rannsókna hefur aukist mjög og frá því um síðustu aldamót hafa langflestar íslenskar málfræðirannsóknir verið megindlegar að verulegu leyti – byggst á víðtækri gagnasöfnun og tölfræðilegri úrvinnslu gagnanna. Sem dæmi má nefna tvær viðamestu rannsóknir sem hafa verið gerðar á íslensku máli og báðar fengu öndvegisstyrk Rannsóknasjóðs – „Tilbrigði í setningagerð“ 2005-2007 og „Greining á málfræðilegum afleiðingum stafræns málsambýlis“ 2016-2019.

Í mörgum af þessum rannsóknum hafa orðið til gífurlega mikil og fjölbreytt gögn – málgögn – sem flest eru á stafrænu formi. Þessi gögn eru einkum af fernum toga. Í fyrsta lagi ýmiss konar textagögn, t.d. spurningakannanir af ýmsu tagi og svör við þeim, uppskriftir samtala og viðtala við börn og fullorðna, uppskriftir texta frá eldri málstigum o.fl. Í öðru lagi tölfræðileg gögn – einkum skrár úr SPSS, Excel og R, sem geyma töluleg gögn og margvíslega úrvinnslu úr ýmsum rannsóknum. Í þriðja lagi hljóðskrár – t.d. samtöl og viðtöl við börn og fullorðna, upptökur úr framburðarrannsóknum og hljóðfræðirannsóknum o.fl. Í fjórða lagi er svo myndefni, einkum myndir sem hafa verið notaðar í framburðarrannsóknum og myndir af framburðarspjöldum.

Þessi gögn eru nú yfirleitt varðveitt hjá stjórnendum þeirra verkefna þar sem þau urðu til, og eru þar ekki aðgengileg öðrum nema með sérstöku leyfi og atbeina verkefnisstjóranna (sem í sumum tilvikum eru hættir störfum). Skipulag á varðveislu gagnanna er oft laust í reipunum, gögnin eru á mismunandi formi, lýsigögn oftast af skornum skammti, og stundum er að finna í gögnunum persónugreinanlegar upplýsingar sem ekki er heimilt að gera opinberar. Það er því oft umtalsverð fyrirhöfn fyrir verkefnisstjóra að veita aðgang að gögnum sínum, og ekki síður fyrirhöfn fyrir notendur að setja sig inn í skipulag þeirra og átta sig á þeim.

„Íslensk málgögn“ munu skapa margvíslega nýja möguleika í rannsóknum. Söfnun og tölfræðileg úrvinnsla mállegra gagna er geysilega tímafrek og dýr. Í nokkrum af þeim rannsóknarverkefnum sem munu leggja til gögn hefur gagnasöfnun t.d. farið fram víða um land (og jafnvel erlendis, í Færeyjum og Vesturheimi) með tilheyrandi ferðakostnaði. Í þessum gögnum liggja því mikil verðmæti og það er til mikils að vinna að ná betri nýtingu út úr þessum gögnum. Umsækjendur telja að hér gefist einstakt tækifæri til að útvega þeim sem fást við rannsóknir á íslensku máli mikil verðmæt gögn með litlum tilkostnaði.

Í flestum tilvikum hafa gögnin nýst vel til þess sem þau voru upphaflega ætluð, og skilað fjölmörgum bókum og fræðigreinum. En mikið af þeim gæti nýst áfram, væru þau aðgengileg – bæði til áframhaldandi rannsókna á sama sviði og ekki síður til annars konar rannsókna en þau voru upphaflega ætluð til. Þeir sem búa yfir gögnunum eru oftast fúsir til að opna þau og gera þau aðgengileg en skortir bolmagn og aðstöðu til þess. Iðulega þarf að leggja talsverða vinnu í að tilreiða gögnin þannig að hægt sé að opna þau öllum – semja ítarleg lýsigögn, fjarlægja persónugreinanlegar upplýsingar, koma gögnunum á staðlað form o.fl. Þetta er vinna sem umráðamenn gagnanna geta ekki tekið á sig nema að litlu leyti.

Að auki þarf að tryggja örugga vistun gagnanna og varanlegt aðgengi að þeim. Með þátttöku Íslands í evrópska innviðaverkefninu CLARIN ERIC og uppsetningu CLARIN-miðstöðvar á Íslandi er kominn vettvangur til að vista gögnin varanlega og tryggja aðgang að þeim til frambúðar. Sá aðgangur verður með mismunandi móti eftir eðli gagnanna. Í flestum tilvikum verður hægt að hlaða þeim niður til áframhaldandi vinnslu án sérstakra takmarkana, en notendur verða þó að samþykkja sérstakt notkunarleyfi, sem getur verið misjafnlega takmarkandi, sem skilyrði fyrir niðurhali. Textagögn verða einnig gerð leitarbær í hugbúnaðinum Korp.

Aðstandendur verkefnisins fást við fjölbreyttar rannsóknir á sviði íslenskrar málfræði, talmeinafræði og máltækni og munu nýta gögnin í rannsóknum sínum og vísa nemendum sínum á þau. En einnig er ljóst að fjöldi annarra fræðimanna, innan lands og erlendis, mun nýta gögnin ef þau eru gerð aðgengileg. Þar skiptir máli vistun þeirra á CLARIN-miðstöðinni þar sem þau verða skráð í gagnagrunn CLARIN og lýsigögn þeirra – og í sumum tilvikum gögnin sjálf – þar með hluti af leitargrunni CLARIN. Til að auðvelda erlendum fræðimönnum notkun gagnanna verða lýsigögnin bæði á íslensku og ensku.

Í sumum tilvikum hafa möguleikarnir sem gögnin bjóða upp á til að rannsaka það sem þau voru upphaflega gerð fyrir ekki verið fullnýttir. Þannig má nefna að Margrét Guðmundsdóttir doktorsnemi hefur tölvuskráð upplýsingar á framburðarspjöldum Björns Guðfinnssonar frá því um 1940, sem varðveitt eru í Landsbókasafni – Háskólabókasafni, og sýnt fram á að úr þeim gögnum má lesa meiri og nákvæmari upplýsingar um íslenskar framburðarmállýskur fyrir miðja 20. öld en áður hafði verið gert, þótt á sínum tíma hafi verið gefnar út tvær bækur um niðurstöður rannsóknar Björns. Miklar ónýttar upplýsingar til viðbótar mætti enn vinna úr spjöldunum.

Einnig má nefna að Höskuldur Þráinsson prófessor emeritus hefur gert mikinn fjölda SPSS-skráa með tölfræðilegum gögnum úr verkefnunum „Tilbrigði í setningagerð“ sem unnið var að frá 2005-2007 og „Tilbrigði í færeyskri setningagerð“ sem unnið var að frá 2008-2009. Þótt gefnar hafi verið út þrjár bækur með niðurstöðum fyrrnefnda verkefnisins, auk fjölda greina og ritgerða um bæði verkefnin, er enn að finna miklar og fjölbreyttar upplýsingar í þessum skrám sem ekki hefur verið unnið úr.

Í öðrum tilvikum geta gögnin nýst til annars en þeim var upphaflega ætlað. Hér má aftur taka dæmi af framburðarrannsókn Björns Guðfinnssonar um 1940 og verkefninu „Rannsókn á íslensku nútímamáli“ (RÍN) upp úr 1980. Bæði þessi verkefni skiluðu niðurstöðum sem birtust á prenti á sínum tíma, í bókum og greinum. En vegna þess að frumgögn Björns voru varðveitt var hægt að nýta þau til samanburðar við RÍN-rannsóknina til að kortleggja breytingar á framburði Íslendinga yfir 40 ára tímabil mun betur en ef eingöngu hefði þurft að miða við útgefnar niðurstöður rannsókna Björns.

Gögn úr báðum þessum rannsóknum voru síðan notuð í verkefninu „Málbreytingar í rauntíma í íslensku hljóðkerfi og setningagerð“ (RAUN) á árunum 2010-2012. Þar var hægt að rekja breytingar á framburði sama fólks yfir 70 ára tímabil sem er einstakt í heiminum. Í síðastnefnda verkefninu var einnig athuguð þróun ákveðinnar setningafræðilegrar breytingar („nýju þolmyndarinnar“ eða „nýju ópersónulegu setningagerðarinnar“), sem Sigríður Sigurjónsdóttir og Joan Maling rannsökuðu fyrst í máli barna 1999-2000, og síðan var aftur rannsökuð í máli sumra sömu einstaklinganna – sem þá voru um tvítugt.

Þessi endurnýting rannsóknargagna var möguleg vegna þess að sömu fræðimenn stóðu að henni og höfðu unnið upphaflegu rannsóknirnar – eða þá að eldri gögn voru aðgengileg þótt mikla vinnu þyrfti að leggja í að gera þau nýtileg til samanburðar, eins og tilfellið var með gögn Björns Guðfinnssonar. En vitanlega er óæskilegt og hamlandi að endurnýting rannsóknargagna sé bundin við upphaflega safnendur gagnanna. Mikilvægt er að aðrir fræðimenn, innan lands og erlendis, hafi greiðan aðgang að þessum gögnum og geti nýtt þau í margvíslegum rannsóknum.

Það hefur sýnt sig að erlendir fræðimenn hafa nýtt sér íslensk málleg gögn sem hafa verið gerð aðgengileg. Gott dæmi um það er að tvær doktorsritgerðir sem varðar voru í lok síðasta árs, önnur við háskólann í Manchester á Englandi en hin við háskólann í Konstanz í Þýskalandi, byggjast algerlega á Sögulega íslenska trjábankanum (IcePaHC) sem var gerður innan öndvegisverkefnisins „Hagkvæm máltækni utan ensku“ sem Rannsóknasjóður styrkti árin 2009-2011. Trjábankinn hefur frá upphafi (2011) verið öllum aðgengilegur til niðurhals.

Á undanförnum árum og áratugum hafa gögn úr þeim rannsóknum sem munu leggja efni til „Íslenskra málgagna“ nýst á mjög fjölbreyttan hátt í námi og kennslu í íslensku og almennum málvísindum – í aragrúa námskeiðsritgerða og verkefna, fjölda BA- og MA-ritgerða, og stöku doktorsritgerðum. Í sumum tilvikum hafa ritgerðarhöfundar verið sjálfir að vinna við viðkomandi rannsókn og þannig haft beinan og milliliðalausan aðgang að gögnum, en í öðrum tilvikum hafa þeir fengið aðgang að gögnunum hjá verkefnisstjórum. Slíkt er þó oft snúið og getur kostað verulega vinnu bæði fyrir umsjónarmann gagnanna og ritgerðarhöfund, eins og áður er rakið.

Með opnu aðgengi að gögnum, samræmdu gagnasniði og stöðluðum lýsigögnum, verður margfalt auðveldara en áður að láta stúdenta vinna með gögnin á ýmsan hátt, bæði í smærri námskeiðsverkefnum og stærri ritgerðum – námskeiðsritgerðum, BA- og MA-ritgerðum og jafnvel doktorsritgerðum. En einnig skapast nýir möguleikar til vinnu með gögnin – hægt verður að láta stúdenta bera gögn úr mismunandi rannsóknum saman á ýmsan hátt, skoða þróun málbreytinga o.s.frv. Þetta verður því alger gullkista til þjálfunar stúdenta í sjálfstæðri vinnu með fjölbreytileg málleg gögn, og það er vitaskuld mjög hvetjandi fyrir stúdenta að fá tækifæri til að svara spurningum sem ekki hefur verið svarað áður.

Vistun gagnanna á CLARIN-miðstöðinni og tenging við gagnanet CLARIN gerir það að verkum að fræðimenn erlendis fá vitneskju um gögnin og eiga greiðan aðgang að þeim. CLARIN-miðstöðin sér um að koma gögnunum fyrir í því tæknilega umhverfi sem þar verður til staðar (CLARIN technical centre) og tengja þau við CLARIN-netið.

Enskættað orðalag

Erlend orðasambönd hafa alla tíð streymt inn í málið og yfirleitt klæðst íslenskum búningi að mestu eða öllu leyti, í þeim skilningi að þau innihalda engin framandi hljóð, öll orðin í þeim eru oftast íslensk og beygjast á hefðbundinn hátt. Þau bera það því ekki með sér að þau séu erlend að uppruna og til að átta okkur á því þurfum við að þekkja þau í upprunamálinu. Lengi vel komu slík sambönd úr dönsku og margir minnast þess úr skólagöngu sinni að amast hafi verið við algengum orðasamböndum eins og fyrst og fremst, til að byrja með og fjölmörgum öðrum sem eru hluti af daglegu máli okkar. Nú fá þessi sambönd og önnur álíka að vera í friði víðast hvar nema helst í MR.

Nú eru dönskuslettur alveg fyrir bí, eins og einhvern tíma var sagt, og jafnvel talað um að friða þær. En enskan er yfir okkur og allt um kring, og engin furða að ýmis ensk orðasambönd laumist inn í íslensku. Eitt þeirra er eins og enginn sé/væri morgundagurinn sem er augljóslega íslensk gerð af orðasambandinu as if there were no tomorrow eða like there is no tomorrow. Þetta er ekki gamalt í málinu – elsta dæmið á tímarit.is er frá 2005, en á síðustu 10 árum hefur notkunin stóraukist. Ég kunni ekki við þetta samband í fyrstu en er farinn að venjast því og sé svo sem ekkert athugavert við það.

Önnur nýjung í málinu, greinlega ættuð úr ensku, er að segja sama hvað, án nokkurs framhalds eða skilyrðis. Þrjú dæmi frá þessu ári af tímarit.is:

  • „Það er svo mikil gróska og samhugur hjá öllu þessu frábæra tónlistarfólki á Íslandi, að gera hlutina sama hvað.“
  • „En ef náttúra er á annað borð til þá er hún eitthvað sem lætur ekki alveg að stjórn, á það til að sullast út fyrir, sama hvað.“
  • „Mér finnst þetta ekki allt byggjast á því að búa til atvinnu sama hvað.“

Til skamms tíma hefði orðið að koma eitthvert framhald – sama hvað tautar og raular, sama hvað þú segir, sama hvað gerist, o.s.frv. Enginn vafi er á að þetta eru áhrif frá enska sambandinu no matter what sem einmitt er notað svona.

Enn eitt nýlegt orðalag sem er ættað úr ensku er að segja af ástæðu án þess að nokkurt ákvæðisorð – lýsingarorð eða fornafn – fylgi nafnorðinu. Þrjú nýleg dæmi af tímarit.is:

  • „Þeir ungu leikmenn sem eru komnir í liðið núna eru þar af ástæðu.“
  • „Lokið á salerninu er staðsett ofan á klósettinu af ástæðu en er ekki bara til skrauts.“
  • „Við erum í kór af ástæðu, við viljum alltaf vera að syngja.“

Í íslensku hefur fram til þessa þurft að skilgreina ástæðuna eitthvað nánar – segja af góðri ástæðu, af ákveðinni ástæðu, af þeirri ástæðu o.s.frv. En í ensku er hægt að segja for a reason án nánari útskýringa og þaðan er þetta væntanlega komið.

Erlendur uppruni einn og sér er ekki gild ástæða til að amast við einhverju orðalagi, og þótt samböndin eins og enginn væri morgundagurinn, sama hvað og af ástæðu séu greinilega öll komin úr ensku finnst mér ástæða til að gera upp á milli þeirra. Fyrstnefnda sambandið hvorki breytir né útrýmir einhverju sem fyrir er í málinu – það má alveg segja að það auðgi málið. Í síðarnefndu samböndunum tveimur er aftur á móti verið að breyta hefðbundnu íslensku orðalagi að ástæðulausu. Betra væri að halda sig við hefðina.

Kynusli

Eins og við vitum öll hefur íslenska þrjú kyn í fallorðum – karlkyn, kvenkyn og hvorugkyn. Við erum vön því og finnst það eðlilegt, vegna þess að við tengjum þetta við líffræðilegt kyn. Líffræðileg kyn hafa að vísu fram undir þetta bara verið talin tvö, karlkyn og kvenkyn, en við sættum okkur við að það sé til eitthvert þriðja gildi, eitthvað hlutlaust – hvorugkyn, hvorugt kynið.

Þessi tenging við líffræðilega kynið getur valdið því að okkur finnst oft að tungumál sem hafa færri kyn en íslenska séu á einhvern hátt ófullkomin – mál eins og danska með sitt samkyn í nafnorðum í stað karlkyns og kvenkyns, að ekki sé talað um ensku og finnsku með aðeins eitt kyn í nafnorðum (sem jafngildir því að hafa ekkert kyn). En þessi tungumál virðast komast vel af þrátt fyrir þessa kynjafátækt. Og tilfellið er að kyn í tungumálum eru mjög mismörg, allt frá engu sem er langalgengast upp í 20. Hvernig má það vera?

Málið er að kyn í tungumáli er málfræðileg flokkun en ekki líffræðileg. Vissulega eru sterk tengsl milli málfræðilegs og líffræðilegs kyns í mörgum tungumálum, þ. á m. íslensku, en þau eru alls ekki algild eins og alþekkt er. Það eru til hvorugkynsorð eins og fljóð og sprund sem vísa til kvenna, og hvorugkynsorðið skáld hefur svo sterka tengingu við karlmenn að nauðsynlegt hefur þótt að mynda orðin skáldkona og kvenskáld til að vísa til kvenna.

Sama máli gegnir um ýmiss konar aðra málfræðilega flokkun sem hefur tengsl við efnisheiminn – þau tengsl eru sjaldnast alveg föst. Við segjum t.d. að eintala sé notuð til að vísa til eins en fleirtala vísi til fleiri en eins. Samt þekkjum við öll orð eins og buxur og skæri sem vísa til eins hlutar og eru ekki til í eintölu. Orð eins og fólk og fjöldi eru eintöluorð en vísa vitanlega til fleiri en eins. Svo mætti lengi telja.

Því fer fjarri að kynin í íslensku séu öll jafnvæg. Á undanförnum árum hefur andstæðan markað : ómarkað oft verið notuð til að lýsa venslum innan málkerfisins. Ómarkað merkir þá hlutlaust, það sem er sjálfgefið, en markað er það sem er notað við einhverjar sérstakar aðstæður – það er eitthvað sem kallar á notkun þess. Hvorugkynið heitir á latínu neutrum, neuter á ensku, og það merkir 'hlutlaust'.

Það mætti því búast við að hvorugkynið væri ómarkað kyn í íslensku. Á það reynir t.d. þegar vísa þarf til bæði karlkyns- og kvenkynsorða með einu fornafni, eða þegar lýsingarorð í stöðu sagnfyllingar á við bæði karlkyns- og kvenkynsorð. Þá er vissulega oftast notað hvorugkyn – Jón og Gunna eru komin (en ekki komnir eða komnar). Þau eru skemmtileg. Þetta er samt ekki alveg einfalt, sérstaklega þegar um safnheiti er að ræða, en ég get ekki farið út í það hér.

En þarna er um að ræða málfræðileg vensl og vísun innan setninga eða milli setninga. Öðru máli gegnir um vísun út fyrir tungumálið – þegar vísað er til blandaðs hóps karla og kvenna án þess að þau hafi verið nefnd. Þar er yfirleitt notað karlkyn og við segjum Enginn má yfirgefa húsið og Allir tapa á verðbólg­unni án þess að meina að það séu bara karlmenn í þeim hópi. Í þessu felst ekki nein karlremba eða útilokun kvenna – svona virkar tungumálið bara. En hvers vegna notum við ekki hvorugkyn og segjum Öll eru mætt?

Fyrir því eru sögulegar ástæður. Í indóevrópska frummálinu voru tvö kyn – annað var notað um lífverur en hitt um dauða hluti. Hið fyrrnefnda mætti svo sem kalla samkyn en það er sögulega séð fyrirrennari karlkyns, í þeim skilningi að karlkynsbeygingu má hljóðsögulega rekja til þess. Það eru ein­göngu lífverur sem geta verið gerendur í setningum og vegna þess að nefnifall var fall gerandans voru það eingöngu karlkynsorð sem höfðu sérstaka nefnifallsmynd.

Hvorugkynsorðin gátu ekki táknað gerendur og þurftu því ekki á nefnifalli að halda. Þegar tengsl milli merkingar og setningagerðar breyttust og hvorugkynsorð fóru að geta staðið í stöðu sem krafðist nefnifalls urðu þau að koma sér upp nefnifallsmynd, og það var gert með því að taka þolfallsmyndina og láta hana líka þjóna sem nefnifall. Þetta er ástæðan fyrir því að hvorugkynsorð eru alltaf eins í nefnifalli og þolfalli, bæði í eintölu og fleirtölu.

Kvenkyn þróaðist síðan úr hvorugkyninu, en þótt kvenkyn væri komið til fékk það ekki jafnstöðu við karlkynið. Hið gamla samkyn, sem nú var orðið karlkyn af því að kvenkyn var komið til, hélt ýmsum samkynshlutverkum sínum, t.d. því að geta vísað til blandaðs hóps en ekki bara karla. Þess vegna segjum við enn Allir eru mættir og frá málfræðilegu sjónarmiði er ekkert athugavert við það, þótt verið sé að vísa bæði til karla og kvenna.

En málfræðin stjórnar ekki upplifun fólks, og þótt kynbeyging og flokkun orða í kyn sé í grunninn málfræðilegs eðlis verður ekki fram hjá því litið að hún hefur mjög sterk tengsl við líffræðilegt kyn í huga fólks. Ef mörg, bæði konur og þau sem skilgreina sig hvorki sem karl­kyns né kvenkyns, upplifa það þannig að þau séu á einhvern hátt sniðgengnin með notkun karl­kyns í slíkum dæmum, þá finnst mér eðlilegt að velta fyrir sér hvort og hvernig sé hægt að bregðast við því.

Tungumál breytast, líka íslenska. Það er ekkert því til fyrirstöðu að segja Öll eru mætt. Mörg hafa mælt með því. Hópur kvenna innan kirkjunnar hefur t.d. um tíma beitt sér fyrir því að breyta málnotkun í kirkjulegum athöfnum og ritum þannig að málið höfði betur til kvenna. Þetta er það sem hefur verið kallað „mál beggja kynja“. Mér finnst vel hægt að segja t.d. Mörg telja að …, Sum segja að … o.fl. Annað er erfiðara – mér finnst ekki hljóma vel að segja Ýmis vona að ….

Og sumt er alveg ómögulegt. Í staðinn fyrir Enginn vill að … er tæpast hægt að segja Ekkert vill að …. Það er samt hægt að snúa sig út úr þessu með því að nota fleirtöluna: Engin vilja að …. Ég sé ekki að það séu nein málspjöll þótt þetta breytist. Það er ekki verið að koma með neitt nýtt inn í málið – hvorugkynið er til. Þetta er ekki beinlínis breyting á málinu, heldur á notkun þess.

Það er aftur á móti snúnara að fást við karlkynsnafnorð, sambeygingu með þeim og vísun til þeirra. Mjög mörg starfsheiti, þjóðaheiti o.s.frv. eru karlkyns. Kennari er karlkynsorð, málfræðingur er karlkynsorð, Íslendingur er karlkynsorð, Akureyringur er karlkynsorð, o.s.frv. Við höfum þrjá kosti með slík orð. Einn er að búa til hvorugkynsorð í staðinn. Það er ekki einfalt, m.a. vegna þess að við höfum enga beygingarendingu sem gefi hvorugkyn ótvírætt til kynna eins og –ur og –i tákna (oftast) karlkyn og –a táknar (oftast) kvenkyn. En hvorugkynið er endingarlaust – nema veika beygingin, sem er eiginlega frátekin fyrir orð um líffæri og líkamshluta.

Annar kostur væri að halda orðunum óbreyttum en breyta tilvísun og sambeygingu. Þá gætum við t.d. sagt Ég hitti tvo kennara/Akureyringa áðan. Þau voru hress, þ.e. vísað til karlkyns­orðanna kennari og Akureyringur með fornafni í hvorugkyni, ef um fólk af fleiri en einu kyni væri að ræða. Þetta er vel hægt, vegna þess að vísun persónufornafna getur ýmist verið innan málsins eða út fyrir það, og ef við notum þau getum við sagt að við séum ekki að vísa í orðið kennari eða Akureyringur í setningunni á undan, heldur í hópinn sem um er að ræða.

En það versnar í því þegar við förum að skoða sambeygingu innan setningar. Það er eiginlega alveg ómögulegt að segja Bæði kennararnir eru hress eða eitthvað í þá átt, og þar væri raunverulega verið að misþyrma málkerfinu finnst mér. Í sumum tilvikum er hægt að nota eignarfallssamband í stað þess að láta fornafnið samræmast nafnorðinu – segja Sumar/Sum kennaranna eru hressar/ hress. Þriðji kosturinn er svo að halda þessu óbreyttu – segja að í þessu tilviki sé um málfræði­lega flokkun að ræða sem ekki þurfi að tengja við líffræðilegt kyn. Ég hef enga góða lausn á þessu sem trúlegt er að öllum líki.

En mér finnst sjálfsagt að fólk velti því fyrir sér hvort og hvernig hægt sé að draga úr karllægni tungumálsins, og prófi sig áfram með það. Líf íslenskunnar veltur á því að málnotendur tengi sig við hana, finnist hún vera sitt mál. Þess vegna þarf hún að breytast og endurnýja sig til að þjóna þörfum samfélagsins á hverjum tíma, eins og hún hefur alltaf gert. En það er staðreynd að í þeirri íslensku sem við höfum flest alist upp við er karlkyn ómarkað. Það er hluti af málkerfi okkar flestra og við breytum því ekki svo glatt, og mér finnst ekki hægt að ætlast til þess að fólk geri það.

Aðalatriðið í þessu er umburðarlyndi og virðing fyrir öðru fólki og málnotkun þess. Þau sem vilja hafna karlkyni sem ómörkuðu kyni þurfa að hafa í huga að við erum flest alin upp við að karlkynið hafi þetta hlutverk, og í þeirri málnotkun felst engin karlremba. Þau sem vilja halda í karlkynið sem ómarkað kyn þurfa að sýna því skilning að ýmsum finnst karlkynið eingöngu vísa til karlmanna og þar með vera útilokandi. Málið þolir alveg að mismunandi málvenjur séu í gangi samtímis.

Mannanafnalög og íslensk málstefna

Ein meginröksemd sem beitt er fyrir nauðsyn mannanafnalaga er verndun íslenskunnar og því er oft haldið fram að óheftur straumur erlendra nafna geti haft óæskileg áhrif á málið. Það er í sjálfu sér ekki óhugsandi að mikill fjöldi orða sem koma inn í málið og greina sig frá íslenskum erfðaorðum á einhvern hátt, t.d. í hljóðafari eða beygingum, hafi einhver áhrif á tilfinningu málnotenda fyrir reglum og einkennum íslenskunnar. En til þess þurfa orðin að vera mjög mörg og mikið notuð.

Þá er að hafa í huga að erlend nöfn hafa streymt inn í málið frá fyrstu tíð, og mörg þeirra hafa að geyma hljóðasambönd sem ekki finnast í erfðaorðum. Þar má nefna nöfn eins og Andrea, Lea, Magnea, Leó, Theódóra, William, Sebastian, Patricia, Sophus, Zophonías, Arthúr, Zoe, Nikolai, Laila, og ótalmörg fleiri. Öll þessi nöfn er hægt að gefa íslenskum ríkisborgurum óhindrað því að þau eru á mannanafnaskrá – sum hafa verið notuð lengi en önnur hafa verið heimiluð á starfstíma mannanafnanefndar. Ekki verður þess samt vart að þetta hafi haft neikvæð áhrif á tungumálið.

Auðvitað má hugsa sér nöfn sem innihalda meira framandi hljóðasambönd en þau sem hér hafa verið nefnd, s.s. Szczepan úr pólsku, Nguyen úr víetnömsku o.s.frv. En hljóðskipunarreglur tungumála breytast ekki svo glatt, og líkurnar á að slík nöfn hefðu einhver áhrif á íslenskt hljóðkerfi og hljóðskipunarreglur eru nákvæmlega engar. Og vegna þess að hljóðasambönd í þessum orðum eru nánast óframberanleg fyrir Íslendinga er ekki ólíklegt að nöfnin tækju fljótlega breytingum í átt að íslenskum hljóðskipunarreglum.

Því hefur einnig verið haldið fram að óheft innstreymi erlendra nafna gæti veikt beygingarkerfið. Eitt þeirra skilyrða sem nöfn þurfa að uppfylla samkvæmt gildandi lögum lýtur að þessu – nöfn þurfa að geta tekið eignarfallsendingu. Þó er fjöldi íslenskra erfðaorða eins í öllum föllum eintölu og hefur þar með enga sérstaka eignarfallsendingu. Þetta eru t.d. veik hvorugkynsorð (hjarta, nýra o.s.frv.), mörg kvenkynsorð sem enda á -i (gleði, keppni, lygi, reiði o.m.fl.), karlkyns- og hvorugkynsorð sem enda á löngu s (foss, koss, sess, hross, pláss o.fl.) eða samhljóði + s (háls, þurs, glans, gips o.fl.) – og sitthvað fleira mætti nefna. Þessi orð eru margfalt fleiri og algengari en þau mannanöfn sem ekki taka eignarfallsendingu – jafnvel þótt meðtalin væru öll nöfn sem hafnað hefur verið á þeirri forsendu. Samt hvarflar ekki að neinum að þessi orð stuðli að niðurbroti beygingarkerfisins eða hafi einhver óæskileg áhrif á málið.

En reyndar geta langflest nöfn tekið eignarfallsendingu og því er beygingarleysi sjaldan forsenda synjunar nafns. Það eru helst kvenmannsnöfn sem enda á –e sem erfitt getur verið að setja eignarfallsendingu á og nokkrum slíkum nöfnum hefur verið hafnað, s.s. Maxine, Aveline og Jette, þótt nöfnin Charlotte, Christine, Elsie, Irene, Kristine, Louise, Marie og Salome/Salóme hafi komist á mannanafnaskrá vegna hefðar. Af þessum nöfnum er aðeins það síðastnefnda notað eitthvað að ráði og hefur tæplega spillt beygingarkerfinu.

Annar hópur nafna sem ekki taka eignarfallsendingu eru karlmannsnöfn sem enda á samhljóði + sGils, HansJens o.fl. Aldrei er þó amast við slíkum nöfnum, væntanlega vegna þess að það er engin sérviska þeirra að taka ekki eignarfallsendingu heldur er það einfaldlega útilokað af hljóðafarslegum ástæðum – samhljóð getur ekki verið langt á eftir öðru samhljóði og þess vegna er ekki hægt að bæta eignarfalls-s við þessi nöfn. (Reyndar væri hægt að nota eignarfallsendinguna -ar í staðinn, en það er ekki gert.) En þegar að er gáð gegnir í raun og veru alveg sama máli um kvenmannsnöfnin sem enda á -e – það eru hljóðafarslegar ástæður fyrir því að þau geta ekki tekið eignarfallsendinguna -ar (sem er sú eina sem kemur til greina). Tvö grönn sérhljóð eins og e og a geta ekki með góðu móti staðið saman í íslensku. Það er því í raun fráleitt að hafna áðurnefndum kvenmannsnöfnum á þessari forsendu.

Meira að segja Jón, algengasta karlmannsnafn á Íslandi fyrr og síðar, fellur ekki fullkomlega að málkerfinu – til þess þyrfti það að vera Jónn, eins og prjónn, sónn og tónn – sem reyndar eru allt gömul tökuorð sem hafa aðlagast kerfinu. Þegar Jón hafði verið í málinu í margar aldir kom tökuorðið telefón inn í málið seint á 19. öld, en það tók ekki langan tíma að lagað það að málinu þannig að það varð (tele)fónn í nefnifalli. Þrátt fyrir tíðni og útbreiðslu nafnsins Jón hafði endingarleysi þess í nefnifalli sem sé ekki áhrif á þetta nýja tökuorð.

Því má bæta við að á undanförnum áratugum hafa nokkur erlend lýsingarorð sem beygjast lítið eða ekkert orðið algeng í málinu – orð eins og smart, töff, kúl, næs o.fl. Þau hafa samt ekki leitt til þess að fólk sé almennt hætt að beygja lýsingarorð. Enda er fyrir í málinu fjöldi alíslenskra lýsingarorða sem eru eins í öllum kynjum, tölum og föllum – orð sem enda á -a (andvaka, lífvana o.s.frv.) eða -i (hugsi, þurfi) og svo lýsingarháttur nútíðar þegar hann stendur sem lýsingarorð (sofandi, vakandi o.s.frv.). Engum dettur í hug að amast við þessum orðum eða gera því skóna að þau hafi óheppileg áhrif á beygingarkerfið.

En gefum okkur nú þrátt fyrir það að nöfn sem falla ekki að íslensku hljóð- og beygingarkerfi gætu „smitað út frá sér“ ef svo má segja – komið af stað eða hraðað breytingum á íslensku málkerfi. Þá hlýtur það að eiga við um öll nöfn sem eru notuð í málsamfélaginu, nöfn sem við heyrum og notum í daglegu lífi – ekki bara nöfn íslenskra ríkisborgara, sem eru þeir einu sem falla undir íslensk mannanafnalög. Hér búa nú og starfa tugir þúsunda útlendinga – fólk sem við tölum um og tölum við, og notum því í daglegu tali fjölda nafna sem ekki yrðu samþykkt. Ef íslensku málkerfi stafar hætta af erlendum nöfnum hlýtur sú hætta aðallega að stafa frá nöfnum þessa fólks en ekki þeim tiltölulega fáu nöfnum sem íslenskir ríkisborgarar sækja um að bera.

Einnig má benda á að mannanöfn eru ekki stór hluti af orðaforða málsins. Á mannanafnaskrá eru rúmlega 4100 nöfn, mörg þeirra mjög sjaldgæf og í mörgum tilvikum er örugglega bara einn nafnberi. Nú má auðvitað nota ýmsa mælikvarða á stærð íslensks orðaforða en í ritmálssafni Árnastofnunar eru t.d. dæmi um u.þ.b. 700 þúsund orð. Mörg þeirra eru líka sjaldgæf og jafnvel aðeins eitt dæmi um þau, þannig að það er ekki fráleitt að bera þetta saman. Samkvæmt því væru nöfn langt innan við 1% af heildarorðaforðanum.

Vissulega má reikna þetta á annan hátt en sama hvernig það er gert verða nöfnin alltaf bara brot af orðaforðanum. Og um önnur orð – allt að 99% orðaforðans – gilda engin lög. Enda eru erlend orð af ýmsu tagi sífellt að koma inn í málið, án þess að við höfum nokkra stjórn á því. Mörg þeirra falla ekki fullkomlega að íslensku málkerfi – eru óbeygð, brjóta hljóðskipunarreglur, eða hvort tveggja. Sum þessara orða eru lítið notuð eða um stuttan tíma, önnur haldast í málinu og laga sig þá iðulega að þeim orðum sem fyrir eru – breyta um framburð, fara að beygjast, o.s.frv. Önnur haldast í málinu án þess að laga sig að því – en án þess að „smita út frá sér“, þ.e. án þess að valda nokkrum breytingum á íslenskum orðum. Mér er ómögulegt að sjá tilganginn í því að koma lögum yfir lítið brot orðaforðans en líta fram hjá hugsanlegum áhrifum allra hinna orðanna.

Annar þáttur í mannanafnalögum sem varðar íslenska málstefnu eru ættarnöfnin. Ég tel reyndar að það mál falli miklu fremur undir íslenska menningu en íslenskt mál þótt auðvitað sé stutt þar á milli í þessu. Kenning til föður er vissulega rótgróinn þáttur í íslenskri menningu en kenning til móður hins vegar nýtilkomin, þótt hægt sé að benda á stöku eldri dæmi. En ættarnöfn eru í eðli sínu ekkert minni íslenska en föður- og móðurnöfn. Ýmis ættarnöfn eru af íslenskum rótum og ef upptaka ættarnafna yrði gefin frjáls má búast við að slíkum nöfnum myndi fjölga. En ég er hreint ekki sannfærður um að fólk myndi í stórhópum leggja niður föður- og móðurnöfn og taka upp ættarnöfn í staðinn, þótt slíkt yrði leyft.

Stundum er vísað til þess að föðurnöfn hafi horfið í Danmörku og Noregi á stuttum tíma, en slíkar vísanir til ólíkra samfélaga á öðrum tímum hafa takmarkað gildi. Nútímaviðhorf í jafnréttismálum eru t.d. líkleg til að valda því að konur séu ófúsari en áður að taka upp ættarnafn eiginmannsins. Hér má enn fremur benda á að vegna þess að Íslendingar hafa einir haldið þeim sið að kenna sig til föður (eða móður) er það ákveðið þjóðareinkenni sem vel má hugsa sér að margir vilji halda í þess vegna, en um slíkt var ekki að ræða í Danmörku og Noregi. Einnig má vísa til þess að í Færeyjum mun hafa færst í vöxt á seinustu árum að kenna sig til föður.

Ég tek heils hugar undir það að kenning til föður eða móður er menningarhefð sem æskilegt er að viðhalda. En hefðir eru lítils virði nema samfélagið þar sem þær gilda hafi áhuga á að halda í þær. Hefð sem þarf að viðhalda með lögum er ekki hefð – heldur nauðung. Hér vegur þó þyngst að núgildandi lög standast ekki með nokkru móti jafnræðiskröfur samtímans – og eru raunar að því er best verður séð brot á 65. grein stjórnarskrárinnar þar sem kveðið er á um að allir skulu vera jafnir fyrir lögunum. Það stenst því ekki að sumum sé leyft það sem öðrum leyfist ekki. Á þetta hefur oft verið bent, t.d. í athugasemdum nefndar sem samdi frumvarp að gildandi mannanafnalögum, og í athugasemdum Íslenskrar málnefndar við það frumvarp.

Að öllu samanlögðu er ég sannfærður um að aukið frelsi í nafngiftum er ekki skaðlegt fyrir íslenskt mál. Þvert á móti. Stífar reglur sem vísa í íslenska málstefnu en samræmast ekki jafnréttishugmyndum og stríða gegn réttlætiskennd fólks geta orðið til þess að ala á neikvæðum viðhorfum fólks til íslenskunnar. Því þarf hún síst af öllu á að halda um þessar mundir.

Máltækni í þágu samfélagsins

Þótt nokkur verkefni á sviði máltækni hafi verið unnin hér á landi undir lok 20. aldar má segja að skipuleg uppbygging íslenskrar máltækni hafi hafist fyrir rúmum 20 árum með út­tekt á ástandi og horfum í íslenskri tungu­tækni eins og sviðið var kallað þá. Tungu­tækni – skýrsla starfshóps kom út snemma árs 1999 en þar var áætlað að það kostaði u.þ.b. einn milljarð króna að gera íslenska mál­tækni sjálf­bæra. Að teknu tilliti til verðlagsbreytinga er þetta reyndar svipuð upphæð og nú er gert ráð fyrir að verja til verkefnisins.

Í kjölfar skýrslunnar kom ríkið á fót sérstakri tungutækniáætlun sem fékk sam­tals 133 milljónir króna á fjárlögum ár­anna 2000-2004. Fyrir það fé voru unn­in eða sett af stað ýmis verkefni sem sum lognuðust út af, önnur lögðu drög að seinni tíma starfi á þessu sviði, og enn önnur eru enn í fullu gildi. Því fór þó fjarri að íslensk máltækni væri orðin sjálf­bær þegar áætluninni lauk og næstu 10 ár var ekki sett neitt fé á fjárlögum í ís­lenska máltækni en með fáeinum styrkjum úr Rann­sóknasjóði, m.a. einum öndvegis­styrk, tókst að halda lífi í rannsóknar- og þróunarstarfi.

Þáttaskil urðu með þátttöku Íslands í evrópska META-NET verkefninu árin 2011-2013. Megin­markmið þess voru annars vegar að gera ítarlega úttekt á stöðu máltækni fyrir 30 evrópsk tungu­mál, og hins vegar að byggja upp og gera að­gengileg hvers kyns málleg gagnasöfn og hugbúnað fyrir þessi mál. Á Íslandi tókst að safna saman og byggja upp marg­vísleg gögn á þess­um tíma. Þau voru gerð aðgengileg í varðveislusafninu META-SHARE en einnig var settur upp vefurinn málföng.is þar sem hægt er að nálgast þessi gögn.

Auk þess var skrifuð ítarleg skýrsla, ein af 30 í sama sniði: Íslenska á stafrænni öld. Þegar niður­stöður skýrslnanna voru bornar saman kom í ljós að íslenska stæði næstverst málanna 30 hvað varðar mál­tækni. Þessar niðurstöður vöktu töluverða at­hygli hér á landi og voru m.a. rædd­ar á Alþingi. Það er óhætt að segja að skýrslan hafi verið einn helsti hvatinn að þings­álykt­un sem var samþykkt einróma 2014 um gerð áætlunar um uppbyggingu ís­lenskrar mál­tækni og leiddi að lokum til skýrslunnar Máltækni fyrir ís­lensku 2018-2022 – Verkáætlun.

Þátttakan í META-NET sýndi okkur mikilvægi alþjóðlegs samstarfs á þessu sviði og í mál­tækni­skýrslunni var lagt til að Ísland gerðist aðili að evrópska inn­viðaverk­efninu CLARIN ERIC. Það var sett á stofn til að staðla og gera aðgengi­leg gagna­söfn til nota í rann­sóknum á sviði félags- og hugvís­inda, en þessi gagna­söfn geta einnig nýst í mál­tækni og þess vegna er aðild að CLARIN mjög gagnleg. Ísland er þegar orðið áheyrnaraðili að sam­starf­inu og nú hefur íslenskum lögum verið breytt þannig að Ísland gæti sótt um fulla aðild.

Samstarfsnetið European Language Re­source Coordination hefur verið í gangi undanfarin fjögur ár. Það gengur einkum út á að afla mállegra gagna frá opinberum stofn­­un­um til nota í vél­rænum þýðing­um og nýta þau í opinberri þjónustu. Annað samstarfs­net er European Lan­guage Grid sem er nýtt og snýst aðallega um gögn sem nýt­ast fyrir­tækjum í iðnaði og við­skipta­­lífi. Ísland tekur þátt í báðum þessum netum sem skiptir gífurlegu máli til að geta fylgst með þróuninni, fengið aðgang að gögnum og þekkingu og komið okkar eigin gögnum á framfæri.

Máltækniáætlunin sem nú er verið að setja af stað mun kosta á þriðja milljarð króna. Þótt það sé ekki stór hluti af heild­ar­útgjöldum ríkissjóðs er þetta mikið fé, a.m.k. í samanburði við það sem við sem vinnum með íslenskt mál erum vön að sjá. Ég er samt sannfærður um að fáar fjár­fest­ingar borga sig betur og þjóðin á eftir að fá þetta margfalt til baka. Í huga margra tengist þetta verkefni fyrst og fremst verndun og varðveislu íslensk­unn­ar og hún verður vitanlega ekki metin til fjár. En máltækni er mikilvæg af fjöl­mörgum öðrum ástæðum og ég nefni örfá dæmi:

  • Fyrir jafnrétti og mannréttindi – máltækni getur skipt sköpum fyrir fjölmarga sem búa við ein­hvers kon­ar hömlun eða skerð­ingu, auðveldar þeim að ferðast um, bætir aðgengi þeirra að margs kyns þjón­ustu og lífsgæðum og getur gert þeim kleift að taka fullan þátt í daglegu lífi og starfi.
  • Fyrir tækniþróun og ný­sköp­un – máltækni er alþjóðleg og innan mál­tækniverkefnisins gefst íslensk­um fyrir­tækjum tækifæri til að vinna með vísindamönnum að þróun nýrrar tækni og af­urða sem geta nýst á alþjóðlegum mark­aði, auk þess sem aðferðirnar nýtast víðar en í máltækni.
  • Fyrir hagkvæmni og hagræð­ingu í rekstri – með hjálp talgreiningar, tal­gerv­ingar og gervi­greind­­ar geta fyrir­tæki sem reka þjón­ustu­ver t.d. látið tölvur sinna verulegum hluta aðstoðar­beiðna sem bæði lækkar kostnað og styttir biðtíma og eykur þannig ánægju viðskiptavina.
  • Fyrir skilvirkni í opinberri þjónustu – með notkun máltækni má hraða samskiptum milli opinberra aðila innbyrðis en fyrst og fremst stórbæta og auðvelda að­gengi almennings að þjónustu opin­berra stofnana og hraða afgreiðslu erinda og fyrirspurna.
  • Fyrir hraða og öryggi í heilbrigðisþjónustu – með notkun mál­tækni við greiningu og lýsingu rann­sókn­ar­­gagna og hvers kyns skráningu og miðlun upplýsinga má hraða upplýsinga­streymi og þannig flýta fyrir sjúk­dóms­grein­ingu og auka líkur á lækn­ingu.
  • Fyrir al­manna­varn­ir við náttúruvá – með sjálf­virk­um textaskrifum og vélrænum þýð­ing­um má t.d. koma upplýsingum um yfir­vof­andi eldgos eða flóð á fjölda tungumála til ferðamanna hvar sem þeir eru staddir og bæta samskipti milli viðbragðsaðila innbyrðis og við almenning.

Tölvutæknin er nú orðin fléttuð inn í flestar daglegar athafnir okkar. Tungu­málið er helsta sam­skiptatæki okkar á öllum sviðum mannlífsins og þess vegna þurfum við máltækni á öllum svið­um – íslenska máltækni. Uppbygging hennar og þróun er sannarlega í þágu samfélagsins.