Íslenskar orðtíðnirannsóknir

Stundum veltir fólk því fyrir sér hver séu algengustu orðin í íslensku. Því er núna hægt að svara, en áður þarf samt að átta sig á því að orðið orð er margrætt – hefur a.m.k. þrjár merkingar sem hér skipta máli. Í fyrsta lagi er merkingin ‘uppflettiorð’ sem felur í sér grunnmynd (uppflettimynd, orðabókarmynd) orðsins og allar beygingarmyndir þess. Undir uppflettiorðið eiga falla þannig auk uppflettimyndarinnar beygingarmyndir eins og á, eigum, átti, ætti, o.s.frv. En myndin á getur auðvitað líka verið forsetningin á, nafnorðið á, og beygingarmynd af nafnorðinu ær.

Önnur merking orðsins er svo ‘orðmynd’ – tiltekinn stafa- eða hljóðastrengur, óháð málfræðilegri greiningu. Þannig er á ein og sama orðmyndin hvort sem hún tilheyrir sögninni eiga, forsetningunni á, nafnorðinu á eða nafnorðinu ær. Þriðja merkingin er svo ‘lesmálsorð’ – orð í texta. Þetta er sú merking sem á við þegar lengd texta er tilgreind – ef sagt er t.d. að ritgerð eigi að vera þúsund orð merkir það ekki að í henni eigi að koma fyrir þúsund mismunandi lesmálsorð eða orðmyndir, heldur að fjöldi lesmálsorða eigi að vera þúsund. Þá er hver orðmynd talin í hvert skipti sem hún kemur fyrir.

Tölvur hafa gert það ákaflega auðvelt að telja fjölda lesmálsorða og orðmynda. Talning uppflettiorða er hins vegar miklu flóknari vegna þess að hún krefst málfræðilegrar greiningar, til að hægt sé t.d. að fella dæmin um orðmyndina á undir rétta uppflettimynd út frá setningafræðilegri stöðu þeirra og stundum líka merkingu. Slíka greiningu þurfti til skamms tíma að gera í höndunum, en nú er kominn greiningarhugbúnaður (fyrir íslensku t.d. IceNLP og Greynir) sem greinir orðin vélrænt. Slík greining verður aldrei fullkomlega rétt, en þó yfirleitt nógu nákvæm til að hún gagnist til flestra þarfa.

Fyrstu stóru tíðnikönnun á íslenskum textum gerði Ársæll Sigurðsson skólastjóri og birti niðurstöður sínar í Menntamálum árið 1940. Tilgangur hennar var hagnýtur; „að finna leið til að gera stafsetningarkennsluna aðgengilegri og raunhæfari en áður, en þó vænlegri til betri árangurs“. Textarnir voru úr stílum barna, sendibréfum fullorðinna, lesbókum, náttúrufræði, sögu og landafræði, alls um 100 þúsund lesmálsorð. En vandaðasta tíðnikönnun á íslenskum textum var unnin hjá Orðabók Háskólans en niðurstöður hennar birtust í Íslenskri orðtíðnibók 1991. Hún byggðist á um 500 þúsund lesmálsorðum úr fimm mismunandi textategundum.

Á árunum 2004-2012 var komið upp hjá Árnastofnun miklu textasafni, Markaðri íslenskri málheild – samtals um 25 milljónir lesmálsorða. Textarnir eru margfalt fjölbreyttari en í Íslenskri orðtíðnibók, og skiptast í 23 flokka. Frá 2005 hefur svo Risamálheild verið byggð upp hjá Árnastofnun og hefur nú að geyma 1,64 milljarða lesmálsorða úr ýmsum áttum. Á henni byggist Orðtíðnivefur Árnastofnunar sem nú tekur til tæplega 1,4 milljarðs lesmálsorða. Vegna stærðar og fjölbreytni þessara safna má því vinna úr þeim ábyggilegar upplýsingar um íslenska orðtíðni. Þó er stór galli að í þeim er mjög lítið af talmáli.

Tengsl stofngerðar og endingar

Meðal þeirra reglna sem við tileinkum okkur í máltökunni og fæstar eru nefndar í bókum nema þá óbeint eru ýmiss konar tengsl stofngerðar og beygingarendingar. Þessar reglur eru misjafnlega nákvæmar og misjafnlega víðtækar. Sumar eru undantekningarlausar en taka aðeins til örfárra orða, aðrar taka til mikils fjölda orða en eru frekar tilhneiging en föst regla, og svo er allt þar á milli. Þess vegna tekur það tíma fyrir börn á máltökuskeiði að átta sig á þeim öllum – þau þurfa miklar upplýsingar, þurfa að heyra mikið af máli í umhverfi sínu, til að geta tileinkað sér öll þessi mynstur sem eru ótalmörg – hér verða örfá nefnd.

Flest karlkynsorð sem hafa sterka beygingu (enda á -s eða -ar í eignarfalli eintölu) enda í nefnifalli fleirtölu annaðhvort á -ar, eins og hestar, eða -ir, eins og vinir. Við þurfum að læra á máltökuskeiði hvor endingin á við hverju sinni. En það er samt ekki svo að við séum algerlega án leiðsagnar í þessu námi. Þarna eru nefnilega ákveðin tengsl milli stofngerðar og fleirtöluendingar – tilhneigingin er sú að orð með grannt stofnsérhljóð (a, e, i, o, u, (y), ö) og eitt samhljóð þar á eftir fái -ir-fleirtölu, en önnur orð fái -ar-fleirtölu. Af fyrrnefnda hópnum má nefna vinur vinir, dalurdalir, refurrefir, bolurbolir, hamurhamir, svanur svanir, liturlitir, herherir, o.m.fl.

Þessi tilhneiging er vissulega fjarri því að vera undantekningarlaus. Orð eins og gestur og brestur hafa t.d. sömu stofngerð og hestur en fá samt -ir-fleirtölu. Orð eins og dagur og vogur-ar-fleirtölu þótt þau falli undir það mynstur sem oftast fær -ir. Svo mætti lengi telja. Það er samt nokkuð ljóst að börn átta sig á þessari tilhneigingu í máltökunni og nýta sér hana – fyrir þeim er -ar sjálfgefin fleirtala sem þau alhæfa iðulega og nota þar sem hún á ekki við en læra svo undantekningarnar smátt og smátt. Þetta sést líka í málbreytingum – refur var t.d. refar í fleirtölu í fornu máli og dalur oftast dalar. En nú hafa þessi orð alltaf -ir-fleirtölu, refir og dalir, eins og dæmigert er fyrir þessa stofngerð.

Flest karlkynsorð sem hafa -(j)ö í stofni enduðu áður á -u í þolfalli fleirtölu – firðir um fjörðu, kettir um köttu o.s.frv. Nú hafa þessi orð fengið -i í þolfalli fleirtölu og þar með lagað sig að öðrum orðum sem enda á -ir í nefnifallinu – beygjast firðir um firði, kettir um ketti o.s.frv. En stofnsérhljóðið fylgdi óhjákvæmilega með – beygingin firðir um *fjörði, kettir um *kötti er óhugsandi. Orð af þessum flokki enda yfirleitt á -i í þágufalli eintölu og -ar í eignarfalli – firði – fjarðar, ketti kattar. En sum þeirra, t.d. mökkur, hafa tilhneigingu til að missa endinguna í þágufalli og fá -ar í eignarfalli – beygjast mökk mökks í stað mekkimakkar. Þar með breytist stofnsérhljóðið líka –  *mekk – *makks er óhugsandi.

Langflest kvenkynsorð (önnur en veika beygingin, orð sem enda á -a í nefnifalli eintölu) enda á -ar í eignarfalli eintölu – myndmyndar, skálskálar, bókbókar, helgihelgar o.s.frv. Fáein orð fá þó eignarfallsendinguna -ur. Undir það falla einkum frændsemisorðin móðir, dóttir og systir og svo orð sem enda á -ík: vík, tík, flík, brík og samsetningar af þeim. Sum þeirra fá alltaf -ur í eignafalli, a.m.k. vík, en hin flakka milli -ar og -ur. En það er greinilegt að málnotendur hafa tilfinningu fyrir þessum tengslum milli -ík í stofni og -ur-endingar. Það má sjá á þeim fjölda tökuorða sem enda á -ík og fá þessa sjaldgæfu eignarfallsendingu, þrátt fyrir að -ar sé annars yfirgnæfandi: pólitík, rómantík, klassík, lýrík, grafík, kómík, músík o.s.frv.

Margvísleg mynstur leiðbeina okkur þannig um beygingu og eru misjafnlega sterk – sum eru nánast ófrávíkjanleg eins og tengsl milli stofngerðar og endingar í orðum á við köttur og fjörður, önnur eru tilhneigingar sem eiga sér ótal undantekningar eins og tengsl milli stofngerðar og fleirtöluendingar í orðum á við hestur og vinur. Svo eru líka fjölmörg dæmi um að engar eða mjög óljósar reglur séu til leiðsagnar, og þá má búast við málbreytingum eins og í sterkum kvenkynsorðum þar sem hurðar er komið upp sem fleirtala til hliðar við hurðir o.s.frv.

Samhljóðaklasar í upphafi orða

Þeim fer líklega fækkandi á þessum stafrænu tímum sem hafa flett prentuðum orðabókum, en þeim hefur varla dulist að fyrirferð bókstafanna er mjög mismikil – fá orð byrja á sumum bókstöfum, en fjölmörg á öðrum. Í öllum íslenskum orðabókum – og væntanlega orðabókum allra skyldra tungumála – er bókstafurinn s fyrirferðarmestur. Ástæðan fyrir því hvað s er algengt í upphafi orða er sú að það er ekki vandfýsið á hljóðfræðilegt umhverfi, heldur leyfir marga og fjölbreytta samhljóðaklasa á eftir sér. Samhljóðin eru nefnilega mjög ólík að þessu leyti og falla í nokkra hópa eftir því hvaða afstöðu þau geta haft til eftirfarandi sérhljóðs.

Ef j stendur á undan sérhljóði í upphafi orðs verður það alltaf að standa næst sérhljóðinu. Við höfum orð eins og jata, , él (þar sem é stendur fyrir je), jól, júgur, jæja, jörð o.s.frv., en þið getið prófað sjálf að stinga einhverju samhljóði á milli j og hvaða sérhljóðs sem er – það gengur ekki. Svipað er með v – það getur staðið næst á undan ýmsum sérhljóðum en milli þess og sérhljóðs getur ekkert samhljóð staðið nema j, í orðum sem eru rituð með évér, vél, og samsetningum af þessum orðum. Sama máli gegnir um m, n, l og r – þau geta staðið næst ýmsum sérhljóðum, en milli þeirra og sérhljóðs getur ekkert verið nema j, eins og í mjakast, njóta, ljár, rjúfa.

Lokhljóðin p, t, k, b, d, g eru enn sveigjanlegri. Þau geta vitaskuld staðið næst sérhljóði, og einnig haft j milli sín og sérhljóðsins, eins og pjátur, tjón, kjör, bjóða, djöfull, gjósa – eða hljóð úr hópnum n, l, r, eins og plástur, treysta, knöttur, blettur, drafa, gnísta. Öll nema p og b geta einnig haft v milli sín og sérhljóðs, eins og tveir, kver, dvergur, guð (þar sem auðvitað er borið fram v þótt það sé ekki sýnt í stafsetningu). Milli lokhljóðanna og sérhljóðsins geta líka staðið tvö samhljóð, að því tilskildu að það fyrra sé eitt af n, l, r og það seinna sé j. Þannig höfum við orð eins og prjóna, trjárækt, kljúfa, brjálast, drjúpa, gljái. Önghljóðin f, þ og h haga sér svipað – við höfum fjúka, þjást, hjóla og flýja, þrífa, hlaupa, en líka fljótur, þrjár, hnjúkur með n/l/r og j á undan sérhljóðinu.

Þá er s eftir. Það getur auðvitað staðið næst öllum sérhljóðum – saga, sár, selja, sitja, sími, sorp, sól, sund, súgur, sæla, sökkva – og líka haft j milli sín og margra sérhljóða, eins og í sjatna, sjá, sjoppa, sjón, sjúga, sjötti. Það getur líka haft tvö samhljóð milli sín og sérhljóðsins, ef það seinna er j, l eða rsljór, snjáður, spretta, splundra, strákur, skrafa. En svo getur s eitt samhljóða haft þrjú samhljóð milli sín og sérhljóðs í stöku tilvikum. Næst á eftir s verður þá að koma t eða k, þar á eftir r, og að lokum j næst sérhljóðinu. Þannig höfum við orð eins og strjáll, strjúgur, strjúka, strjúpi, skrjáfa, skrjóður – og varla öllu fleiri.

Þótt hér hafi verið reynt að draga fram reglur um það hvernig samhljóð geti raðast saman í upphafi orðs verður að leggja áherslu á að því fer fjarri að allir möguleikar sem rúmast innan þessara reglna séu nýttir í raun. Þótt til séu orð sem byrja á klj- eru engin sem byrja á *tlj- eða *plj; þótt til séu orð sem byrja á kn- eru engin sem byrja á *tn- eða *pn; o.s.frv. Í sumum tilvikum er um að ræða það sem kalla má kerfisgöt – orð sem hljóðkerfið leyfir ekki. Þannig er algengt að samhljóð með sama myndunarstað geti ekki staðið saman og því geta engin orð í málinu byrjað á *tn-, *tl-, *dn-, *dl- – eða á *pv-, *bv-. Í öðrum tilvikum er um að ræða tilviljanagöt – orð sem brjóta engar reglur og gætu verið til, en eru það ekki.

Lítum t.d. á orðið flok. Það finnst ekki í neinum íslenskum orðabókum og er ekki íslenskt orð, að því er næst verður komist. En það virðist bara vera tilviljun, því að þetta gæti vel verið íslenskt orð. fl- kemur fyrir í upphafi margra íslenskra orða, og flo- líka (flot, flos, flog, flokkur). Einnig eru dæmi um -ok í enda orðs (rok, fok) og jafnvel -lok (lok). Þetta orð brýtur því ekki hljóðskipunarreglur málsins á nokkurn hátt, og við getum sagt að þarna sé bara um tilviljunargat að ræða; þetta orð gæti vel verið til. Öðru máli gegnir um orðið *tlok. Það er ekki heldur til í íslensku; en það sem meira er, það gæti ekki verið til. *tl- í framstöðu er ekki til í málinu eins og áður segir, þannig að þetta er kerfisgat.

Það gæti sem sagt vel farið svo að flok yrði einhvern tíma tekið upp sem nýyrði, en það er nánast útilokað að nokkrum nýyrðasmið dytti í hug að koma orðinu tlok inn í íslensku. Vissulega eru þó einstöku sinnum tekin inn í málið orð sem brjóta reglur þess, en þau verða alltaf framandi og hafa tilhneigingu til að laga sig að kerfinu.

Hljóðafar íslenskra orða

Hvað einkennir íslensk orð? Hvernig þekkjum við orð af erlendum uppruna? Gæti *brukur verið íslenskt orð? En *brjukur? Áreiðanlega er erfitt að svara þessum spurningum svo að öllum líki, og ekki efamál að tilfinning málnotenda er misjöfn hvað þetta varðar. Þó er varla vafi á því að hljóðfræðileg gerð orðanna skiptir miklu máli. Alkunna er að tungumál hafa mjög mismunandi reglur um það hvaða hljóð geta staðið saman í orði. Um þetta gilda svonefndar hljóðskipunarreglur. Þetta eru ekki skráðar reglur sem við lærum í skóla, heldur mynstur sem við tileinkum okkur í máltökunni. Börn greina – ósjálfrátt og ómeðvitað – gerð þeirra orða sem þau læra, og koma sér upp hugmyndum um það hvernig íslensk orð geti verið.

Miklar hömlur eru á því hvaða hljóð geta raðast saman í íslenskum orðum. Því fer t.d. fjarri að hvaða sérhljóð sem er geti staðið með hvaða samhljóðaklasa sem er. Strengurinn *brjukur sem tekinn var sem dæmi hér að framan er t.d. tæpast hugsanlegur sem íslenskt orð, þótt brj- sé fullkomlega leyfilegur samhljóðaklasi í upphafi orða, sbr. brjálaður, Brjánn, brjósk, brjóta. En á og ó eru einu sérhljóðin sem geta komið á eftir þessum klasa (eins og mörgum tveggja og þriggja samhljóða framstöðuklösum með j). Það er samt ekki endilega víst að við höfum öll áttað okkur á þeim hömlum. Það er alveg hugsanlegt að sum okkar hafi ályktað sem svo (ómeðvitað) að það sé bara tilviljun að við höfum ekki heyrt orð með öðrum sérhljóðum en á og ó á eftir brj-, og myndu því samþykkja hvaða sérhljóð sem væri á eftir slíkum klasa.

Mörg tökuorð hafa á sér framandi yfirbragð vegna þess að hljóðasamböndin í þeim koma ekki fyrir í orðum af innlendum uppruna. Önnur falla fullkomlega inn í málið þannig að ekki sér missmíði á. Kvenkynsorðið blók ‘ræfill, óþokki’ er „ungt to. úr e. bloke ‘ræfilmenni, (lélegur) náungi’“, segir í Íslenskri orðsifjabók. En orðið hefur fallið svo vel inn í málið að það myndar fleirtölu með i-hljóðvarpsvíxlum, blækur, hliðstætt við bók. Framstöðuklasinn bl- kemur fyrir í fjölda íslenskra orða, á eftir honum fer rótarsérhljóðið ó í algengum orðum eins og blóð, blóm, blóta; og nafnorð sem enda á -ók eru líka til, sbr. kvenkynsorðið bók og hvorugkynsorðið mók. Því er ekkert í fari þessa orðs sem bendir til erlends uppruna – nema það sé talið að orðið á sér enga ættingja í málinu, en það á líka við um ýmis rammíslensk orð.

Við tileinkum okkur reglur um leyfileg hljóðasambönd, eins og aðrar reglur málsins, með því að greina – ómeðvitað og ósjálfrátt – málið sem fyrir okkur er haft. En margar slíkar reglur taka einungis til fárra orða, stundum jafnvel sjaldgæfra, þannig að börn á máltökuskeiði hafa stundum mjög lítil gögn til að byggja á. Þess vegna má búast við að sumar slíkar reglur lærist seint, og sumir málnotendur læri þær jafnvel aldrei. Svo er líka spurning hvaða ályktun við drögum af því ef við heyrum ekki dæmi um eitthvað – ályktum við að fyrst við höfum aldrei heyrt það sé það ekki leyfilegt, eða gefum við okkur að það sé bara tilviljun að við höfum ekki heyrt slíkt dæmi og það sé örugglega leyfilegt? Þessu er erfitt að svara, en það er samt ljóst að viðbúið er að ýmsar reglur af þessu tagi glatist smátt og smátt og aðrar komi í staðinn.

En það er ekki bara hljóðskipun orða sem sker úr um það hvernig þau falla að íslensku máli – einnig þarf að huga að stöðu þeirra í málkerfinu. Enska orðið byte er gott dæmi um þetta. Það kom inn í málið fyrir 40 árum eða svo í myndinni bæt. Ekkert í gerð þess orðs er framandi íslenskri hljóðskipun. Ýmis algeng orð hefjast á bæ-, s.s. bæðibænbælibæta o.s.frv. Einnig eru til orðmyndir sem enda á -æt, s.s. græt (af gráta), læt (af láta), sæt (af sætur), æt (af ætur) o.s.frv. En ekkert þessara orða er nafnorð í hvorugkyni – íslensk hvorugkynsorð enda ekki á -æt. Þess vegna þótti ástæða til að bæta -i við orðið, þannig að í Tölvuorðasafni birtist það í myndinni bæti. Þar með fellur það algerlega að málinu, því að ýmis hvorugkynsorð enda á -æti, s.s. sæti, læti, æti, ágæti o.fl.

Þetta dæmi sýnir að ekki er nóg að líta til einstakra orðhluta (myndana) þegar metið er hversu vel orð falli að íslensku máli. Þó að bæt sé leyfilegur orðhluti (rót) í íslensku getur (eða gat) það ekki verið hvorugkynsnafnorð (en væri hins vegar leyfileg kvenkynsmynd af lýsingarorðinu *bætur, ef til væri). En hitt er svo annað mál hvort reglan sem bannar hvorugkynsorð eins og bæt og læk sé hluti af málkerfi venjulegra málnotenda. Þegar höfundar Tölvuorðasafns höfnuðu bæt en bjuggu til bæti í staðinn var það byggt á málsöguþekkingu (þótt ég geti auðvitað ekkert fullyrt um máltilfinningu þeirra). En þessi regla hefur við svo lítið að styðjast að mér finnst ólíklegt að málnotendur átti sig á henni í máltökunni. Þá er spurningin: Er einhver ástæða til að láta hana ráða einhverju um það hvaða orð eru viðurkennd í málinu?

Gærkvöld

Orðið gærkvöld/gærkveld kemur nánast eingöngu fyrir með forsetningunni í sem getur tekið með sér bæði þolfall og þágufall. Orðið kvöld eitt og sér er alltaf endingarlaust í þolfalli en endar á -i í þágufalli, kvöldi. Í því orði er alveg ljóst að í tekur með sér þolfall – við segjum Ég kem í kvöld, en alls ekki *Ég kem í kvöldi. Samt segjum ekkert síður í gærkvöldi en í gærkvöld og hvort tveggja þykir gott og gilt – Málfarsbankinn segir: „Bæði er hægt að segja í gærkvöld og í gærkvöldi.“ Hvernig stendur á þessu?

Orðið gærkveld kemur fyrir í fornu máli og þá er ævinlega ritað í gærkveld en þegar kemur fram á 16. öld fara að koma dæmi um í gærkveldi/gærkvöldi. Alla tíð síðan virðast þessar myndir hafa verið notaðar samhliða en í gærkvöldi þó mun algengara. Dæmi um gærkvöldi/gærkveldi á tímarit.is eru rúmlega fjórum sinnum fleiri en um gærkvöld/gærkveld, og í Risamálheildinni eru dæmin um fyrrnefndu myndirnar hátt í þrefalt fleiri en um þær síðarnefndu. Það er því ljóst að löng og rík hefð er fyrir báðum myndum og fráleitt væri að telja aðra þeirra réttari en hina.

Ekki er gott að segja hvernig það kom til að farið var að nota myndina gærkvöldi í þessu sambandi. Reyndar má líka finna einstöku dæmi um í kveldi/kvöldi frá svipuðum tíma og elstu dæmin um í gærkveldi, og í morgni kemur einnig fyrir um svipað leyti. Þetta gæti bent til þess að tilhneiging til að láta í stjórna þágufalli í stað þolfalls í þessum samböndum hafi komið upp á þessum tíma en síðan horfið aftur – en þágufallsmyndin hafi þó haldist í sambandinu í gærkvöldi.

Ástæðan fyrir því að í gærkvöldi hélst í málinu, öfugt við í kvöldi og í morgni, er hugsanlega sú að gærkvöld kemur nær eingöngu fyrir í þessu sambandi eins og áður segir. Orðið kvöld er notað í margvíslegu samhengi og því skiptir máli hvort notuð er myndin kvöld eða kvöldi. Í gærkvöld(i) er hins vegar fast orðasamband og þess vegna hefur -i-endingin enga sérstaka þágufallsmerkingu þar. Í gærkvöld og í gærkvöldi verða bara valfrjáls tilbrigði orðasambandsins.

Tvítala

Fornafnið hán bættist í málið fyrir nokkrum árum og er þriðju persónu fornafn í hvorugkyni, notað um fólk sem skilgreinir sig hvorki sem karlkyns né kvenkyns. Venjulega hvorugkynsfornafnið í þriðju persónu er auðvitað það, en það er ekki hentugt til að nota um fólk. Upptaka hán hefur stundum mætt nokkurri andstöðu og meðal þeirra röksemda sem hefur verið beitt gegn orðinu er að fornöfn séu lokaður flokkur orða, öfugt við nafnorð, sagnir og lýsingarorð sem taki greiðlega við nýjum orðum. En þótt vissulega sé venja í málfræðilegri umræðu að gera mun á opnum og lokuðum orðflokkum er það ekki svo að „lokuðu“ orðflokkarnir séu harðlokaðir. Og svo má líka segja að það sé ágætt að bæta persónufornöfnunum upp það sem þau hafa misst – tvítöluna.

Í nútímamáli hafa fornöfn, eins og nafnorð, lýsingarorð og sagnir, tvær tölur – eintölu sem vísar til eins og fleirtölu sem vísar til fleiri en eins. En í fornu máli höfðu fornöfn fyrstu og annarrar persónu og eignarfornöfn þrjár tölur – eintölu, tvítölu og fleirtölu. Eintalan vísaði til eins, rétt eins og nú, en tvítalan til tveggja, hvorki fleiri né færri. Fleirtalan vísaði þá ekki til fleiri en eins, heldur fleiri en tveggja. Orðin ég og þú vísuðu til eins, við og þið til tveggja, en vér og þér til fleiri en tveggja. Breytingin er sem sé sú að fleirtalan hefur yfirtekið verksvið tvítölunnar og vísar nú til fleiri en eins. En það þýðir ekki að gömlu tvítölufornöfnin hafi horfið eins og kannski hefði mátt búast við, heldur víkkaði verksvið þeirra þannig að þau vísa nú til tveggja og fleiri – ekki bara tveggja eins og þau gerðu áður.

Gömlu fleirtöluorðin, vér og þér, misstu því það hlutverk sitt að tákna fleiri en tvo. En þau fengu nýtt hlutverk í hátíðlegu máli og gátu þar vísað hvort heldur sem var til eins eða fleiri. Þéringar tíðkuðust í íslensku fram á seinni hluta síðustu aldar – þá var sagt þér eruð beðnir að koma … og yður er boðið að koma … í stað þú ert beðinn / þið eruð beðin að koma … og þér/ykkur er boðið að koma …. Þéringar lögðust af að mestu leyti upp úr 1970 þótt þeim bregði fyrir enn í formlegum bréfum. Gamla fleirtöluformið í fyrstu persónu, vér, var einnig notað í hátíðlegu máli í vísun til eins eða fleiri. Stjórnmálamenn og embættismenn sögðu t.d. iðulega vér Íslendingar, en einnig vér erum … og var þá ekki alltaf ljóst hvort þeir áttu eingöngu við sjálfa sig eða hóp fólks, jafnvel þjóðina alla. Þessi notkun er nú nær horfin.

Tvítalan var ekki bara í persónufornöfnum, heldur líka í eignarfornöfnum – en þar hvarf ekki bara tvítalan, heldur ýmis fleirtöluform líka. Sérstök eignarfornöfn í nútímamáli eru fjögur; minn, þinn, sinn og vor. Merkingarlega og sögulega er vor fleirtala af minn, þótt orðið sé nú bundið við hátíðlegt mál og eignarfallið okkar af persónufornafninu við notað þess í stað – við segjum þetta er húsið okkar frekar en þetta er vort hús. Í annarri persónu er aftur á móti engin hátíðleg hliðstæða við vor til í nútímamáli, heldur eingöngu eignarfallið ykkar. Ef nota þarf hátíðlegt orð er hægt að grípa til yðar, sem er eignarfall gamla fleirtölufornafnsins þér en ekki sérstakt eignarfornafn eins og vor, og segja þetta er yðar hús.

En í fornu máli var ekki einasta til önnur persóna fleirtölu, yðvarr, hliðstæð við vor, heldur voru líka til sérstök tvítöluform, okkarr og ykkarr. Þá var sagt ég hitti vin okkarn eða ég mætti vini okkrum eða ég fór til vinar okkars ef átt var við vin einhverra tveggja, mælandans og eins annars. Í nútímamáli notum við myndina okkar, eignarfall af persónufornafninu við, í öllum tilvikum. Væri vísað til vinar einhverra tveggja var sagt ég hitti vin ykkarn eða ég mætti vini ykkrum eða ég fór til vinar ykkars; en væri vísað til vinar einhverra þriggja var sagt ég hitti vin yðvarn eða ég mætti vini yðrum eða ég fór til vinar yðvars. Í nútímamáli notum við í öllum tilvikum myndina ykkar, eignarfall af persónufornafninu þið.

Á 14. eða 15. öld fóru skil tvítölu og fleirtölu að riðlast þannig að farið var að nota fleirtölumyndirnar þótt aðeins væri átt við tvo, og tvítölumyndirnar einnig um þrjá eða fleiri. Það var samt ekki fyrr en á 17. öld sem hratt undanhald tvítölunnar hófst, og á 18. öld hvarf greinarmunur tvítölu og fleirtölu alveg. Gömlu tvítölumyndirnar héldust þó í málinu í víkkaðri merkingu eins og áður segir, en gömlu fleirtölumyndirnar fengu nýtt hlutverk.

Maður, manneskja – eða man?

Nýlega vakti Andrés Ingi Jónsson alþingismaður máls á því á Alþingi hvort ekki væri rétt að færa málfar þingsins í átt að kynhlutlausri málnotkun. Forsætisráðherra tók undir þetta og benti á að þegar væri farið að færa lagamál og opinbera málnotkun í þessa átt, t.d. í lögum um kynrænt sjálfræði og frumvarpi til laga um mannanöfn. Hins vegar varðaði þetta málstefnu Stjórnarráðsins og því væri eðlilegt að þessi umræða færi fram á vettvangi málnefndar Stjórnarráðsins.

Fyrir tveimur árum varpaði Jón Steindór Valdimarsson alþingismaður fram þeirri spurningu hvort rétt sé að taka íslenskt lagamál til endurskoðunar og fara yfir það með kynjagleraugum. Hann vísaði í skilgreiningu á nauðgun í 194. grein almennra hegningarlaga þar sem segir „Hver sem hefur sam­ræði eða önnur kyn­ferð­is­mök við mann án sam­þykkis hans ger­ist sekur um nauðgun“ og benti réttilega á að þessi orðanotkun „virð­ist ekki tala skýrt til kvenna“. Mikið er til í þessu.

Saga þessa orðalags er reyndar forvitnileg. Í almennum hegningarlögum frá 1940 var upphaflega alls staðar talað um kvenmann í þessari lagagrein – sú hugmynd að karlar gætu verið þolendur kynferðisbrota var ekki komin til. Þegar dómsmálaráðherra lagði fram frumvarp um breytingu á kynferðisbrotakafla hegningarlaganna haustið 1991 var orðið manneskja sett í staðinn – væntanlega af því að frumvarpshöfundum hefur þótt orðið maður vísa um of til karlmanna í huga málnotenda.

Í áliti meirihluta allsherjarnefndar – fulltrúa allra flokka nema Kvennalistans – um frumvarpið segir hins vegar: „Enn fremur er lagt til að orðið „manneskja“ falli brott og í stað þess komi orðið: maður. Í íslensku máli tekur orðið maður bæði til karla og kvenna og þykir ekki fara vel á því í lagatexta að nota orðið manneskja“. Þessi breytingartillaga var samþykkt og því fór maður inn í endanlegan texta laganna og er þar enn eins og áður segir.

En minnihlutinn, fulltrúi Kvennalistans, var andvígur þessari breytingu: „Minni hlutinn styður þó ekki þær breytingartillögur sem lúta að orðalagi frumvarpsins, þ.e. að í stað orðsins „manneskja“ komi: maður og aðrar breytingar sem af því leiðir. Enda þótt orðið „maður“ sé oft notað bæði um karla og konur er rík hefð fyrir því í íslensku að orðið maður eigi aðeins við um karlmenn. [...] Ástæðulaust er að fúlsa við notkun hins kvenkennda orðs „manneskja“ þegar átt er við bæði kynin“.

Þarna var sem sé orðin athyglisverð breyting: Kringum 1970 barðist Rauðsokkahreyfingin fyrir því að fá það viðurkennt að konur væru líka menn. Það var mjög skiljanleg og eðlileg barátta. 20 árum síðar fannst Kvennalistakonum hins vegar orðið maður ekki vísa til sín. Það er líka mjög skiljanlegt og eðlilegt. Hin tvöfalda merking orðsins maður veldur því að það er að margra mati oft óheppilegt í hinni almennu merkingu. Hér vantar því heppilegt kynhlutlaust orð.

Það er víðar en í áðurnefndu lagafrumvarpi sem hefur verið reynt að nota orðið manneskja í þessum tilgangi – Ríkisútvarpið hefur t.d. undanfarin ár valið manneskju ársins. En manneskja er kvenkynsorð og ekki sérlega heppilegt sem kynhlutlaust orð því að það tengist konum ekkert síður en maður tengist körlum. Ég gæti ekki sagt Hvað ertu að gera maður? við konu en ekki heldur Hvað ertu að gera manneskja? við karl. Nýlega hefur hins vegar verið stungið upp á því að nýta orðið man í þessum tilgangi.

Vissulega hefur man merkinguna 'ófrjáls maður, karl eða kona' (auk merkingarinnar 'kona' í skáldamáli) en er ákaflega lítið notað í nútímamáli, nema helst í samsetningunni mansal. Það er ekki einsdæmi að gömul en lítið notuð orð séu endurnýtt og þeim gefin ný merking – en þó oftast skyld, sbr. sími sem merkti 'band, þráður', og skjár sem merkti 'gegnsæ himna í glugga, gluggi'. Kosturinn við man er að það er hvorugkynsorð og hefur hljóðfræðileg og merkingarleg tengsl við maður og manneskja.

Ég veit ekki til að þessi notkun orðsins man hafi breiðst út að ráði, en Helga Vala Helgadóttir hefur þó notað orðið þingman um sjálfa sig. Mér finnst þetta hreint ekki galið en hins vegar er ekki einfalt að breyta svo rótgrónum þætti málsins og skal engu spáð um framtíð þessarar málnotkunar. Ef eingöngu konur taka hana upp er hættan sú að fólk fari að tengja man við konur og það verði þá ónothæft sem kynhlutlaust orð – eins og manneskja.

Áhafnarmeðlimir og skipverjar

Um daginn sá ég einu sinni sem oftar kvartað yfir orðinu áhafnarmeðlimur. Þetta orð, sem virðist ekki vera nema rúmlega 60 ára gamalt í málinu, er meðal þeirra orða sem oftast eru gerðar athugasemdir við í ýmsum málfarsþáttum – það þykir langt, stirt, útlenskulegt og ljótt. Í fljótu bragði fann ég 15 dæmi á tímarit.is þar sem amast var við orðinu, þar af sex úr þætti Gísla Jónssonar um íslenskt mál í Morgunblaðinu. Í þessum athugasemdum er yfirleitt bent á einfalda og þægilega leið til að komast hjá notkun þessa orðs, sem sé að nota orðið skipverji í staðinn.

Vissulega er skipverji miklu styttra og liprara orð, kemur fyrir í fornmáli, og er auk þess fallegra orð að flestra mati þótt það sé að sjálfsögðu smekksatriði. Í Íslenskri orðabók er áhafnarmeðlimur merkt með !? sem merkir „orð eða málatriði sem nýtur ekki fullrar viðurkenningar, telst ekki gott mál í venjulegu samhengi“ og skýrt sem bæði 'skipverji' og 'flugverji' – vegna þess að áhöfn er ekki bara á skipi. Í Málfarsbankanum segir: „Fremur en að nota orðið „áhafnarmeðlimur“ ætti að nota: skipverji, einn úr áhöfninni, flugverji.“ En er þetta rétt – merkja orðin áhafnarmeðlimur og skipverji örugglega það sama?

Einu sinni þegar ég var að skoða dæmin um orðið skipverji í Íslendingasögum áttaði ég mig á því að í fornu máli merkir orðið ekki bara 'einn af starfsmönnunum á skipi, einn úr áhöfn skips'. Í næstum öllum dæmunum er nefnilega talað um skipverja sína, skipverja hans o.s.frv. Í fornmáli hagar orðið sér því svipað og t.d. orðin liðsmaður eða stuðningsmaður – það er ekki hægt að vera bara liðsmaður, heldur verður að vera liðsmaður einhvers. En þetta hefur breyst – í nútímamáli lýtur orðið ekki þessum takmörkunum, eins og auðvelt er að ganga úr skugga um t.d. í Risamálheildinni.

Ég hélt á sínum tíma að þarna hefði ég gert merka uppgötvun, en svo kom í ljós að norski sveitapresturinn Johan Fritzner, sem samdi ítarlegustu orðabók sem hefur verið gefin út um fornmálið, var að sjálfsögðu með þetta á hreinu fyrir 150 árum – skýringin á skipverji hjá honum er „Mand som er sammen med en (e-s) paa et Fartøi“. Þarna er skipverji því fyrst og fremst tengt við foringjann, en nú við skipið – skipverji á togaranum. Ég er hins vegar nokkurn veginn viss um að þessi merkingarbreyting hefur farið fram hjá öllum venjulegum lesendum íslenskra fornbókmennta – sem skiljanlegt er.

Samhengið í íslensku máli og bókmenntum er oft vegsamað, með réttu. Vegna þess að orðaforði fornmáls og beygingarkerfið hefur varðveist að mestu leyti eigum við tiltölulega auðvelt með að lesa forna frásagnartexta, að því tilskildu að þeir séu gefnir út með nútímastafsetningu. En það leiðir til þess að við gefum okkur venjulega án umhugsunar að orð sem við finnum í fornum texta, og þekkjum úr okkar eigin máli, merki hið sama og það gerir nú – a.m.k. ef samhengið bendir ekki til annars. Það hvarflar ekki að okkur að fletta slíku orði upp í fornmálsorðabókum (auk þess sem orðabók Fritzners var ekki almenningseign þótt hún sé reyndar komin á netið).

Mér finnst þetta skemmtilegt dæmi um hvernig stöðugleiki málsins, svo ágætur sem hann annars er, getur leitt mann á villigötur. Í þessu tilviki má auðvitað segja að munurinn sé sáralítill – skiptir einhverju máli hvort einhver var skipverji konungs eða skipverji á skipi konungs, hvort viðmiðið var foringinn eða skipið? Ég veit það ekki – en aðalatriðið er svo sem ekki hvort þetta skiptir máli í þessu tilviki, heldur að svipuð dæmi, þar sem samfella málsins veldur því að við áttum okkur ekki á merkingarbreytingum, eru örugglega fjölmörg. Og í þeim sumum gæti breytingin skipt máli, jafnvel gerbreytt skilningi okkar á textanum. Höfum það í huga þegar við lesum forna texta.

Spá Rasks og samtíminn

Árið 1813, fyrir rúmum 200 árum, skrifaði danski málfræðingurinn Rasmus Christian Rask vini sínum Bjarna Thorsteinssyni amtmanni bréf sem oft er vitnað til. Þar segir: „Annars þjer einlæglega að segja held jeg, að íslenzkan bráðum muni útaf deyja; reikna jeg, að varla muni nokkur skilja hana í Reykjavík að 100 árum liðnum, en varla nokk­ur í landinu að öðrum 200 árum þar upp frá, ef allt fer eins og hingað til og ekki verða ramm­ar skorð­ur við reistar.“

Íslenska var enn töluð í Reykjavík 100 árum síðar, 1913, enda hófu Rask og aðrir að reisa við „rammar skorður“ á næstu árum eftir þetta. Þótt svo hefði ekki verið gert er trúlegt að íslenska væri enn notuð í Reykja­vík og ann­ars staðar á landinu, en sú íslenska væri líklega töluvert öðru­vísi en sú sem við tölum nú. En Rask er svo sannarlega ekki einn um að hafa spáð hnignun og dauða íslenskunnar undan­farin 200 ár.

Hér er ekki ætlunin að rekja þá sögu en frá síðustu áratugum má t.d. nefna ráðstefnu „um varðveislu og eflingu íslenskrar tungu“ sem mennta­málaráðherra stóð fyrir í Þjóðleikhúsinu 1. desember 1985, og „Ráð­stefnu um stöðu máls­ins“ sem var haldin í Norræna húsinu árið 2006 að frumkvæði nokk­urra áhugamanna og með tilstyrk Fé­lags ís­lenskra bóka­útgef­enda og Rithöfunda­sam­bands Íslands. Á báðum þessum ráðstefnum var dregin upp dökk mynd af stöðu og framtíð íslenskunnar.

Í setn­ingar­ávarpi fyrrnefndu ráðstefnunnar sagði ráð­herra að ís­lenska ætti „í vök að verjast“ og væri á „undanhaldi“, og á þeirri síðar sagði einn frummælenda m.a.: „Sjálfar undirstöður tungumálsins eru að bresta. Beygingakerfið er í uppnámi og setn­ingafræðilegur grundvöllur líka. Svo virðist sem tilfinning fólks fyrir upp­bygg­ingu eðlilegra og einfaldra setninga sé á mjög hröðu undanhaldi.“

Spár um hnign­un og dauða íslenskunnar hafa í seinni tíð oft verið tengdar tækni­nýj­ung­um, t.d. Kana­sjónvarpinu, gervihnattasjónvarpi, netinu, tölvuleikjum o.fl. En eru eitthvað meiri líkur til þess nú en áður að „heimsendaspámenn“ hafi rétt fyrir sér? Um það er ekki gott að segja, en ég held að aðstæður nú séu að minnsta kosti að þrennu leyti andstæðari íslenskunni en áður hefur verið:

  • Meira og víðtækara áreiti. Enskan í málumhverfinu er miklu meiri og á fleiri sviðum en erlent mál hefur nokkru sinni verið, eins og rakið var í pistli hér nýlega. Málsambýli íslensku og ensku er því miklu nánara en áður – bæði í raunheimi en ekki síður hinum stafræna heimi nets, snjalltækja og tölvuleikja sem stór hluti málnotenda lifir nú og hrærist í.
  • Yngri viðtakendur. Börn á máltökuskeiði eru langsamlega viðkvæmust fyrir ýmiss konar ytri áhrifum á tungumálið. Enskt máláreiti nær nú til mun yngri barna en áður gegnum snjall­tæki og sjónvarpsáhorf. Dönsk áhrif á 19. öld náðu lítið sem ekkert til barna á máltökuskeiði, og ensk áhrif allt frá stríðsárum náðu lengi einkum til fullorðinna þótt það hafi verið að breytast.
  • Gagnvirkni. Vissulega hafa Íslendingar horft á sjónvarpsefni á ensku frá tímum Kanasjónvarpsins fyrir 60 árum en enskunotkun málnotenda, einkum barna og ung­linga, er mun gag­nvirkari en áður – í stað þess að vera að miklu leyti bundin við ein­hliða miðl­un þar sem fólk eru óvirkir viðtakendur er enskan núna orðin virkt samskiptatæki við fólk og tölvur.

Að svo stöddu er ekki hægt að fullyrða neitt um áhrif samfélags- og tækni­breytinga síðustu ára á tungumálið, enda getur tekið nokkurn tíma fyrir hugsanleg áhrif að koma fram. Enn er því ekki útséð um að seinni hluti áðurnefnds spádóms Rasks rætist, þ.e. að ís­lenska verði horfin af landinu öllu árið 2113. En við getum afstýrt því að svo verði – ef við viljum.

Hugsanleg áhrif aukinnar enskunotkunar

Áhrif aukinnar enskunotkunar í íslensku málumhverfi gætu verið margvísleg og varðað bæði form málsins, þ.e. hljóðkerfi, beygingar, setningagerð, merkingu og orðaforða, og umdæmi þess, þ.e. þau svið þjóðlífsins þar sem tungumálið er notað. Áhrifin gætu komið fram á a.m.k. fernan hátt:

  • Áhrif ensku á íslenskt málkerfi aukast. Þetta getur komið fram í beinum áhrif á orðaforða og merkingu orða, en einnig má búast við áhrifum á setningagerð og hugsanlega beygingar og framburð. Áhrifin geta einnig verið óbein, þannig að sjaldgæf eða flókin málfarsatriði veikist vegna minnkandi íslensku í málumhverfi barna og unglinga.
  • Íslenska í málumhverfinu minnkar. Snjalltækjanotkun, sjónvarpsáhorf o.fl. getur leitt til þess að börn á máltökuskeiði verji stórum hluta dagsins í enskum málheimi og heyri þar af leiðandi minni íslensku talaða. Afleiðingin gæti orðið sú að íslenskan í málumhverfinu nægi ekki til að byggja upp sterkt málkerfi og mál­kennd hjá börnum.
  • Notkunarsvið íslensku skerðist. Notkun ensku hefur þegar aukist, og notkun ís­lensku minnkað að sama skapi, á nokkrum sviðum – í viðskiptalífinu, í ferða­þjónustu, í háskólakennslu, og í margs kyns samskiptum við tölvur. Ef íslenska missir einstök svið til enskunnar að verulegu leyti getur verið erfitt eða ógerningur að ná þeim til baka.
  • Virðing fyrir tungumálinu minnkar. Ef íslenska verður ekki nothæf eða notuð á öllum sviðum samfélagsins gæti hún fengið á sig þann stimpil að vera gamal­dags og hallærisleg. Það gæti dregið úr áhuga fólks á að tileinka sér hana vel og leitt til þess að fólk leggi meiri áherslu á ensku vegna þess að það telji hana gefa meiri möguleika.

Það er sameiginlegt öllum þessum atriðum að þau tengjast bæði formi og umdæmi máls­ins. Áhrif á málkerfið og minnkuð íslenska í málumhverfinu varðar vissulega einkum form­ið, fljótt á litið a.m.k., en þetta gæti hvorttveggja leitt til aukinnar óvissu um íslenska málnotkun og þannig stuðlað að því að málnotendur leiti fremur í faðm enskunnar. Skert notk­unarsvið málsins og minnkandi virðing varðar einkum umdæmið, en gæti einnig haft áhrif á formið.

Það er ljóst að allra þessara þátta sér nú þegar stað í íslensku og íslensku málsamfélagi, eins og kom m.a. fram í rannsókninni „Greining á málfræðilegum afleiðingum stafræns málsambýlis“ sem við Sigríður Sigurjónsdóttir prófessor stýrðum á árunum 2016-2019. Ekkert bendir samt til annars en þau áhrif sem þegar gætir séu afturkræf að mestu leyti. Þess vegna skiptir öllu máli að við hlúum að íslenskunni og styrkjum hana til að hún geti staðist utanaðkomandi áreiti.

Það þarf samt að gæta þess að barátta fyrir íslenskunni snúist ekki upp í baráttu gegn enskunni. Enska er ekki óvinurinn – enska er alþjóðlegt samskiptamál sem mikilvægt er að hafa gott vald á. Óvinurinn er andvaraleysi málnotenda og metnaðarleysi fyrir hönd íslenskunnar. Gegn því þarf að vinna.