Tíðni einstakra orðflokka

Notkun kerfisorða – samtenginga, forsetninga, hjálparsagna og persónufornafna – er að mestu leyti óháð textategund og umfjöllunarefni. Tíðniröð þessara orða og hlutfall af texta er því mjög svipað milli texta og einnig á mismunandi tímum, þótt vissulega megi búast við ákveðnum breytingum á notkun einstakra orða. En öðru máli gegnir þegar litið er á inntaksorðin – einkum nafnorð og sagnir, en einnig lýsingarorð. Viðfangsefni hvers texta ákvarðar hvaða inntaksorð eru þar mest notuð, þótt sum þeirra séu vissulega svo almennrar merkingar að búast megi við fjölda þeirra í nánast hvaða texta sem er.

Þegar algengustu inntaksorðin eru skoðuð dugir ekki að líta á orðmyndir, heldur þarf að skoða uppflettiorð þar sem búið er að fella allar beygingarmyndir undir uppflettimyndina. Í töflunum hér að neðan má sjá algengustu uppflettiorð í fjórum orðflokkum – nafnorðum, lýsingarorðum og sögnum, svo og atviksorðum og forsetningum sem steypt er saman í einn flokk. Töflurnar taka til tveggja gagnasafna úr nútímamáli, Íslenskrar orðtíðnibókar 1991 og Markaðrar íslenskrar málheildar 2012, og til samanburðar eru tölur úr Íslendingasögum.


Í nafnorðunum eru orðin maður og ár í efstu sætunum í báðum nútímamálslistunum, enda eru bæði notuð í mjög fjölbreyttu samhengi. Auk þeirra eru dagur, staður, barn og tími á báðum listum. Athyglisvert er að orðið mál, sem hefur ýmsar merkingar, er í þriðja sæti í MÍM en ekki meðal 10 algengustu orða í ÍO (er þar reyndar í 12. sæti þótt það sjáist ekki hér). Það má væntanlega rekja til ólíkrar samsetningar safnanna. Listinn úr Íslendingasögum er allt annars eðlis, þótt maður sé þar líka í efsta sæti– konungur er næstalgengasta nafnorðið, og þarna eru ýmis önnur orð sem bera efni sagnanna glöggt vitni, s.s. skip, , faðir og bróðir.

Í lýsingarorðunum eru orð almennrar merkingar áberandi í efstu sætunum – mikill, góður, margur og lítill eru meðal fimm algengustu orðanna á öllum listunum. Orðin nýr og stór koma líka fyrir á báðum nútímamálslistunum. Listinn úr Íslendingasögum sker sig úr sem von er, þegar efstu sætunum sleppir – þar eru áberandi orð sem eru algeng í mannlýsingum eins og illur, sannur, gamall, stór, og svo dauður.

Í sögnunum eru hjálparsagnirnar vera og hafa í efstu sætum allra listanna. Sömu 10 sagnirnar eru á báðum nútímamálslistunum þótt röðin sér örlítið mismunandi. Af þeim koma segja, koma, fara og taka líka fyrir á listanum úr Íslendingasögum. Þar vekur helst athygli sögnin mæla í sjöunda sæti, en hún er fjarri því að vera meðal algengustu sagna í nútímamáli. Eins eru þarna hjálparsagnirnar munu og skulu en tíðni þeirra er hlutfallslega mun minni í nútímamáli – munu er í 18. sæti og skulu í því 29. í MÍM.

Í flokki forsetninga og atviksorða eru sömu 10 orðin í báðum nútímamálslistunum þótt röðin sé eilítið mismunandi. Raunar er þarna bara eitt hreint atviksorð, ekki – hitt eru allt fyrst og fremst forsetningar. Á listanum úr Íslendingasögum eru forsetningarnar til, í, á, um, við og með eins og á hinum listunum þótt röðin sé dálítið önnur – það er athyglisvert að í og til eru álíka algengar að fornu en í nútímamáli er í fjórum til fimm sinnum algengari en til. Auk forsetninganna eru þarna fjögur atviksorð sem ekki eru á nútímamálslistunum – þá, þar, og svo.

Algengustu orðmyndir málsins

Hér að neðan er tafla þar sem 25 algengustu orðmyndir íslensks nútímamáls (einkum ritmáls) eru sýndar í fjórum fremstu dálkunum, samkvæmt fjórum heimildum – tíðnikönnun Ársæls Sigurðssonar 1940, Íslenskri orðtíðnibók 1991, Markaðri íslenskri málheild 2012 og Risamálheild 2020. Athugið að margar af þessum orðmyndum tilheyra fleiri en einu uppflettiorði og ekki er greint þar á milli. Þannig getur verið nafnháttarmerki, samtenging og forsetning; á getur verið forsetning, atviksorð, sagnmynd, og mynd af tveimur mismunandi nafnorðum; við getur verið forsetning og persónufornafn; o.s.frv.


Eins og sjá má eru nokkurn veginn sömu orðin á öllum þessum listum þótt innbyrðis röð þeirra sé svolítið breytileg; en , og, í og á eru alltaf í fjórum efstu sætunum. Þegar taflan er skoðuð sést glöggt að langflest orðin eru svokölluð kerfisorð, þ.e. orð sem hafa málfræðilegt hlutverk, sýna innbyrðis vensl orða í setningum – einkum samtengingar, forsetningar og hjálparsagnir, en einnig persónufornöfn og atviksorð. Ekkert nafnorð, lýsingarorð eða sögn, nema myndir hjálparsagnanna vera og hafa, er meðal þessara orða (þótt einhverjar orðmyndir sem tilheyra þessum flokkum hafi væntanlega slæðst með dæmum um á o.fl.).

Þessi orð eru nokkurn veginn óháð innihaldi textans, og eru þess vegna yfirleitt þau sömu hvaða íslenskur texti sem er skoðaður. Ef við greinum listann eftir orðflokkum og skoðum algengustu nafnorð, sagnir (að frátöldum hjálparsögnum) og lýsingarorð verður niðurstaðan allt önnur. Nafnorð eins og maður og ár, lýsingarorð eins og margur, mikill og góður, sagnir eins og koma, fara og segja eru reyndar alltaf mjög ofarlega, en eftir því sem farið er neðar í tíðnilistanum verða niðurstöðurnar ólíkari eftir textum vegna þess að þá fer umfjöllunarefnið að hafa áhrif á orðanotkun.

Í fimmta dálknum eru sýndar 25 algengustu orðmyndirnar í talmáli (samtölum) samkvæmt Íslenskum talmálsbanka (ÍS-TAL) sem safnað var til um síðustu aldamót. Athugið að efniviðurinn er þar ekki nema tæp 200 þúsund lesmálsorð. Orðmyndirnar eru að miklu leyti þær sömu og í ritmálinu, en þó eru þarna fimm orð sem ekki eru meðal algengustu orða ritmálsins og mega teljast dæmigerð talmálsorð – , bara, sko, svona, nei og hérna. Auðvitað eru ýmis fleiri orð bundin við talmál þótt þau komi ekki fram meðal algengustu orða hér, t.d. jæja. Takið líka eftir að og, í og á sem eru meðal fjögurra algengustu orðmynda í öllum ritmálskönnununum eru í sjötta til áttunda sæti í talmálinu.

Í aftasta dálknum eru svo til samanburðar sýndar 25 algengustu orðmyndirnar í fornu máli. Þessi listi er byggður á Íslendingasögum, Sturlungu, Heimskringlu og Landnámabók. Þetta eru að mestu leyti sömu orðmyndir og í nútímamálslistunum sem sýnir stöðugleik málsins. Fornafnið hann er þó mun ofar þarna sem skýrist af því að um frásagnarbókmenntir er að ræða. Þá eru forsetningarnar í og til álíka algengar að fornu en í nútímamáli er í fjórum til fimm sinnum algengari en til. Eina orðið á fornmálslistanum sem ekki er í hópi algengra orða í nútímamáli er neitunin eigi sem hefur að mestu leyti verið skipt út fyrir ekki. Ef tíðni þessara tveggja orða í fornu máli væri lögð saman yrði neitunin á svipuðum stað í röðinni og í nútímamáli.

Íslenskar orðtíðnirannsóknir

Stundum veltir fólk því fyrir sér hver séu algengustu orðin í íslensku. Því er núna hægt að svara, en áður þarf samt að átta sig á því að orðið orð er margrætt – hefur a.m.k. þrjár merkingar sem hér skipta máli. Í fyrsta lagi er merkingin ‘uppflettiorð’ sem felur í sér grunnmynd (uppflettimynd, orðabókarmynd) orðsins og allar beygingarmyndir þess. Undir uppflettiorðið eiga falla þannig auk uppflettimyndarinnar beygingarmyndir eins og á, eigum, átti, ætti, o.s.frv. En myndin á getur auðvitað líka verið forsetningin á, nafnorðið á, og beygingarmynd af nafnorðinu ær.

Önnur merking orðsins er svo ‘orðmynd’ – tiltekinn stafa- eða hljóðastrengur, óháð málfræðilegri greiningu. Þannig er á ein og sama orðmyndin hvort sem hún tilheyrir sögninni eiga, forsetningunni á, nafnorðinu á eða nafnorðinu ær. Þriðja merkingin er svo ‘lesmálsorð’ – orð í texta. Þetta er sú merking sem á við þegar lengd texta er tilgreind – ef sagt er t.d. að ritgerð eigi að vera þúsund orð merkir það ekki að í henni eigi að koma fyrir þúsund mismunandi lesmálsorð eða orðmyndir, heldur að fjöldi lesmálsorða eigi að vera þúsund. Þá er hver orðmynd talin í hvert skipti sem hún kemur fyrir.

Tölvur hafa gert það ákaflega auðvelt að telja fjölda lesmálsorða og orðmynda. Talning uppflettiorða er hins vegar miklu flóknari vegna þess að hún krefst málfræðilegrar greiningar, til að hægt sé t.d. að fella dæmin um orðmyndina á undir rétta uppflettimynd út frá setningafræðilegri stöðu þeirra og stundum líka merkingu. Slíka greiningu þurfti til skamms tíma að gera í höndunum, en nú er kominn greiningarhugbúnaður (fyrir íslensku t.d. IceNLP og Greynir) sem greinir orðin vélrænt. Slík greining verður aldrei fullkomlega rétt, en þó yfirleitt nógu nákvæm til að hún gagnist til flestra þarfa.

Fyrstu stóru tíðnikönnun á íslenskum textum gerði Ársæll Sigurðsson skólastjóri og birti niðurstöður sínar í Menntamálum árið 1940. Tilgangur hennar var hagnýtur; „að finna leið til að gera stafsetningarkennsluna aðgengilegri og raunhæfari en áður, en þó vænlegri til betri árangurs“. Textarnir voru úr stílum barna, sendibréfum fullorðinna, lesbókum, náttúrufræði, sögu og landafræði, alls um 100 þúsund lesmálsorð. En vandaðasta tíðnikönnun á íslenskum textum var unnin hjá Orðabók Háskólans en niðurstöður hennar birtust í Íslenskri orðtíðnibók 1991. Hún byggðist á um 500 þúsund lesmálsorðum úr fimm mismunandi textategundum.

Á árunum 2004-2012 var komið upp hjá Árnastofnun miklu textasafni, Markaðri íslenskri málheild – samtals um 25 milljónir lesmálsorða. Textarnir eru margfalt fjölbreyttari en í Íslenskri orðtíðnibók, og skiptast í 23 flokka. Frá 2005 hefur svo Risamálheild verið byggð upp hjá Árnastofnun og hefur nú að geyma 1,64 milljarða lesmálsorða úr ýmsum áttum. Á henni byggist Orðtíðnivefur Árnastofnunar sem nú tekur til tæplega 1,4 milljarðs lesmálsorða. Vegna stærðar og fjölbreytni þessara safna má því vinna úr þeim ábyggilegar upplýsingar um íslenska orðtíðni. Þó er stór galli að í þeim er mjög lítið af talmáli.

Tengsl stofngerðar og endingar

Meðal þeirra reglna sem við tileinkum okkur í máltökunni og fæstar eru nefndar í bókum nema þá óbeint eru ýmiss konar tengsl stofngerðar og beygingarendingar. Þessar reglur eru misjafnlega nákvæmar og misjafnlega víðtækar. Sumar eru undantekningarlausar en taka aðeins til örfárra orða, aðrar taka til mikils fjölda orða en eru frekar tilhneiging en föst regla, og svo er allt þar á milli. Þess vegna tekur það tíma fyrir börn á máltökuskeiði að átta sig á þeim öllum – þau þurfa miklar upplýsingar, þurfa að heyra mikið af máli í umhverfi sínu, til að geta tileinkað sér öll þessi mynstur sem eru ótalmörg – hér verða örfá nefnd.

Flest karlkynsorð sem hafa sterka beygingu (enda á -s eða -ar í eignarfalli eintölu) enda í nefnifalli fleirtölu annaðhvort á -ar, eins og hestar, eða -ir, eins og vinir. Við þurfum að læra á máltökuskeiði hvor endingin á við hverju sinni. En það er samt ekki svo að við séum algerlega án leiðsagnar í þessu námi. Þarna eru nefnilega ákveðin tengsl milli stofngerðar og fleirtöluendingar – tilhneigingin er sú að orð með grannt stofnsérhljóð (a, e, i, o, u, (y), ö) og eitt samhljóð þar á eftir fái -ir-fleirtölu, en önnur orð fái -ar-fleirtölu. Af fyrrnefnda hópnum má nefna vinur vinir, dalurdalir, refurrefir, bolurbolir, hamurhamir, svanur svanir, liturlitir, herherir, o.m.fl.

Þessi tilhneiging er vissulega fjarri því að vera undantekningarlaus. Orð eins og gestur og brestur hafa t.d. sömu stofngerð og hestur en fá samt -ir-fleirtölu. Orð eins og dagur og vogur-ar-fleirtölu þótt þau falli undir það mynstur sem oftast fær -ir. Svo mætti lengi telja. Það er samt nokkuð ljóst að börn átta sig á þessari tilhneigingu í máltökunni og nýta sér hana – fyrir þeim er -ar sjálfgefin fleirtala sem þau alhæfa iðulega og nota þar sem hún á ekki við en læra svo undantekningarnar smátt og smátt. Þetta sést líka í málbreytingum – refur var t.d. refar í fleirtölu í fornu máli og dalur oftast dalar. En nú hafa þessi orð alltaf -ir-fleirtölu, refir og dalir, eins og dæmigert er fyrir þessa stofngerð.

Flest karlkynsorð sem hafa -(j)ö í stofni enduðu áður á -u í þolfalli fleirtölu – firðir um fjörðu, kettir um köttu o.s.frv. Nú hafa þessi orð fengið -i í þolfalli fleirtölu og þar með lagað sig að öðrum orðum sem enda á -ir í nefnifallinu – beygjast firðir um firði, kettir um ketti o.s.frv. En stofnsérhljóðið fylgdi óhjákvæmilega með – beygingin firðir um *fjörði, kettir um *kötti er óhugsandi. Orð af þessum flokki enda yfirleitt á -i í þágufalli eintölu og -ar í eignarfalli – firði – fjarðar, ketti kattar. En sum þeirra, t.d. mökkur, hafa tilhneigingu til að missa endinguna í þágufalli og fá -ar í eignarfalli – beygjast mökk mökks í stað mekkimakkar. Þar með breytist stofnsérhljóðið líka –  *mekk – *makks er óhugsandi.

Langflest kvenkynsorð (önnur en veika beygingin, orð sem enda á -a í nefnifalli eintölu) enda á -ar í eignarfalli eintölu – myndmyndar, skálskálar, bókbókar, helgihelgar o.s.frv. Fáein orð fá þó eignarfallsendinguna -ur. Undir það falla einkum frændsemisorðin móðir, dóttir og systir og svo orð sem enda á -ík: vík, tík, flík, brík og samsetningar af þeim. Sum þeirra fá alltaf -ur í eignafalli, a.m.k. vík, en hin flakka milli -ar og -ur. En það er greinilegt að málnotendur hafa tilfinningu fyrir þessum tengslum milli -ík í stofni og -ur-endingar. Það má sjá á þeim fjölda tökuorða sem enda á -ík og fá þessa sjaldgæfu eignarfallsendingu, þrátt fyrir að -ar sé annars yfirgnæfandi: pólitík, rómantík, klassík, lýrík, grafík, kómík, músík o.s.frv.

Margvísleg mynstur leiðbeina okkur þannig um beygingu og eru misjafnlega sterk – sum eru nánast ófrávíkjanleg eins og tengsl milli stofngerðar og endingar í orðum á við köttur og fjörður, önnur eru tilhneigingar sem eiga sér ótal undantekningar eins og tengsl milli stofngerðar og fleirtöluendingar í orðum á við hestur og vinur. Svo eru líka fjölmörg dæmi um að engar eða mjög óljósar reglur séu til leiðsagnar, og þá má búast við málbreytingum eins og í sterkum kvenkynsorðum þar sem hurðar er komið upp sem fleirtala til hliðar við hurðir o.s.frv.

Samhljóðaklasar í upphafi orða

Þeim fer líklega fækkandi á þessum stafrænu tímum sem hafa flett prentuðum orðabókum, en þeim hefur varla dulist að fyrirferð bókstafanna er mjög mismikil – fá orð byrja á sumum bókstöfum, en fjölmörg á öðrum. Í öllum íslenskum orðabókum – og væntanlega orðabókum allra skyldra tungumála – er bókstafurinn s fyrirferðarmestur. Ástæðan fyrir því hvað s er algengt í upphafi orða er sú að það er ekki vandfýsið á hljóðfræðilegt umhverfi, heldur leyfir marga og fjölbreytta samhljóðaklasa á eftir sér. Samhljóðin eru nefnilega mjög ólík að þessu leyti og falla í nokkra hópa eftir því hvaða afstöðu þau geta haft til eftirfarandi sérhljóðs.

Ef j stendur á undan sérhljóði í upphafi orðs verður það alltaf að standa næst sérhljóðinu. Við höfum orð eins og jata, , él (þar sem é stendur fyrir je), jól, júgur, jæja, jörð o.s.frv., en þið getið prófað sjálf að stinga einhverju samhljóði á milli j og hvaða sérhljóðs sem er – það gengur ekki. Svipað er með v – það getur staðið næst á undan ýmsum sérhljóðum en milli þess og sérhljóðs getur ekkert samhljóð staðið nema j, í orðum sem eru rituð með évér, vél, og samsetningum af þessum orðum. Sama máli gegnir um m, n, l og r – þau geta staðið næst ýmsum sérhljóðum, en milli þeirra og sérhljóðs getur ekkert verið nema j, eins og í mjakast, njóta, ljár, rjúfa.

Lokhljóðin p, t, k, b, d, g eru enn sveigjanlegri. Þau geta vitaskuld staðið næst sérhljóði, og einnig haft j milli sín og sérhljóðsins, eins og pjátur, tjón, kjör, bjóða, djöfull, gjósa – eða hljóð úr hópnum n, l, r, eins og plástur, treysta, knöttur, blettur, drafa, gnísta. Öll nema p og b geta einnig haft v milli sín og sérhljóðs, eins og tveir, kver, dvergur, guð (þar sem auðvitað er borið fram v þótt það sé ekki sýnt í stafsetningu). Milli lokhljóðanna og sérhljóðsins geta líka staðið tvö samhljóð, að því tilskildu að það fyrra sé eitt af n, l, r og það seinna sé j. Þannig höfum við orð eins og prjóna, trjárækt, kljúfa, brjálast, drjúpa, gljái. Önghljóðin f, þ og h haga sér svipað – við höfum fjúka, þjást, hjóla og flýja, þrífa, hlaupa, en líka fljótur, þrjár, hnjúkur með n/l/r og j á undan sérhljóðinu.

Þá er s eftir. Það getur auðvitað staðið næst öllum sérhljóðum – saga, sár, selja, sitja, sími, sorp, sól, sund, súgur, sæla, sökkva – og líka haft j milli sín og margra sérhljóða, eins og í sjatna, sjá, sjoppa, sjón, sjúga, sjötti. Það getur líka haft tvö samhljóð milli sín og sérhljóðsins, ef það seinna er j, l eða rsljór, snjáður, spretta, splundra, strákur, skrafa. En svo getur s eitt samhljóða haft þrjú samhljóð milli sín og sérhljóðs í stöku tilvikum. Næst á eftir s verður þá að koma t eða k, þar á eftir r, og að lokum j næst sérhljóðinu. Þannig höfum við orð eins og strjáll, strjúgur, strjúka, strjúpi, skrjáfa, skrjóður – og varla öllu fleiri.

Þótt hér hafi verið reynt að draga fram reglur um það hvernig samhljóð geti raðast saman í upphafi orðs verður að leggja áherslu á að því fer fjarri að allir möguleikar sem rúmast innan þessara reglna séu nýttir í raun. Þótt til séu orð sem byrja á klj- eru engin sem byrja á *tlj- eða *plj; þótt til séu orð sem byrja á kn- eru engin sem byrja á *tn- eða *pn; o.s.frv. Í sumum tilvikum er um að ræða það sem kalla má kerfisgöt – orð sem hljóðkerfið leyfir ekki. Þannig er algengt að samhljóð með sama myndunarstað geti ekki staðið saman og því geta engin orð í málinu byrjað á *tn-, *tl-, *dn-, *dl- – eða á *pv-, *bv-. Í öðrum tilvikum er um að ræða tilviljanagöt – orð sem brjóta engar reglur og gætu verið til, en eru það ekki.

Lítum t.d. á orðið flok. Það finnst ekki í neinum íslenskum orðabókum og er ekki íslenskt orð, að því er næst verður komist. En það virðist bara vera tilviljun, því að þetta gæti vel verið íslenskt orð. fl- kemur fyrir í upphafi margra íslenskra orða, og flo- líka (flot, flos, flog, flokkur). Einnig eru dæmi um -ok í enda orðs (rok, fok) og jafnvel -lok (lok). Þetta orð brýtur því ekki hljóðskipunarreglur málsins á nokkurn hátt, og við getum sagt að þarna sé bara um tilviljunargat að ræða; þetta orð gæti vel verið til. Öðru máli gegnir um orðið *tlok. Það er ekki heldur til í íslensku; en það sem meira er, það gæti ekki verið til. *tl- í framstöðu er ekki til í málinu eins og áður segir, þannig að þetta er kerfisgat.

Það gæti sem sagt vel farið svo að flok yrði einhvern tíma tekið upp sem nýyrði, en það er nánast útilokað að nokkrum nýyrðasmið dytti í hug að koma orðinu tlok inn í íslensku. Vissulega eru þó einstöku sinnum tekin inn í málið orð sem brjóta reglur þess, en þau verða alltaf framandi og hafa tilhneigingu til að laga sig að kerfinu.

Hljóðafar íslenskra orða

Hvað einkennir íslensk orð? Hvernig þekkjum við orð af erlendum uppruna? Gæti *brukur verið íslenskt orð? En *brjukur? Áreiðanlega er erfitt að svara þessum spurningum svo að öllum líki, og ekki efamál að tilfinning málnotenda er misjöfn hvað þetta varðar. Þó er varla vafi á því að hljóðfræðileg gerð orðanna skiptir miklu máli. Alkunna er að tungumál hafa mjög mismunandi reglur um það hvaða hljóð geta staðið saman í orði. Um þetta gilda svonefndar hljóðskipunarreglur. Þetta eru ekki skráðar reglur sem við lærum í skóla, heldur mynstur sem við tileinkum okkur í máltökunni. Börn greina – ósjálfrátt og ómeðvitað – gerð þeirra orða sem þau læra, og koma sér upp hugmyndum um það hvernig íslensk orð geti verið.

Miklar hömlur eru á því hvaða hljóð geta raðast saman í íslenskum orðum. Því fer t.d. fjarri að hvaða sérhljóð sem er geti staðið með hvaða samhljóðaklasa sem er. Strengurinn *brjukur sem tekinn var sem dæmi hér að framan er t.d. tæpast hugsanlegur sem íslenskt orð, þótt brj- sé fullkomlega leyfilegur samhljóðaklasi í upphafi orða, sbr. brjálaður, Brjánn, brjósk, brjóta. En á og ó eru einu sérhljóðin sem geta komið á eftir þessum klasa (eins og mörgum tveggja og þriggja samhljóða framstöðuklösum með j). Það er samt ekki endilega víst að við höfum öll áttað okkur á þeim hömlum. Það er alveg hugsanlegt að sum okkar hafi ályktað sem svo (ómeðvitað) að það sé bara tilviljun að við höfum ekki heyrt orð með öðrum sérhljóðum en á og ó á eftir brj-, og myndu því samþykkja hvaða sérhljóð sem væri á eftir slíkum klasa.

Mörg tökuorð hafa á sér framandi yfirbragð vegna þess að hljóðasamböndin í þeim koma ekki fyrir í orðum af innlendum uppruna. Önnur falla fullkomlega inn í málið þannig að ekki sér missmíði á. Kvenkynsorðið blók ‘ræfill, óþokki’ er „ungt to. úr e. bloke ‘ræfilmenni, (lélegur) náungi’“, segir í Íslenskri orðsifjabók. En orðið hefur fallið svo vel inn í málið að það myndar fleirtölu með i-hljóðvarpsvíxlum, blækur, hliðstætt við bók. Framstöðuklasinn bl- kemur fyrir í fjölda íslenskra orða, á eftir honum fer rótarsérhljóðið ó í algengum orðum eins og blóð, blóm, blóta; og nafnorð sem enda á -ók eru líka til, sbr. kvenkynsorðið bók og hvorugkynsorðið mók. Því er ekkert í fari þessa orðs sem bendir til erlends uppruna – nema það sé talið að orðið á sér enga ættingja í málinu, en það á líka við um ýmis rammíslensk orð.

Við tileinkum okkur reglur um leyfileg hljóðasambönd, eins og aðrar reglur málsins, með því að greina – ómeðvitað og ósjálfrátt – málið sem fyrir okkur er haft. En margar slíkar reglur taka einungis til fárra orða, stundum jafnvel sjaldgæfra, þannig að börn á máltökuskeiði hafa stundum mjög lítil gögn til að byggja á. Þess vegna má búast við að sumar slíkar reglur lærist seint, og sumir málnotendur læri þær jafnvel aldrei. Svo er líka spurning hvaða ályktun við drögum af því ef við heyrum ekki dæmi um eitthvað – ályktum við að fyrst við höfum aldrei heyrt það sé það ekki leyfilegt, eða gefum við okkur að það sé bara tilviljun að við höfum ekki heyrt slíkt dæmi og það sé örugglega leyfilegt? Þessu er erfitt að svara, en það er samt ljóst að viðbúið er að ýmsar reglur af þessu tagi glatist smátt og smátt og aðrar komi í staðinn.

En það er ekki bara hljóðskipun orða sem sker úr um það hvernig þau falla að íslensku máli – einnig þarf að huga að stöðu þeirra í málkerfinu. Enska orðið byte er gott dæmi um þetta. Það kom inn í málið fyrir 40 árum eða svo í myndinni bæt. Ekkert í gerð þess orðs er framandi íslenskri hljóðskipun. Ýmis algeng orð hefjast á bæ-, s.s. bæðibænbælibæta o.s.frv. Einnig eru til orðmyndir sem enda á -æt, s.s. græt (af gráta), læt (af láta), sæt (af sætur), æt (af ætur) o.s.frv. En ekkert þessara orða er nafnorð í hvorugkyni – íslensk hvorugkynsorð enda ekki á -æt. Þess vegna þótti ástæða til að bæta -i við orðið, þannig að í Tölvuorðasafni birtist það í myndinni bæti. Þar með fellur það algerlega að málinu, því að ýmis hvorugkynsorð enda á -æti, s.s. sæti, læti, æti, ágæti o.fl.

Þetta dæmi sýnir að ekki er nóg að líta til einstakra orðhluta (myndana) þegar metið er hversu vel orð falli að íslensku máli. Þó að bæt sé leyfilegur orðhluti (rót) í íslensku getur (eða gat) það ekki verið hvorugkynsnafnorð (en væri hins vegar leyfileg kvenkynsmynd af lýsingarorðinu *bætur, ef til væri). En hitt er svo annað mál hvort reglan sem bannar hvorugkynsorð eins og bæt og læk sé hluti af málkerfi venjulegra málnotenda. Þegar höfundar Tölvuorðasafns höfnuðu bæt en bjuggu til bæti í staðinn var það byggt á málsöguþekkingu (þótt ég geti auðvitað ekkert fullyrt um máltilfinningu þeirra). En þessi regla hefur við svo lítið að styðjast að mér finnst ólíklegt að málnotendur átti sig á henni í máltökunni. Þá er spurningin: Er einhver ástæða til að láta hana ráða einhverju um það hvaða orð eru viðurkennd í málinu?

Gærkvöld

Orðið gærkvöld/gærkveld kemur nánast eingöngu fyrir með forsetningunni í sem getur tekið með sér bæði þolfall og þágufall. Orðið kvöld eitt og sér er alltaf endingarlaust í þolfalli en endar á -i í þágufalli, kvöldi. Í því orði er alveg ljóst að í tekur með sér þolfall – við segjum Ég kem í kvöld, en alls ekki *Ég kem í kvöldi. Samt segjum ekkert síður í gærkvöldi en í gærkvöld og hvort tveggja þykir gott og gilt – Málfarsbankinn segir: „Bæði er hægt að segja í gærkvöld og í gærkvöldi.“ Hvernig stendur á þessu?

Orðið gærkveld kemur fyrir í fornu máli og þá er ævinlega ritað í gærkveld en þegar kemur fram á 16. öld fara að koma dæmi um í gærkveldi/gærkvöldi. Alla tíð síðan virðast þessar myndir hafa verið notaðar samhliða en í gærkvöldi þó mun algengara. Dæmi um gærkvöldi/gærkveldi á tímarit.is eru rúmlega fjórum sinnum fleiri en um gærkvöld/gærkveld, og í Risamálheildinni eru dæmin um fyrrnefndu myndirnar hátt í þrefalt fleiri en um þær síðarnefndu. Það er því ljóst að löng og rík hefð er fyrir báðum myndum og fráleitt væri að telja aðra þeirra réttari en hina.

Ekki er gott að segja hvernig það kom til að farið var að nota myndina gærkvöldi í þessu sambandi. Reyndar má líka finna einstöku dæmi um í kveldi/kvöldi frá svipuðum tíma og elstu dæmin um í gærkveldi, og í morgni kemur einnig fyrir um svipað leyti. Þetta gæti bent til þess að tilhneiging til að láta í stjórna þágufalli í stað þolfalls í þessum samböndum hafi komið upp á þessum tíma en síðan horfið aftur – en þágufallsmyndin hafi þó haldist í sambandinu í gærkvöldi.

Ástæðan fyrir því að í gærkvöldi hélst í málinu, öfugt við í kvöldi og í morgni, er hugsanlega sú að gærkvöld kemur nær eingöngu fyrir í þessu sambandi eins og áður segir. Orðið kvöld er notað í margvíslegu samhengi og því skiptir máli hvort notuð er myndin kvöld eða kvöldi. Í gærkvöld(i) er hins vegar fast orðasamband og þess vegna hefur -i-endingin enga sérstaka þágufallsmerkingu þar. Í gærkvöld og í gærkvöldi verða bara valfrjáls tilbrigði orðasambandsins.

Tvítala

Fornafnið hán bættist í málið fyrir nokkrum árum og er þriðju persónu fornafn í hvorugkyni, notað um fólk sem skilgreinir sig hvorki sem karlkyns né kvenkyns. Venjulega hvorugkynsfornafnið í þriðju persónu er auðvitað það, en það er ekki hentugt til að nota um fólk. Upptaka hán hefur stundum mætt nokkurri andstöðu og meðal þeirra röksemda sem hefur verið beitt gegn orðinu er að fornöfn séu lokaður flokkur orða, öfugt við nafnorð, sagnir og lýsingarorð sem taki greiðlega við nýjum orðum. En þótt vissulega sé venja í málfræðilegri umræðu að gera mun á opnum og lokuðum orðflokkum er það ekki svo að „lokuðu“ orðflokkarnir séu harðlokaðir. Og svo má líka segja að það sé ágætt að bæta persónufornöfnunum upp það sem þau hafa misst – tvítöluna.

Í nútímamáli hafa fornöfn, eins og nafnorð, lýsingarorð og sagnir, tvær tölur – eintölu sem vísar til eins og fleirtölu sem vísar til fleiri en eins. En í fornu máli höfðu fornöfn fyrstu og annarrar persónu og eignarfornöfn þrjár tölur – eintölu, tvítölu og fleirtölu. Eintalan vísaði til eins, rétt eins og nú, en tvítalan til tveggja, hvorki fleiri né færri. Fleirtalan vísaði þá ekki til fleiri en eins, heldur fleiri en tveggja. Orðin ég og þú vísuðu til eins, við og þið til tveggja, en vér og þér til fleiri en tveggja. Breytingin er sem sé sú að fleirtalan hefur yfirtekið verksvið tvítölunnar og vísar nú til fleiri en eins. En það þýðir ekki að gömlu tvítölufornöfnin hafi horfið eins og kannski hefði mátt búast við, heldur víkkaði verksvið þeirra þannig að þau vísa nú til tveggja og fleiri – ekki bara tveggja eins og þau gerðu áður.

Gömlu fleirtöluorðin, vér og þér, misstu því það hlutverk sitt að tákna fleiri en tvo. En þau fengu nýtt hlutverk í hátíðlegu máli og gátu þar vísað hvort heldur sem var til eins eða fleiri. Þéringar tíðkuðust í íslensku fram á seinni hluta síðustu aldar – þá var sagt þér eruð beðnir að koma … og yður er boðið að koma … í stað þú ert beðinn / þið eruð beðin að koma … og þér/ykkur er boðið að koma …. Þéringar lögðust af að mestu leyti upp úr 1970 þótt þeim bregði fyrir enn í formlegum bréfum. Gamla fleirtöluformið í fyrstu persónu, vér, var einnig notað í hátíðlegu máli í vísun til eins eða fleiri. Stjórnmálamenn og embættismenn sögðu t.d. iðulega vér Íslendingar, en einnig vér erum … og var þá ekki alltaf ljóst hvort þeir áttu eingöngu við sjálfa sig eða hóp fólks, jafnvel þjóðina alla. Þessi notkun er nú nær horfin.

Tvítalan var ekki bara í persónufornöfnum, heldur líka í eignarfornöfnum – en þar hvarf ekki bara tvítalan, heldur ýmis fleirtöluform líka. Sérstök eignarfornöfn í nútímamáli eru fjögur; minn, þinn, sinn og vor. Merkingarlega og sögulega er vor fleirtala af minn, þótt orðið sé nú bundið við hátíðlegt mál og eignarfallið okkar af persónufornafninu við notað þess í stað – við segjum þetta er húsið okkar frekar en þetta er vort hús. Í annarri persónu er aftur á móti engin hátíðleg hliðstæða við vor til í nútímamáli, heldur eingöngu eignarfallið ykkar. Ef nota þarf hátíðlegt orð er hægt að grípa til yðar, sem er eignarfall gamla fleirtölufornafnsins þér en ekki sérstakt eignarfornafn eins og vor, og segja þetta er yðar hús.

En í fornu máli var ekki einasta til önnur persóna fleirtölu, yðvarr, hliðstæð við vor, heldur voru líka til sérstök tvítöluform, okkarr og ykkarr. Þá var sagt ég hitti vin okkarn eða ég mætti vini okkrum eða ég fór til vinar okkars ef átt var við vin einhverra tveggja, mælandans og eins annars. Í nútímamáli notum við myndina okkar, eignarfall af persónufornafninu við, í öllum tilvikum. Væri vísað til vinar einhverra tveggja var sagt ég hitti vin ykkarn eða ég mætti vini ykkrum eða ég fór til vinar ykkars; en væri vísað til vinar einhverra þriggja var sagt ég hitti vin yðvarn eða ég mætti vini yðrum eða ég fór til vinar yðvars. Í nútímamáli notum við í öllum tilvikum myndina ykkar, eignarfall af persónufornafninu þið.

Á 14. eða 15. öld fóru skil tvítölu og fleirtölu að riðlast þannig að farið var að nota fleirtölumyndirnar þótt aðeins væri átt við tvo, og tvítölumyndirnar einnig um þrjá eða fleiri. Það var samt ekki fyrr en á 17. öld sem hratt undanhald tvítölunnar hófst, og á 18. öld hvarf greinarmunur tvítölu og fleirtölu alveg. Gömlu tvítölumyndirnar héldust þó í málinu í víkkaðri merkingu eins og áður segir, en gömlu fleirtölumyndirnar fengu nýtt hlutverk.

Maður, manneskja – eða man?

Nýlega vakti Andrés Ingi Jónsson alþingismaður máls á því á Alþingi hvort ekki væri rétt að færa málfar þingsins í átt að kynhlutlausri málnotkun. Forsætisráðherra tók undir þetta og benti á að þegar væri farið að færa lagamál og opinbera málnotkun í þessa átt, t.d. í lögum um kynrænt sjálfræði og frumvarpi til laga um mannanöfn. Hins vegar varðaði þetta málstefnu Stjórnarráðsins og því væri eðlilegt að þessi umræða færi fram á vettvangi málnefndar Stjórnarráðsins.

Fyrir tveimur árum varpaði Jón Steindór Valdimarsson alþingismaður fram þeirri spurningu hvort rétt sé að taka íslenskt lagamál til endurskoðunar og fara yfir það með kynjagleraugum. Hann vísaði í skilgreiningu á nauðgun í 194. grein almennra hegningarlaga þar sem segir „Hver sem hefur sam­ræði eða önnur kyn­ferð­is­mök við mann án sam­þykkis hans ger­ist sekur um nauðgun“ og benti réttilega á að þessi orðanotkun „virð­ist ekki tala skýrt til kvenna“. Mikið er til í þessu.

Saga þessa orðalags er reyndar forvitnileg. Í almennum hegningarlögum frá 1940 var upphaflega alls staðar talað um kvenmann í þessari lagagrein – sú hugmynd að karlar gætu verið þolendur kynferðisbrota var ekki komin til. Þegar dómsmálaráðherra lagði fram frumvarp um breytingu á kynferðisbrotakafla hegningarlaganna haustið 1991 var orðið manneskja sett í staðinn – væntanlega af því að frumvarpshöfundum hefur þótt orðið maður vísa um of til karlmanna í huga málnotenda.

Í áliti meirihluta allsherjarnefndar – fulltrúa allra flokka nema Kvennalistans – um frumvarpið segir hins vegar: „Enn fremur er lagt til að orðið „manneskja“ falli brott og í stað þess komi orðið: maður. Í íslensku máli tekur orðið maður bæði til karla og kvenna og þykir ekki fara vel á því í lagatexta að nota orðið manneskja“. Þessi breytingartillaga var samþykkt og því fór maður inn í endanlegan texta laganna og er þar enn eins og áður segir.

En minnihlutinn, fulltrúi Kvennalistans, var andvígur þessari breytingu: „Minni hlutinn styður þó ekki þær breytingartillögur sem lúta að orðalagi frumvarpsins, þ.e. að í stað orðsins „manneskja“ komi: maður og aðrar breytingar sem af því leiðir. Enda þótt orðið „maður“ sé oft notað bæði um karla og konur er rík hefð fyrir því í íslensku að orðið maður eigi aðeins við um karlmenn. [...] Ástæðulaust er að fúlsa við notkun hins kvenkennda orðs „manneskja“ þegar átt er við bæði kynin“.

Þarna var sem sé orðin athyglisverð breyting: Kringum 1970 barðist Rauðsokkahreyfingin fyrir því að fá það viðurkennt að konur væru líka menn. Það var mjög skiljanleg og eðlileg barátta. 20 árum síðar fannst Kvennalistakonum hins vegar orðið maður ekki vísa til sín. Það er líka mjög skiljanlegt og eðlilegt. Hin tvöfalda merking orðsins maður veldur því að það er að margra mati oft óheppilegt í hinni almennu merkingu. Hér vantar því heppilegt kynhlutlaust orð.

Það er víðar en í áðurnefndu lagafrumvarpi sem hefur verið reynt að nota orðið manneskja í þessum tilgangi – Ríkisútvarpið hefur t.d. undanfarin ár valið manneskju ársins. En manneskja er kvenkynsorð og ekki sérlega heppilegt sem kynhlutlaust orð því að það tengist konum ekkert síður en maður tengist körlum. Ég gæti ekki sagt Hvað ertu að gera maður? við konu en ekki heldur Hvað ertu að gera manneskja? við karl. Nýlega hefur hins vegar verið stungið upp á því að nýta orðið man í þessum tilgangi.

Vissulega hefur man merkinguna 'ófrjáls maður, karl eða kona' (auk merkingarinnar 'kona' í skáldamáli) en er ákaflega lítið notað í nútímamáli, nema helst í samsetningunni mansal. Það er ekki einsdæmi að gömul en lítið notuð orð séu endurnýtt og þeim gefin ný merking – en þó oftast skyld, sbr. sími sem merkti 'band, þráður', og skjár sem merkti 'gegnsæ himna í glugga, gluggi'. Kosturinn við man er að það er hvorugkynsorð og hefur hljóðfræðileg og merkingarleg tengsl við maður og manneskja.

Ég veit ekki til að þessi notkun orðsins man hafi breiðst út að ráði, en Helga Vala Helgadóttir hefur þó notað orðið þingman um sjálfa sig. Mér finnst þetta hreint ekki galið en hins vegar er ekki einfalt að breyta svo rótgrónum þætti málsins og skal engu spáð um framtíð þessarar málnotkunar. Ef eingöngu konur taka hana upp er hættan sú að fólk fari að tengja man við konur og það verði þá ónothæft sem kynhlutlaust orð – eins og manneskja.

Áhafnarmeðlimir og skipverjar

Um daginn sá ég einu sinni sem oftar kvartað yfir orðinu áhafnarmeðlimur. Þetta orð, sem virðist ekki vera nema rúmlega 60 ára gamalt í málinu, er meðal þeirra orða sem oftast eru gerðar athugasemdir við í ýmsum málfarsþáttum – það þykir langt, stirt, útlenskulegt og ljótt. Í fljótu bragði fann ég 15 dæmi á tímarit.is þar sem amast var við orðinu, þar af sex úr þætti Gísla Jónssonar um íslenskt mál í Morgunblaðinu. Í þessum athugasemdum er yfirleitt bent á einfalda og þægilega leið til að komast hjá notkun þessa orðs, sem sé að nota orðið skipverji í staðinn.

Vissulega er skipverji miklu styttra og liprara orð, kemur fyrir í fornmáli, og er auk þess fallegra orð að flestra mati þótt það sé að sjálfsögðu smekksatriði. Í Íslenskri orðabók er áhafnarmeðlimur merkt með !? sem merkir „orð eða málatriði sem nýtur ekki fullrar viðurkenningar, telst ekki gott mál í venjulegu samhengi“ og skýrt sem bæði 'skipverji' og 'flugverji' – vegna þess að áhöfn er ekki bara á skipi. Í Málfarsbankanum segir: „Fremur en að nota orðið „áhafnarmeðlimur“ ætti að nota: skipverji, einn úr áhöfninni, flugverji.“ En er þetta rétt – merkja orðin áhafnarmeðlimur og skipverji örugglega það sama?

Einu sinni þegar ég var að skoða dæmin um orðið skipverji í Íslendingasögum áttaði ég mig á því að í fornu máli merkir orðið ekki bara 'einn af starfsmönnunum á skipi, einn úr áhöfn skips'. Í næstum öllum dæmunum er nefnilega talað um skipverja sína, skipverja hans o.s.frv. Í fornmáli hagar orðið sér því svipað og t.d. orðin liðsmaður eða stuðningsmaður – það er ekki hægt að vera bara liðsmaður, heldur verður að vera liðsmaður einhvers. En þetta hefur breyst – í nútímamáli lýtur orðið ekki þessum takmörkunum, eins og auðvelt er að ganga úr skugga um t.d. í Risamálheildinni.

Ég hélt á sínum tíma að þarna hefði ég gert merka uppgötvun, en svo kom í ljós að norski sveitapresturinn Johan Fritzner, sem samdi ítarlegustu orðabók sem hefur verið gefin út um fornmálið, var að sjálfsögðu með þetta á hreinu fyrir 150 árum – skýringin á skipverji hjá honum er „Mand som er sammen med en (e-s) paa et Fartøi“. Þarna er skipverji því fyrst og fremst tengt við foringjann, en nú við skipið – skipverji á togaranum. Ég er hins vegar nokkurn veginn viss um að þessi merkingarbreyting hefur farið fram hjá öllum venjulegum lesendum íslenskra fornbókmennta – sem skiljanlegt er.

Samhengið í íslensku máli og bókmenntum er oft vegsamað, með réttu. Vegna þess að orðaforði fornmáls og beygingarkerfið hefur varðveist að mestu leyti eigum við tiltölulega auðvelt með að lesa forna frásagnartexta, að því tilskildu að þeir séu gefnir út með nútímastafsetningu. En það leiðir til þess að við gefum okkur venjulega án umhugsunar að orð sem við finnum í fornum texta, og þekkjum úr okkar eigin máli, merki hið sama og það gerir nú – a.m.k. ef samhengið bendir ekki til annars. Það hvarflar ekki að okkur að fletta slíku orði upp í fornmálsorðabókum (auk þess sem orðabók Fritzners var ekki almenningseign þótt hún sé reyndar komin á netið).

Mér finnst þetta skemmtilegt dæmi um hvernig stöðugleiki málsins, svo ágætur sem hann annars er, getur leitt mann á villigötur. Í þessu tilviki má auðvitað segja að munurinn sé sáralítill – skiptir einhverju máli hvort einhver var skipverji konungs eða skipverji á skipi konungs, hvort viðmiðið var foringinn eða skipið? Ég veit það ekki – en aðalatriðið er svo sem ekki hvort þetta skiptir máli í þessu tilviki, heldur að svipuð dæmi, þar sem samfella málsins veldur því að við áttum okkur ekki á merkingarbreytingum, eru örugglega fjölmörg. Og í þeim sumum gæti breytingin skipt máli, jafnvel gerbreytt skilningi okkar á textanum. Höfum það í huga þegar við lesum forna texta.