Posted on Færðu inn athugasemd

Setningarugl

Í nútímamáli er stundum val milli tveggja setningagerða í aukasetningum til að orða sömu merkingu; annars vegar setninga tengdra með og sögn í persónu­hætti og hins vegar ótengdra setninga með nafnháttarsögn:

  • Mér fannst að ég væri ríkur.
  • Mér fannst ég vera ríkur.

Í nútíma­máli er seinni setningagerðin margfalt algengari en sú fyrri, og þótt einhver blæ- eða stílmunur kunni að vera á setningunum tveimur er merking þeirra sú sama. En svo er – eða var –  til þriðja gerðin: „Stundum er blandað saman að-setningu og nefnifalli með nafn­hætti, einkum á eftir sögnunum þykja, finnast, lítast, sýnast, virðast“, segir Jakob Jóh. Smári í Íslenzkri setningafræði (1920):

  • Mér fannst að ég vera ríkur.

Þetta er mjög sjaldgæft í nútímamáli og verkar yfirleitt á málnotendur sem einhvers konar óregla eða villa — og er það kannski oftast. Það var a.m.k. skoðun Björns Guð­finns­sonar sem tekur eftirfarandi setningu upp úr þýddri sögu í greininni „Tilræði við íslenzkt mál“ í Andvara 1940 og flokkar hana undir „setningarugl“ sem hann skilgreinir þó ekki nánar:

  • Mjer fanst ávalt hún vera í nánd við mig.

Ég býst við að flestir nútíma málnotendur gætu tekið undir með Birni. En í textum frá seinni hluta 19. aldar og fyrri hluta þeirrar 20. er þessi setningagerð nokkuð algeng – mun algengari en svo að hægt sé að líta fram hjá henni og afgreiða sem mistök eða villu. Hún blómstraði kringum alda­mótin 1900 en hnignaði síðan smátt og smátt, einkum um og eftir miðja 20. öld, og er nú nær eða alveg horfin ef marka má íslensk blöð og tíma­rit. ­Hins vegar lifði hún góðu lífi í Vesturheimi alla 20. öldina og jafnvel enn, sam­kvæmt bréfum Vestur-Íslendinga og viðtölum við þá.

Óvíst er hvað olli uppgangi þessarara setningagerðar seint á 19. öld, og orsakir hnignunar hennar og hvarfs eru sömuleiðis á huldu. Þó er líklegt að lág tíðni og sam­keppni við aðrar setn­inga­gerðir hafi ráðið þar miklu, en í vestur­íslensku gætu ensk áhrif hafa stuðlað að betri varðveislu hennar. Að auki er trúlegt að leiðréttingar og neikvætt við­horf til setninga­gerðar­innar hafi ráðið einhverju um hnignun hennar. At­hyglis­vert dæmi sem bendir í þá átt er að finna í þjóðsagnasafni Jóns Árnasonar. Í ann­arri útgáfu þjóðsagnanna er að finna eftirfarandi dæmi, bæði úr sömu sögunni:

  • Sofnar hann nú aftur og þótti honum að kerling koma í annað skipti.
  • Sofnar hann nú í þriðja sinn; þótti honum að hún þá koma aftur.

En í frumútgáfu þjóðsagnanna eru setn­ing­arnar dálítið öðruvísi:

  • Sofnar hann nú aptur, og þókti honum, að kerlíng kæmi í annað skipti.
  • Sofnar hann nú í þriðja sinn; þókti honum hún koma þá aptur.

Það er vitað að Jón Árnason umskrifaði mörg þjóðsagnahandrit sem hann fékk frá öðrum, en önnur útgáfa var hins vegar prentuð eftir upphaflegu handritunum eftir því sem kostur var. Það virðist ljóst að hér hefur Jón Árnason breytt textanum til að losna við blönduðu setninga­gerðina. Í fyrra skiptið setur hann tengda persónuháttarsetningu í staðinn, en í það seinna ótengda nafnháttarsetningu.

Þessi setningagerð kemur fyrir í skáld­verkum margra helstu rithöfunda þjóðarinnar kringum aldamótin 1900 og því ekkert sem bendir til þess að rithöfundar hafi forðast hana sér­stak­lega eða nokkuð hafi þótt athugavert við hana í byrjun 20. aldar. Viðhorfið hefur þó greinilega breyst þegar kom fram á 20. öldina. Þannig segir Jakob Jóh. Smári í Íslenzkri setningafræði: „Þetta ber að varast.“ Það er líka ljóst af orðum Björns Guð­finns­sonar um „setninga­rugl“ að hann fordæmdi þessa setn­inga­gerð, og alþekkt er að skoð­anir hans höfðu mikil áhrif á sínum tíma.

Posted on Færðu inn athugasemd

Hönd, hendi, hend?

Einu sinni fyrir óralöngu var ég að stjórna fundi í Menntaskólanum á Akureyri og bað þá sem styddu einhverja tillögu að rétta upp hend. Í því gekk skólameistari í salinn og sagði mér að segja rétta upp hönd. Auðvitað leiðrétti ég mig samstundis enda var ég mikill málvöndunarmaður í þá daga og vildi tala „rétt“, og þessi „mistök“ hafa setið í mér síðan. Í Málfarsbankanum segir: „Það er í samræmi við upprunalega beygingu að segja: höndin á honum stóð fram úr erminni, hann tók í höndina á mér, hún rétti mér höndina, hún hélt á töskunni í hendinni. Síður: „hendin á honum stóð fram úr erminni“, „hann tók í hendina á mér“, „hún rétti mér hendina“, „hún hélt á töskunni í höndinni“.“

En orðið hönd er viðsjálsgripur. Það víkur frá því annars ófrávíkjanlega mynstri kvenkynsorða að vera eins í þolfalli og þágufalli eintölu, því að viðurkennd beyging er höndhöndhendihandar. Það er auðvitað ekki furða þótt svo afbrigðileg beyging raskist eitthvað, enda hefur það gerst á ýmsan hátt. Reyndar eru til nokkur önnur dæmi um að sterk kvenkynsorð fái endingu í þágufalli þótt þau séu endingarlaus í þolfalli – orð eins og jörð, mold, stund og fáein fleiri – en þar er um að ræða leifar eldri beygingar sem birtast einkum í föstum orðasamböndum, og endingarlausa myndin er sú venjulega og nýtur fullkominnar viðurkenningar.

Miðað við mynstur annarra kvenkynsorða væri eðlilegast að þágufallið breyttist og yrði hönd í stað hendi – beygingin er þá höndhöndhöndhandar og fellur fullkomlega að venjulegu beygingarmynstri kvenkynsorða. Þetta gerist vissulega, en ekki síður hitt, að þágufallsmyndin yfirtaki nefnifall og þolfall þannig að beygingin verði hendihendihendihandar. Á þann hátt næst einnig samræmi við þekkt beygingarmynstur, eins og heiðiheiði heiði heiðar. Þótt bæði þessi tilbrigði í beygingu orðsins séu í góðu samræmi við málkerfið nýtur hvorugt þeirra viðurkenningar eins og fram kemur í tilvitnuninni í Málfarsbankann.

En fleiri afbrigði eru til. Í knattspyrnumáli er notuð myndin hendi – það er aldrei dæmd *hönd á leikmann. Þessi mynd er líka notuð í eignarfalli – markið var dæmt af vegna hendi, alls ekki *vegna handar. Orðið beygist þá hendi hendihendihendi. Þetta afbrigði beygingarinnar fellur líka að þekktu mynstri kvenkynsorða sem enda á -i, t.d. gleði. Og svo er myndin sem nefnd var í upphafi, þolfallsmyndin hend, án endingar – orðið getur sem sé líka beygst hendhendhendhandar. Sú beyging er auðvitað í fullu samræmi við beygingu flestra sterkra kvenkynsorða.

Enn er ekki allt upptalið. Það er vel þekkt að orð beygist öðruvísi í samsetningum en ein sér, venjulega þá þannig að afbrigðileiki í beygingunni skilar sér ekki inn í samsetta orðið. Þannig er þágufall samsetninga með hönd oft eða alltaf -hönd frekar en -hendi – venjulega er sagt með sömu rithönd frekar en rithendi, og oftast er talað um að hafa eitthvað í bakhöndinni. Einnig kemur fleirtalan handir stundum fyrir, einkum í merkingunni 'rithendur'. Fleirtalan höndur var líka nokkuð algeng áður fyrr, framan af 20. öld, og ég man eftir fólki fæddu í lok 19. aldar sem notaði hana. En hún er nú líklega alveg horfin.

Hér hafa verið nefnd fjögur afbrigði beygingar orðsins hönd/hendi/hend sem öll eiga það sameiginlegt að samræmast þekktum beygingarmynstrum kvenkynsorða. Fimmta mynstrið, það sem talið er „rétt“, er það eina sem gerir það ekki. Sambærilegar breytingar á breytingu ýmissa orða eru fullkomlega viðurkenndar, t.d. brottfall -u í þágufalli ýmissa kvenkynsorða.  „Viðurkennda“ beygingin höndhönd hendihandar er leifar af fornu beygingarmynstri og var afbrigðileg þegar í fornu máli.  Er ekki tími til kominn að taka önnur mynstur í sátt?

Posted on Færðu inn athugasemd

Að dingla bjöllu

Í kverinu Gætum tungunnar sem var gefið út 1984 segir: „Að dingla merkir EKKI að hringja. Að dingla merkir að sveiflast eða vingsa. Bendum börnunum á það!“ Elstu dæmi sem ég finn á tímarit.is um að sögnin dingla sé notuð í merkingunni 'hringja bjöllu' eru frá 1979, og í annarri útgáfu Íslenskrar orðabókar sem kom út 1983 er ein merking dingla merkt tákni fyrir sjaldgæft mál og sögð vera 'hringja (dyra-)bjöllu' og vera „barnamál“. Það er sem sé ljóst að þessi merking hefur verið orðin nokkuð útbreidd um og upp úr 1980. Í þriðju útgáfu Íslenskrar orðabókar frá 2002 er þessi merking merkt „óforml.“ og sögð „einkum barnamál“.

En það lítur samt út fyrir að þessi notkun sé upprunnin töluvert fyrr en ritaðar heimildir benda til, og ekki endilega í barnamáli. Í þætti sínum um íslenskt mál í Morgunblaðinu 1979 birti Gísli Jónsson bréf þar sem bréfritari segir að fyrir 57 árum, þ.e. 1922, hafi hann heyrt bónda í Seyðisfirði segja „Dinglaðu fyrir mig inn í Kaupfélag“, og að loknu símtalinu sagði bóndinn „Dinglaðu af, dinglaðu af““. Samkvæmt þessu er þessi notkun dingla orðin hundrað ára gömul.

Líklegast er að dingla hafi fengið þessa merkingu vegna hljóðlíkingar við sögnina hringja og ekki síður við hljóð í dyrabjöllu sem oft er táknað ding dong. Það er líka gamalt að tala um hringingu kirkjuklukkna sem dinglumdangl. Í kvæðinu „Siguróp landvætta við fráfall Maura-Jóns“ eftir Bólu-Hjálmar, sem væntanlega er ort skömmu fyrir miðja 19. öld, segir: „Náklukkan æpti: Dinglum dangl, drepinn er Maura-Jón!“, og í fyrirlestri um hnignun íslensks skáldskapar árið 1888 talaði Hannes Hafstein um „náklukkunnar dinglum-dangl yfir dauðum og útslitnum hugmyndum“.

En e.t.v. kemur annað einnig til. Í lesendabréfi í Morgunblaðinu 1996 segir: „Það er bæði rökrétt og réttur siður að dingla bjöllu, þegar þess er þörf. Málsiðurinn er kominn frá þeim tíma, sem rafmagn var ekki notað til að hringja bjöllum, heldur sló fólk á þráð, þegar það vildi að bjallan hringdi. Þráðurinn var þá tengdur við bjölluna, þannig að þegar stríkkaði á honum, slóst bjallan við kólfinn og tilganginum var náð. Þá dinglar fólk bjöllu og lítið við því að segja, en best að svara hringingunni.“ Í þessu sambandi má benda á að enn er talað um að slá á þráðinn þótt tæknin hafi breyst, og þykir ekki athugavert.

Undanfarna áratugi hafa iðulega verið gerðar athugasemdir við þessa notkun sagnarinnar dingla í ýmsum málfarsþáttum, og oft hefur hún verið kölluð barnamál. Það er reyndar óvíst eins og hér hefur komið fram, en hvað sem því líður eru börnin sem byrjuðu á þessu löngu orðin fullorðin og nota sögnina svona enn, mörg hver að minnsta kosti, og þetta sést oftar og oftar á prenti. Í Íslenskri nútímamálsorðabók er merkingin 'hringja bjöllu, einkum dyrabjöllu' gefin án athugasemda um málsnið og án þess að minnst sé á barnamál.

Enda sjálfsagt mál. Merking orða ákvarðast ekki af uppruna, af því hvað þau merktu áður fyrr, eða af því hvað einhverjir sjálfskipaðir máleigendur segja okkur að þau merki, heldur af því hvernig málsamfélag samtímans notar þau.

Posted on Færðu inn athugasemd

Ákvæðisorð með tímaákvörðunum

Á undanförnum árum hef ég iðulega rekist á setningar eins og „Gætu verið ár í að klöppin hrynji“, „Æðislegt rjómapasta á mínútum“ og ýmsar fleiri í svipuðum dúr. Þarna eru orð sem vísa til tíma, ár og mínútur, notuð án nokkurs ákvæðisorðs. Það er ekki í samræmi við mína málkennd – ég get bara notað orðin svona í eintölu, ekki fleirtölu. Þegar um er að ræða orð í fleirtölu sem tákna tíma þarf yfirleitt að fylgja þeim eitthvert ákvæðisorð – töluorð, lýsingarorð eða óákveðið fornafn – í setningum af þessu tagi. Þetta er hins vegar eðlileg setningagerð í ensku.

Þar er eðlilegt að segja I worked for hours/days, en við getum ekki sagt *Ég vann í klukkustundir eða *Ég vann í daga (eða ég get a.m.k. ekki sagt þetta). Á íslensku verðum við í staðinn að segja t.d. Ég vann í fjórar klukkustundir og Ég vann í marga daga, eða Ég vann klukkustundum/dögum saman. Dæmin hér að framan þyrftu að vera Gætu verið nokkur ár í að klöppin hrynji og Æðislegt rjómapasta á örfáum mínútum eða eitthvað slíkt. Hins vegar er oft hægt að nota eintöluna án ákvæðisorðs – Gæti verið ár í að klöppin hrynji er t.d. mjög eðlilegt.

Bæði dæmin sem ég nefndi eru fyrirsagnir og það er vel þekkt að setningagerð þeirra er oft frábrugðin samfelldum texta, einkum þannig að orðum er iðulega sleppt í fyrirsögnunum. Það væri því hægt að láta sér detta í hug að þarna væri um slíkt að ræða, en svo er ekki – það sést á því að sama orðalag er endurtekið í fréttinni sem fyrri fyrirsögnin á við: „Ár gætu liðið þar til klöpp á Fagraskógarfjalli, þar sem sprunga myndaðist á dögunum, hrynur.“ Það mætti líka hugsa sér að líkindi við enskt orðalag stöfuðu af því að frumtexti skini í gegn, en í þessari frétt er a.m.k. ekki um það að ræða – hún segir frá íslenskum aðstæðum.

Það lítur því út fyrir að þarna sé ensk setningagerð að laumast inn í íslensku. Það má vissulega segja að þetta séu ekki stórkostleg málspjöll, en það er samt æskilegt að halda sig við málhefðina. Helsta umhugsunarefnið í sambandi við dæmi af þessu tagi er þó ekki breytingin sjálf, heldur þær vísbendingar sem hún gefur um að tilfinning okkar fyrir íslenskri málhefð gæti verið að dofna.

Posted on Færðu inn athugasemd

Ensk-íslensk orðabók

Útkoma Ensk-íslenskrar orðabókar með alfræðilegu ívafi 1984 er einn merkasti viðburður íslenskrar orðabókasögu og var bylting fyrir alla sem þurftu að vinna með enskan texta, ekki síst fræðimenn og nemendur. Ensk-íslensk orðabók var fyrsta íslenska orðabókin sem stór hópur sérfræðinga á ýmsum sviðum vann að. Hún leysti af hólmi áratuga gamla orðabók sem bæði hafði mun minni og fábreyttari orðaforða og var auk þess löngu orðin úrelt. Sú bók var því gagnslítil fyrir þá sem þurftu að lesa fræðilegan texta, ekki síst í raunvísindum og tækni, en einnig texta um ýmis dægurmál.

Til að skilja texta af því tagi leitaði fólk því mikið í ensk-enskar orðabækur eins og t.d. The Advanced Learners Dictionary of Current English, sem víða var notuð í skólum. En til að skilja skýringarnar í slíkum bókum þurfti oft verulega enskukunnáttu, og þótt notendur kæmust fram úr skýringunum og áttuðu sig á merkingu ensku orðanna var björninn ekki þar með unninn, því að ensku orðabækurnar komu vitaskuld ekki að gagni við að finna íslenskar samsvaranir. Ensk-íslensk orðabók kom því eins og himnasending sem skýrði fyrir notendum flókin orð og orðasambönd á skiljanlegri íslensku.

Orðabókin sýnir íslenskar samsvaranir enskra orða ef þær eru til, en útskýrir ensku orðin að öðrum kosti með umorðun, oft heilli setningu, í stað þess að reyna alltaf að búa til ný íslensk orð sem samsvöruðu þeim ensku nákvæmlega – og hefðu ekki verið neitt skiljanlegri fyrir notendur. Það er ekki hlutverk orðabóka að búa til orð, heldur að vera geymslustaður þeirra, brunnur sem málnotendur leita í. Myndefni bókarinnar er auk þess mjög gagnlegt til að skýra merkingu ýmissa orða betur eða á fljótlegri hátt en unnt er í orðum.

Það er því óhætt að segja að Ensk-íslensk orðabók hafi staðið undir þeim væntingum sem til hennar voru gerðar, og þeim fyrirheitum um gagnsemi sem gefin voru í inngangsorðum. Allt frá því að bókin kom út hefur hún – og rafræn útgáfa hennar sem lengi hefur verið aðgengileg á Snöru – nýst ótal mörgum til skilnings á margvíslegum textum. En það er kominn hálfur fjórði áratugur frá því að bókin kom út, og aldrei í sögunni hafa orðið jafnmiklar breytingar á umhverfi okkar og samfélagi á jafnstuttum tíma – ekki síst á sviði margs kyns tækni.

Þessar breytingar koma flestar til okkar frá hinum enskumælandi heimi og þeim hefur fylgt gífurlega mikill nýr orðaforði. Ef við rekumst á orð sem við þekkjum ekki í enskum texta eigum yfirleitt ekki í vandræðum með að finna skýringar á þeim á netinu, og okkur hefur í mörgum tilvikum tekist bærilega að smíða íslenskar samsvaranir þeirra. Í öðrum tilvikum hafa ensku orðin komist í almenna notkun í íslensku – mismikið aðlöguð íslensku málkerfi.

En hvort sem heldur er lendum við iðulega í vandræðum við að þýða enskan texta á íslensku vegna þess að við höfum engan gagnabanka að leita í. Ensk-íslensk orðabók hefur ekki verið uppfærð og í hana vantar því mikinn fjölda orða sem hafa komið til á síðustu áratugum – orða sem iðulega vísa til hluta, fyrirbæra og athafna sem nú eru eðlilegur og sjálfsagður hluti af daglegum veruleika alls almennings. Það er óviðunandi að hafa engan stað að leita í um merkingu og íslenskar samsvaranir slíkra orða.

Meginforsendan fyrir því að íslenskan eigi sér framtíð er sú að áfram verði unnt að nota hana á öllum sviðum. Til að svo megi vera þurfum við að hafa íslenskan orðaforða á þessum sviðum – og vita af honum. Það er því mjög mikilvægt að setja af stað vinnu við nýja rafræna ensk-íslenskra orðabók sem verði í stöðugri endurnýjun. Þar þurfa notendur að geta gengið að upplýsingum um hvaða orð eru notuð í íslensku til að samsvara tilteknum enskum orðum – hvort sem um er að ræða íslensk nýyrði eða tökuorð. Þessi orðabók þarf að vera öllum opin og ókeypis – og það þarf að byrja á henni strax.

Posted on Færðu inn athugasemd

Íslenskan og Evrópusambandið

Frá stofnun árið 1957 hefur Evrópusambandið (áður Evrópubandalagið) lagt áherslu á að virða þjóðtungur sambandsríkjanna. Í upphafi var ákveðið að opinber tungumál sambandsins skyldu vera þau sex sem voru opinber mál stofnríkjanna, og þau áttu að hafa jafnan rétt. Þegar ný ríki hafa verið tekin inn í sambandið hafa opinber mál þeirra jafnframt orðið opinber mál sambandsins. Opinber tungumál ESB eru nú 24, fjórum sinnum fleiri en í upphafi. Þar að auki njóta nokkur tungumál sem töluð eru í ríkjum sambandsins sérstöðu sem hálfopinber mál, s.s. katalónska á Spáni og velska í Bretlandi.

Þótt stundum hafi komið fram hugmyndir um að fækka opinberum málum sambandsins hafa þær ekki fengið hljómgrunn og ekkert bendir til að slík grundvallarbreyting á málstefnu sambandsins verði í framtíðinni. Þvert á móti, eins og Gauti Kristmannsson prófessor hefur bent á: „Málstefna Evrópusambandsins hefur einnig þróast umtalsvert undanfarin ár og helgast það af öflugum pólitískum stuðningi við fjöltyngi í álfunni. Framkvæmdastjórn og Evrópuþingið hafa ítrekað ályktað um mikilvægi tungumála, tungumálakennslu og fjöltyngi þegnanna.“

Árið 2017 lét Evrópusambandið gera ítarlega skýrslu um tungumálajafnrétti á stafrænni öld (language equality in the digital age), og haustið eftir samþykkti Evrópuþingið mjög mikilvæga ályktun um sama efni. Þar er lögð áhersla á nauðsyn þess að tryggja að málnotendur allra evrópskra tungumála geti notað tungumál sín á jafnréttisgrundvelli í samskiptum innan álfunnar og bent á ýmsar aðgerðir sem þurfi að grípa til svo að því markmiði verði náð. Í framhaldi af því var á dögunum tilkynnt um háan styrk úr sjóðum Evrópusambandsins til verkefnisins „European Language Equality“ sem nær til flestra Evrópuþjóða og Íslendingar eiga aðild að.

Í krafti aðildar að Evrópska efnahagssvæðinu taka Íslendingar þátt í mennta- og vísindaáætlun­um Evrópusambandsins og hefur íslensk menning og íslensk tunga notið þess á ýmsan hátt. Þar má t.d. nefna þátttöku í verkefninu META-NET á árunum 2011-2013. Markmið þessa verk­efnis var einkum að koma upp rafrænum mállegum gagnasöfnum (textasöfnum, orða­söfn­um, talsöfnum o.fl.) til að nýta í máltækni, t.d. vélrænum þýðingum, og auðvelda þannig sam­skipti fólks með mismunandi móðurmál. Með tilstyrk verkefnisins voru byggð upp marg­vísleg íslensk gagnasöfn sem munu nýtast í máltækni og málrannsóknum á næstu árum.

Ef íslenska væri opinbert mál innan Evrópusambandsins myndi það tákna að fulltrúar landsins gætu talað íslensku á vettvangi þess og fundir yrðu túlkaðir milli íslensku og annarra mála. Í raun hefur aðildin að EES þegar styrkt tunguna með starfsemi þýðingamiðstöðvar utanríkisráðuneytisins þar sem stór hluti af lögum og reglum ESB er þýddur á íslensku. „Fullyrða má að þar fer fram einhver mesta endurnýjun og uppbygging íslenskrar tungu í dag. Án þess starfs væri íslenskan miklu fátækari en ella. Fátækari vegna þess að við þessar þýðingar verður ekki aðeins til réttarfars­legur grund­völlur og reglur til að vinna eftir heldur einnig ný orð, ný hugtök, ný svið tung­unnar.“

Hvaða skoðun sem fólk hefur á inngöngu Íslands í Evrópusambandið er ljóst að aðild að sambandinu yrði síst til þess að veikja stöðu íslenskunnar – þvert á móti má færa að því góð rök að staða tungunnar myndi styrkjast verulega við aðild. Slíkt hefur t.d. gerst með írsku, sem fékk stöðu opinbers tungumáls innan ESB árið 2007 „og er það sennilega kraftmesta vítamínsprauta sem írsk tunga hefur fengið í áratugi ef ekki aldaraðir,“ segir Gauti Kristmannsson. Ólíklegt er samt að málefni íslenskunnar muni hafa úrslitaáhrif á það hvort Ísland gengur í Evrópusambandið einhvern tíma í framtíðinni.

Posted on Færðu inn athugasemd

Misþyrming mannanafna

Nýlega tóku Staksteinar Morgunblaðsins það eftir bloggara nokkrum að uppnefna formann Viðreisnar Tobbu Kötu. Þetta vakti réttmæta hneykslun margra – það er ótrúlegt að uppnefni skuli enn tíðkast í pólitískri umræðu á Íslandi. En þetta er ekki einsdæmi – forsætisráðherra er stundum kölluð Kata Jak eða jafnvel Kata litla í opinberri umræðu, Jóhanna Sigurðardóttir var iðulega kölluð Jóka, og svo mætti lengi telja. Með þessu er auðvitað verið að tala niður til fólks – ekki síst kvenna – og gera lítið úr því.

Önnur skyld leið til tala niður til fólks er sú að kalla það öðru formi nafns síns en það notar sjálft. Hannes Gissurarson var ævinlega nefndur svo framan af, þangað til vinstri menn í stúdentapólitíkinni áttuðu sig á því að hann héti líka Hólmsteinn og fannst fyndið að nefna hann fullu nafni. En Hannes sá við þeim og fór að nota Hólmsteinsnafnið sjálfur. Í fjármálaráðherratíð Ólafs Ragnars Grímssonar höfðu sumir andstæðingar hans til siðs að kalla hann Ólaf Grímsson. Frá síðari árum er alþekkt að Morgunblaðið nefndi Jón Gnarr borgarstjóra venjulega skírnarnafni sínu, Jón Gunnar Kristinsson eða Jón G. Kristinsson. Mörg fleiri dæmi mætti nefna.

Tungumálið er öflugt valdatæki – í raun öflugasta valdatæki sem fólk í lýðræðisþjóðfélagi býr yfir. Á okkur hvílir sú ábyrgð að beita þessu valdatæki til góðs en ekki til að meiða annað fólk. Fátt er okkur hjartfólgnara en nafnið. Það hefur verið hluti af okkur frá því að við munum fyrst eftir okkur og við samsömum okkur því. Þess vegna á ríkisvaldið ekki að skipta sér af því hvaða nöfn foreldrar gefa börnum sínum eða hvaða nöfn fullorðið fólk kýs sér. Og þess vegna er það alvarleg og ómerkileg árás á fólk að breyta nafni þess, skrumskæla það eða misþyrma á einhvern hátt.

Posted on Færðu inn athugasemd

Tíðni einstakra orðflokka

Notkun kerfisorða – samtenginga, forsetninga, hjálparsagna og persónufornafna – er að mestu leyti óháð textategund og umfjöllunarefni. Tíðniröð þessara orða og hlutfall af texta er því mjög svipað milli texta og einnig á mismunandi tímum, þótt vissulega megi búast við ákveðnum breytingum á notkun einstakra orða. En öðru máli gegnir þegar litið er á inntaksorðin – einkum nafnorð og sagnir, en einnig lýsingarorð. Viðfangsefni hvers texta ákvarðar hvaða inntaksorð eru þar mest notuð, þótt sum þeirra séu vissulega svo almennrar merkingar að búast megi við fjölda þeirra í nánast hvaða texta sem er.

Þegar algengustu inntaksorðin eru skoðuð dugir ekki að líta á orðmyndir, heldur þarf að skoða uppflettiorð þar sem búið er að fella allar beygingarmyndir undir uppflettimyndina. Í töflunum hér að neðan má sjá algengustu uppflettiorð í fjórum orðflokkum – nafnorðum, lýsingarorðum og sögnum, svo og atviksorðum og forsetningum sem steypt er saman í einn flokk. Töflurnar taka til tveggja gagnasafna úr nútímamáli, Íslenskrar orðtíðnibókar 1991 og Markaðrar íslenskrar málheildar 2012, og til samanburðar eru tölur úr Íslendingasögum.


Í nafnorðunum eru orðin maður og ár í efstu sætunum í báðum nútímamálslistunum, enda eru bæði notuð í mjög fjölbreyttu samhengi. Auk þeirra eru dagur, staður, barn og tími á báðum listum. Athyglisvert er að orðið mál, sem hefur ýmsar merkingar, er í þriðja sæti í MÍM en ekki meðal 10 algengustu orða í ÍO (er þar reyndar í 12. sæti þótt það sjáist ekki hér). Það má væntanlega rekja til ólíkrar samsetningar safnanna. Listinn úr Íslendingasögum er allt annars eðlis, þótt maður sé þar líka í efsta sæti– konungur er næstalgengasta nafnorðið, og þarna eru ýmis önnur orð sem bera efni sagnanna glöggt vitni, s.s. skip, , faðir og bróðir.

Í lýsingarorðunum eru orð almennrar merkingar áberandi í efstu sætunum – mikill, góður, margur og lítill eru meðal fimm algengustu orðanna á öllum listunum. Orðin nýr og stór koma líka fyrir á báðum nútímamálslistunum. Listinn úr Íslendingasögum sker sig úr sem von er, þegar efstu sætunum sleppir – þar eru áberandi orð sem eru algeng í mannlýsingum eins og illur, sannur, gamall, stór, og svo dauður.

Í sögnunum eru hjálparsagnirnar vera og hafa í efstu sætum allra listanna. Sömu 10 sagnirnar eru á báðum nútímamálslistunum þótt röðin sér örlítið mismunandi. Af þeim koma segja, koma, fara og taka líka fyrir á listanum úr Íslendingasögum. Þar vekur helst athygli sögnin mæla í sjöunda sæti, en hún er fjarri því að vera meðal algengustu sagna í nútímamáli. Eins eru þarna hjálparsagnirnar munu og skulu en tíðni þeirra er hlutfallslega mun minni í nútímamáli – munu er í 18. sæti og skulu í því 29. í MÍM.

Í flokki forsetninga og atviksorða eru sömu 10 orðin í báðum nútímamálslistunum þótt röðin sé eilítið mismunandi. Raunar er þarna bara eitt hreint atviksorð, ekki – hitt eru allt fyrst og fremst forsetningar. Á listanum úr Íslendingasögum eru forsetningarnar til, í, á, um, við og með eins og á hinum listunum þótt röðin sé dálítið önnur – það er athyglisvert að í og til eru álíka algengar að fornu en í nútímamáli er í fjórum til fimm sinnum algengari en til. Auk forsetninganna eru þarna fjögur atviksorð sem ekki eru á nútímamálslistunum – þá, þar, og svo.

Posted on Færðu inn athugasemd

Algengustu orðmyndir málsins

Hér að neðan er tafla þar sem 25 algengustu orðmyndir íslensks nútímamáls (einkum ritmáls) eru sýndar í fjórum fremstu dálkunum, samkvæmt fjórum heimildum – tíðnikönnun Ársæls Sigurðssonar 1940, Íslenskri orðtíðnibók 1991, Markaðri íslenskri málheild 2012 og Risamálheild 2020. Athugið að margar af þessum orðmyndum tilheyra fleiri en einu uppflettiorði og ekki er greint þar á milli. Þannig getur verið nafnháttarmerki, samtenging og forsetning; á getur verið forsetning, atviksorð, sagnmynd, og mynd af tveimur mismunandi nafnorðum; við getur verið forsetning og persónufornafn; o.s.frv.


Eins og sjá má eru nokkurn veginn sömu orðin á öllum þessum listum þótt innbyrðis röð þeirra sé svolítið breytileg; en , og, í og á eru alltaf í fjórum efstu sætunum. Þegar taflan er skoðuð sést glöggt að langflest orðin eru svokölluð kerfisorð, þ.e. orð sem hafa málfræðilegt hlutverk, sýna innbyrðis vensl orða í setningum – einkum samtengingar, forsetningar og hjálparsagnir, en einnig persónufornöfn og atviksorð. Ekkert nafnorð, lýsingarorð eða sögn, nema myndir hjálparsagnanna vera og hafa, er meðal þessara orða (þótt einhverjar orðmyndir sem tilheyra þessum flokkum hafi væntanlega slæðst með dæmum um á o.fl.).

Þessi orð eru nokkurn veginn óháð innihaldi textans, og eru þess vegna yfirleitt þau sömu hvaða íslenskur texti sem er skoðaður. Ef við greinum listann eftir orðflokkum og skoðum algengustu nafnorð, sagnir (að frátöldum hjálparsögnum) og lýsingarorð verður niðurstaðan allt önnur. Nafnorð eins og maður og ár, lýsingarorð eins og margur, mikill og góður, sagnir eins og koma, fara og segja eru reyndar alltaf mjög ofarlega, en eftir því sem farið er neðar í tíðnilistanum verða niðurstöðurnar ólíkari eftir textum vegna þess að þá fer umfjöllunarefnið að hafa áhrif á orðanotkun.

Í fimmta dálknum eru sýndar 25 algengustu orðmyndirnar í talmáli (samtölum) samkvæmt Íslenskum talmálsbanka (ÍS-TAL) sem safnað var til um síðustu aldamót. Athugið að efniviðurinn er þar ekki nema tæp 200 þúsund lesmálsorð. Orðmyndirnar eru að miklu leyti þær sömu og í ritmálinu, en þó eru þarna fimm orð sem ekki eru meðal algengustu orða ritmálsins og mega teljast dæmigerð talmálsorð – , bara, sko, svona, nei og hérna. Auðvitað eru ýmis fleiri orð bundin við talmál þótt þau komi ekki fram meðal algengustu orða hér, t.d. jæja. Takið líka eftir að og, í og á sem eru meðal fjögurra algengustu orðmynda í öllum ritmálskönnununum eru í sjötta til áttunda sæti í talmálinu.

Í aftasta dálknum eru svo til samanburðar sýndar 25 algengustu orðmyndirnar í fornu máli. Þessi listi er byggður á Íslendingasögum, Sturlungu, Heimskringlu og Landnámabók. Þetta eru að mestu leyti sömu orðmyndir og í nútímamálslistunum sem sýnir stöðugleik málsins. Fornafnið hann er þó mun ofar þarna sem skýrist af því að um frásagnarbókmenntir er að ræða. Þá eru forsetningarnar í og til álíka algengar að fornu en í nútímamáli er í fjórum til fimm sinnum algengari en til. Eina orðið á fornmálslistanum sem ekki er í hópi algengra orða í nútímamáli er neitunin eigi sem hefur að mestu leyti verið skipt út fyrir ekki. Ef tíðni þessara tveggja orða í fornu máli væri lögð saman yrði neitunin á svipuðum stað í röðinni og í nútímamáli.

Posted on Færðu inn athugasemd

Íslenskar orðtíðnirannsóknir

Stundum veltir fólk því fyrir sér hver séu algengustu orðin í íslensku. Því er núna hægt að svara, en áður þarf samt að átta sig á því að orðið orð er margrætt – hefur a.m.k. þrjár merkingar sem hér skipta máli. Í fyrsta lagi er merkingin ‘uppflettiorð’ sem felur í sér grunnmynd (uppflettimynd, orðabókarmynd) orðsins og allar beygingarmyndir þess. Undir uppflettiorðið eiga falla þannig auk uppflettimyndarinnar beygingarmyndir eins og á, eigum, átti, ætti, o.s.frv. En myndin á getur auðvitað líka verið forsetningin á, nafnorðið á, og beygingarmynd af nafnorðinu ær.

Önnur merking orðsins er svo ‘orðmynd’ – tiltekinn stafa- eða hljóðastrengur, óháð málfræðilegri greiningu. Þannig er á ein og sama orðmyndin hvort sem hún tilheyrir sögninni eiga, forsetningunni á, nafnorðinu á eða nafnorðinu ær. Þriðja merkingin er svo ‘lesmálsorð’ – orð í texta. Þetta er sú merking sem á við þegar lengd texta er tilgreind – ef sagt er t.d. að ritgerð eigi að vera þúsund orð merkir það ekki að í henni eigi að koma fyrir þúsund mismunandi lesmálsorð eða orðmyndir, heldur að fjöldi lesmálsorða eigi að vera þúsund. Þá er hver orðmynd talin í hvert skipti sem hún kemur fyrir.

Tölvur hafa gert það ákaflega auðvelt að telja fjölda lesmálsorða og orðmynda. Talning uppflettiorða er hins vegar miklu flóknari vegna þess að hún krefst málfræðilegrar greiningar, til að hægt sé t.d. að fella dæmin um orðmyndina á undir rétta uppflettimynd út frá setningafræðilegri stöðu þeirra og stundum líka merkingu. Slíka greiningu þurfti til skamms tíma að gera í höndunum, en nú er kominn greiningarhugbúnaður (fyrir íslensku t.d. IceNLP og Greynir) sem greinir orðin vélrænt. Slík greining verður aldrei fullkomlega rétt, en þó yfirleitt nógu nákvæm til að hún gagnist til flestra þarfa.

Fyrstu stóru tíðnikönnun á íslenskum textum gerði Ársæll Sigurðsson skólastjóri og birti niðurstöður sínar í Menntamálum árið 1940. Tilgangur hennar var hagnýtur; „að finna leið til að gera stafsetningarkennsluna aðgengilegri og raunhæfari en áður, en þó vænlegri til betri árangurs“. Textarnir voru úr stílum barna, sendibréfum fullorðinna, lesbókum, náttúrufræði, sögu og landafræði, alls um 100 þúsund lesmálsorð. En vandaðasta tíðnikönnun á íslenskum textum var unnin hjá Orðabók Háskólans en niðurstöður hennar birtust í Íslenskri orðtíðnibók 1991. Hún byggðist á um 500 þúsund lesmálsorðum úr fimm mismunandi textategundum.

Á árunum 2004-2012 var komið upp hjá Árnastofnun miklu textasafni, Markaðri íslenskri málheild – samtals um 25 milljónir lesmálsorða. Textarnir eru margfalt fjölbreyttari en í Íslenskri orðtíðnibók, og skiptast í 23 flokka. Frá 2005 hefur svo Risamálheild verið byggð upp hjá Árnastofnun og hefur nú að geyma 1,64 milljarða lesmálsorða úr ýmsum áttum. Á henni byggist Orðtíðnivefur Árnastofnunar sem nú tekur til tæplega 1,4 milljarðs lesmálsorða. Vegna stærðar og fjölbreytni þessara safna má því vinna úr þeim ábyggilegar upplýsingar um íslenska orðtíðni. Þó er stór galli að í þeim er mjög lítið af talmáli.