Posted on Færðu inn athugasemd

Að forða slysi

Sögnin forða er iðulega notuð í merkingunni 'afstýra, komast hjá' en oft er þó amast við notkun hennar í þeirri merkingu. Þannig segir Málfarsbankinn: „Sögnin forða merkir: koma undan, bjarga. Hún forðaði barninu frá bráðum bana. Það stangast á við merkingu orðsins þegar tekið er til orða á þessa leið: „Hún forðaði slysinu.“ Eðlilegra gæti verið að orða þetta fremur t.d. svona: Hún komst hjá slysi eða Hún forðaði sér frá því að lenda í slysi.“ Svipaðar athugasemdir má finna í fjölmörgum málfarspistlum og ritum frá undanförnum áratugum, en þær byggjast á misskilningi á þessu orðalagi eins og hér verður sýnt fram á.

A.m.k. 150 ára órofin hefð er fyrir því að forða einhverju geti haft merkinguna 'afstýra, komast hjá'. Í Tímanum 1872 segir „forðað þeirri eyðilegging, sem annars hefði berlega legið fyrir höndum.“ Í Ísafold 1876 er talað um „að leita láns úr landssjóði til að forða hallæri hjer í sjávarsveitunum“. Í Norðanfara 1877 segir „farið er að skjóta saman stórfje til að forða meiri mannfelli“. Í Fróða 1882 segir „sendu þangað matvæli á 10 hestum til að forða hungursneyð í bráð“. Í Þjóðólfi 1883 segir „svo málleysu sé forðað“. Í Ísafold 1888 segir „þar varð forðað miklu óhappi“. Í Ísafold 1891 segir „Hjer hafa hollar hendur að hlúð og forðað grandi“. Svo mætti lengi telja.

En fleira kemur til. Í Þjóðólfi 1856 segir „til að forða þeim kúgun þeirri, sem hér er kvartað yfir“. Í Þjóðólfi 1863 segir „að forða Reykvíkingum öllu grandi, öllum vansa“. Í Kristilegu smáriti handa Íslendingum 1865 segir „Vak þú yfir mér í dag, og forða mér öllu illu“. Í Baldri 1868 segir „geta þó fengið björg til að forða sjer hungri.“ Í Þjóðólfi 1869 segir „til að forða þeim eyðingu“. Í Þjóðólfi 1873 segir „biðja stjórnina að forða sér húngrs-dauða“. Eldri dæmi eru líka til: „Forða mér þeirri eilífu hrellingu í helvíti“ segir í Eintali sálarinnar frá 1599. „Forða mér öllu vondu athæfi / ofneyslu / ofdrykkju“ segir í Kristilegri bænabók frá 1611 – og fleiri dæmi mætti nefna.

Í þessum dæmum tekur forða sem sé með sér tvö þágufallsandlög, forða einhverjum einhverju, eins og t.d. lofahann lofaði mér öllu fögru. Það er alkunna að lofa getur sleppt fyrra andlaginu en haldið því seinna eftir – hann lofaði öllu fögru. Ekki verður betur séð en uppruna dæma eins og forða mannfelli / hungursneyð /óhappi / grandi o.s.frv. megi greina á sama hátt – þ.e., á bak við þau liggi forða (þjóðinni) mannfelli / hungursneyð, forða (sér) óhappi / grandi, o.s.frv. Í dæmum eins og forða slysi, forða tjóni, forða óhappi er þágufallsandlagið upprunnið sem seinna andlag sagnarinnar, en andlagið í forða sér, forða lífi sínu, forða barninu o.s.frv. sem það fyrra.

Þótt lofa taki tvö þágufallsandlög er auðvelt að greina milli þeirra vegna þess að merkingarleg vensl þeirra við sögnina eru ólík. Annað þeirra – það fyrra ef þau fylgja sögninni bæði – vísar til þess sem loforðið er gefið, hitt vísar til þess sem lofað er. Svipað er með forða – þegar sögnin tekur tvö andlög vísar það fyrra til þess sem forðað er frá einhverju(m), það seinna til þess sem einhverju(m) er forðað frá. Vissulega hefur hegðun sagnarinnar breyst þannig að nú tekur hún ekki með sér þessi tvö andlög í einu. En hún tekur eftir sem áður tvenns konar andlög. Þess vegna er nákvæmlega ekkert athugavert við að forða slysi, og tímabært að það verði viðurkennt sem rétt og vönduð íslenska.

Posted on Færðu inn athugasemd

Utangarðs

Þegar ég var að alast upp á norðlensku framsóknarheimili á sjöunda og áttunda áratug síðustu aldar var vitanlega keyptur þar Dagur, blað framsóknarmanna á Akureyri – sem ég las mér til ánægju. Eitt það skemmtilegasta í því blaði voru fréttir frá fréttaritara blaðsins í Þistilfirði, Óla á Gunnarsstöðum, sem skrifaði mjög skemmtilega um hvers kyns stóra og smáa atburði þar í sveitinni. Ein eftirminnilegasta frétt Óla hafði fyrirsögnina „Negri í Þistilfirði“. Þar var innan um aðrar sveitarfréttir sagt frá því að á Gunnarsstöðum væri vetrarmaður frá Gana, svartur á hörund, „og mun það líklega heldur sjaldgæf sjón hér á landi“.

Á undanförnum árum hefur oft verið vitnað í þessa fyrirsögn, „Negri í Þistilfirði“, ýmist til að hneykslast á henni eða gera gys að henni. Hvort tveggja er ástæðulaust og algerlega í ósamræmi við anda fréttarinnar. Frásögnin þar er gamansöm og án nokkurra fordóma – negri var einfaldlega það orð sem var notað á þessum tíma, a.m.k. það orð sem eldra fólk hafði alist upp við, rétt eins og við töluðum um kynvillinga eins og ekkert væri sjálfsagðara. En tímarnir breytast og orð eins og negri, kynvillingur, fáviti og önnur slík þykja ekki við hæfi í opinberri umræðu lengur – sem betur fer. Það þýðir ekki að einhver illur hugur hafi verið bak við notkun þeirra á sínum tíma.

Á vef Þjóðskrár Íslands er orðið utangarðsskrá notað yfir skrá um fólk sem þarf að skrá vegna tímabundinnar búsetu en fer ekki inn í þjóðskrá. Orðið utangarðsskrá virðist hafa verið í notkun í meira en 30 ár en í nýjum lögum um skráningu einstaklinga sem tóku gildi 1. janúar sl. er orðið kerfiskennitöluskrá notað í staðinn – orðið utangarðsskrá virðist þó ekki hafa verið í eldri lögum. Það leikur varla vafi á því að orðið utangarðsskrá er gildishlaðið og hefur hugrenningatengsl við orð eins og utangarðsmaður, utangarðsfólk og önnur slík.

Ég legg áherslu á að ég hef enga ástæðu til að ætla að einhver illur hugur búi að baki þessari orðanotkun. En hún er barn síns tíma, rétt eins og orðin sem ég nefndi áður. Þess vegna er óviðunandi að þetta orð sé notað á vef opinberrar stofnunar, sérstaklega þegar annað orð er notað um fyrirbærið í gildandi lögum. Þetta minnir okkur á hvað tungumálið er máttugt tæki – til góðs og ills. Með orðanotkun okkar og orðavali getum við, vitandi eða óafvitandi, mótað bæði okkar eigin hugmyndir og skoðanir annarra. Þess vegna þurfum við að gæta okkar vel þegar rætt er um viðkvæm álita- og deilumál.

Posted on Færðu inn athugasemd

Uns

Samtengingin uns (áður rituð unz) er nokkuð algeng í nútímamáli en þó líklega bundin við fremur formlegt ritmál – kemur tæpast fyrir í talmáli. Þetta er tíðartenging sem merkir 'þangað til' og er komin af und es samkvæmt Íslenskri orðsifjabókes var fornt tilvísunarorð og und merkti 'til þess, fram að því' eða eitthvað í þá átt.

Í Íslendingasögum kemur uns samtals 36 sinnum fyrir. Það þarf ekki að skoða dæmin um orðið vandlega til að átta sig á sérkennilegum samnefnara þeirra flestra: Öll nema fjögur tengja tíðarsetningu með sögninni koma. Þetta getur ekki verið tilviljun. Önnur tíðartenging fornmálsins, þar til, tengist ekki ákveðinni sögn á neinn sambærilegan hátt.

Á þessu er hægt að hugsa sér tvær skýringar. Önnur er sú að uns hafi ekki merkt bara 'þangað til' eins og hún gerir í nútímamáli, heldur hafi falist í henni einhver merkingarþáttur til viðbótar sem tengi hana við koma. Það er ekki augljóst hver sá merkingarþáttur gæti verið – og hann er a.m.k. löngu horfinn því að uns hefur engin sérstök tengsl við koma í nútímamáli.

Hin skýringin er sú að þetta sé ritvenja, einhvers konar formúla – höfundar eða skrásetjarar sagnanna hafi lært að venja væri að uns tengdist koma, og hafi fylgt þeirri venju, án þess að hún ætti sér neina merkingarlega skýringu. Ég á ekkert svar við því hvor þessara skýringa sé rétt – og svo gæti vitanlega verið einhver þriðja skýring sem mér hefur ekki dottið í hug.

Posted on Færðu inn athugasemd

Nýja þolmyndin

Einhver mest áberandi nýjung í íslenskri setningagerð undanfarna áratugi er hin svokallaða „nýja þolmynd“ – setningar eins og það var barið mig í stað ég var barin(n) og það var hrint mér í stað mér var hrint. Fyrir utan „þágufallssýkina“ svokölluðu er nýja þolmyndin líklega sú málbreyting sem kallar fram hörðust viðbrögð hjá fólki. Það er kannski engin furða – hún er gerólík hefðbundnu þolmyndinni og fer því ekki fram hjá okkur. Mörgum finnst hún ljót, og ekki ætla ég að blanda mér í þá umræðu. Í staðinn skulum við reyna að átta okkur á eðli þessa fyrirbæris.

Í hefðbundinni þolmynd er germyndarandlag (þolandi) gert að frumlagi – (einhverbarði mig > ég var barin(n). Gerandinn (einhver) víkur úr frumlagssæti og er annaðhvort alveg sleppt úr setningunni eða hafður í forsetningarlið – ég var barin(naf einhverjum. Ef germyndarandlagið er í þolfalli (mig) verður það að nefnifallsfrumlagi í þolmynd (ég), en ef það er í þágufalli eða eignarfalli heldur það falli sínu í þolmynd – (einhverhrinti mér > mér var hrint. Það sem einkennir „nýju þolmyndina“ er að andlagið heldur germyndarstöðu sinni á eftir aðalsögninni í stað þess að færast í frumlagssæti eins og það gerir í hefðbundinni þolmynd, og heldur jafnframt aukafalli sínu, hvort sem það er þolfall (það var barið mig) eða þágufall (það var hrint mér).

Þessi nýja þolmynd var fyrst nefnd á prenti svo að ég viti í fyrsta þætti Gísla Jónssonar um íslenskt mál í Morgunblaðinu 1979. Gísli tilfærir setninguna Það var barið mig í bakið og kallar hana „fátæklegt barnamál“. Í kverinu Gætum tungunnar sem Helgi Hálfdanarson samdi 1984 tilfærir hann setninguna Það var sagt honum að fara og segir að rétt væri Honum var sagt að fara. En þessi setningagerð á sér þó talsvert eldri rætur. Elsta dæmi sem ég hef séð er í bréfi sem níu ára barn skrifaði árið 1939. Þar stendur „þangað til verður jarðað afa“ – þ.e., þangað til afi verður jarðaður. Þótt setningin hefjist ekki á það eins og algengast er um setningar af þessu tagi er þetta greinilega sama setningagerð. Það sést á því að andlagið, afa, stendur í aukafalli á eftir sögninni.

Fyrstu rannsóknina á þessari setningagerð gerðu Sigríður Sigurjónsdóttir og Joan Maling um aldamótin, og birtu í tímaritinu Íslensku máli 2001. Þær rannsökuðu einkum 15-16 ára unglinga á ýmsum stöðum á landinu, en einnig nokkra fullorðna til samanburðar. Niðurstöðurnar voru þær að u.þ.b. 60% unglinganna sögðust geta sagt setningar á við þær sem hér hafa verið nefndar, en aðeins örfá prósent fullorðna fólksins. Ýmsar rannsóknir hafa síðan verið gerðar á þessari setningagerð og staðfesta allar að hún er að breiðast út – þau sem tileinka sér hana á máltökuskeiði halda henni yfirleitt á fullorðinsárum þótt frá því séu undantekningar, og þótt dragi úr tíðni hennar hjá sumum.

Í rannsóknarverkefninu „Greining á málfræðilegum afleiðingum stafræns málsambýlis“ voru þátttakendur á öllum aldri spurðir um álit á setningunni Síðan var borðað kökuna (í framhaldi af Afmælisbarnið blés á kertin). Í aldurshópunum innan við þrítugt fannst yfir 40% málhafa setningin „mjög eðlileg“ eða „frekar eðlileg“. Í aldurshópunum yfir fertugt fannst aftur á móti um eða yfir 95% málhafa setningin „mjög óeðlileg“ eða „frekar óeðlileg“. Aldurshópurinn milli þrítugs og fertugs er svo þarna mitt á milli. Það er fólk fætt á árunum 1977-1986, þannig að árgangurinn sem Sigríður og Joan rannsökuðu (f. 1984) er meðal þeirra yngstu í þeim hópi.

En ein áhugaverð spurning í þessu sambandi er hvort nýja þolmyndin sé líkleg til að útrýma þeirri hefðbundnu. Því er ekki hægt að svara með vissu á þessari stundu, en þetta fer væntanlega að verulegu leyti eftir því hvort báðar setningagerðirnar hafa sömu merkingu og sama hlutverk. Ýmislegt bendir þó til að merkingar- og notkunarsvið nýju þolmyndarinnar falli ekki alveg saman við þá hefðbundnu, og sé það rétt er vel hægt að hugsa sér að báðar lifi áfram hlið við hlið, hvor með sitt hlutverk. Fólk eins og ég, sem ekki hefur nýju þolmyndina í máli sínu, á erfitt með að meta þetta, en ítarleg umræða og greining á þessu er of fræðileg fyrir þennan vettvang.

Posted on Færðu inn athugasemd

Ég gæti hafa gert þetta

Í íslensku eru iðulega notuð sambönd með tveimur eða jafnvel þremur hjálparsögnum – ég mun hafa selt húsið, húsið hefur verið selt, húsið mun hafa verið selt, o.s.frv. Í slíkum tilvikum er röð hjálparsagnanna yfirleitt föst og óbreytanleg. Það er ekki hægt að segja *ég hef munu selja húsið, *húsið hefur munu vera selt, *húsið er haft munu selja, *húsið er munu hafa selt eða neitt slíkt – það er alveg fráleitt. Frá þessu er þó ein undantekning – samband sagnanna geta og hafa. Við getum sagt bæði ég hefði getað gert þetta og ég gæti hafa gert þetta – hvort tveggja er algengt og full-komlega eðlilegt í nútímamáli, bæði formlegu og óformlegu. En síðarnefnda sambandið er áhugavert af ýmsum ástæðum.

Þegar geta er hjálparsögn tekur hún venjulega með sér lýsingarhátt þátíðar af aðalsögninni – ég get gert þetta, við getum komið, þau gátu lesið bókina, o.s.frv. Ef aðalsögnin í slíkum dæmum er hafa stendur hún líka í lýsingarhætti þátíðar eins og aðrar sagnir – ég get haft þig með, við getum haft þetta svona. En ef hafa er ekki aðalsögn heldur hjálparsögn (tekur með sér enn aðra sögn) stendur hún í nafnhætti á eftir geta, ekki í lýsingarhætti þátíðar – ég get hafa gert þetta, ekki *ég get haft gert þetta. Reyndar má finna dæmi af síðarnefndu tegundinni á netinu, s.s. „Ég skil að viðkomandi fjarvist gæti haft dregið úr afköstum á vinnustað þínum“, en þau eru sárafá. Fleiri dæmi eru hins vegar um myndina hafað, s.s. „Þessar upphæðir gætu hafað lækkað eitthvað síðan“. Þar virðist vera um einhver konar lýsingarhátt þátíðar að ræða, þótt það sé ekki hinn venjulegi lýsingarháttur sagnarinnar.

Röðin geta + hafa kemur ekki fyrir í fornu máli (reyndar er hafa + geta sárasjaldgæf þar líka). Elstu öruggu dæmin um hana eru frá því um miðja 19. öld, og sambandið er mjög sjaldgæft fram um 1880. Eftir það fjölgar dæmum smátt og smátt, og tíðnin eykst svo verulega kringum 1940. Það ár skrifaði Björn Guðfinnsson grein í Andvara undir titlinum „Tilræði við íslenzkt mál“. Þar fjallar hann um margs kyns villur og ambögur í þýddri smásögu sem þá hafði nýlega birst í tímariti, og skiptir þessum hnökrum í ýmsa flokka. Einn þeirra heitir „dönskuhroði“ og þar er tilfærð setningin „Hún getur hafa (kan have) borið grímu“. Engin frekari skýring fylgir á fordæmingu þessarar setningar en kan have í sviga sýnir að Björn hefur talið þessa setningagerð komna úr dönsku – og þar af leiðandi vonda íslensku.

Í ábendingunum Gætum tungunnar sem birtust í dagblöðum upp úr 1980 stendur: „Sagt var: Hann getur hafa komið í gær. Rétt væri: Hann hefur getað komið í gær, Eða: Hann kann að hafa komið í gær.“ Hér er þetta sett fram eins og getur hafa merki það sama og hefur getað, en það er ekki rétt. Merkingin í hann hefur getað mætt í skólann er ekki sú sama og í hann getur hafa mætt í skólann. Í fyrri setningunni felst að hann hafi raunverulega mætt, en sú seinni merkir 'það er hugsanlegt að hann hafi mætt'. Eðlilegt framhald af þeirri fyrri væri t.d. . . . þrátt fyrir sóttvarnaráðstafanir, en af þeirri seinni t.d. . . . án þess að ég viti af því. Eðlilegt framhald af ég hef getað lyft þessum steini væri t.d. alltaf þegar ég hef reynt, en eðlilegt framhald af ég get hafa lyft þessum steini væri fremur en ég man það ekki.

Þegar gert er upp á milli tilbrigða í máli, t.d. mig/mér langar, ég vil/vill, hurðir/hurðar o.s.frv., hafa bæði (öll) afbrigðin venjulega sömu merkingu. Möguleikar tungumálsins til tjáningar eru þeir sömu hvort sem við segjum mig langar eða mér langar. En í þessu tilviki gegnir öðru máli, og röðin geta + hafa hefur „fyrir löngu öðlast fastan sess í íslensku enda er skýr merkingarmunur á orðasamböndum hefði getað og gæti hafa“ segir Jón G. Friðjónsson. Þegar geta stendur á eftir hafa merkir hún 'vera fær um' en ef hún stendur á undan felur hún oftast í sér möguleika sem ekki er ljóst hvort hefur raungerst. Þarna er vissulega oft stutt á milli, og það virðist vera eitthvað misjafnt hvaða tilfinningu málnotendur hafa fyrir þessu. En það auðgar málið að hafa þessi tvö sambönd en ekki bara eitt.

Posted on Færðu inn athugasemd

Misnotkun tungumálsins

Yfirlýsing Hraðfrystihússins-Gunnvarar vegna hópsmits um borð í Júlíusi Geirmundssyni ÍS 270“ er sorglegt dæmi um misnotkun tungumálsins sem mætti nota sem kennsluefni í orðræðugreiningu. Skoðum hana lið fyrir lið.

  • rétt hefði verið að tilkynna grun um kórónuveiru um borð í skipinu til Landhelgisgæslunnar“ – ef ég skil málið rétt hefði það ekki bara verið rétt, heldur skylt samkvæmt lögum. Það verður ekki ráðið af þessu orðalagi.
  • láta þeim yfirvöldum eftir að meta hvort rétt væri að sigla skipinu til hafnar.“ Hér er látið líta svo út sem um eitthvert matsatriði sé að ræða, en í reglum segir „LHG [...] leiðbeinir um sóttvarnahöfn sem skipi er vísað til í samráði við sóttvarnalækni“.
  • Slík framkvæmd hefði enda verið í samræmi við þær leiðbeiningar, sem viðhafa ber í þessum aðstæðum“ er orðalag sem er notað til að komast hjá að segja að lög og reglur voru beinlínis brotin.
  • Því miður fórst það fyrir“ að tilkynna um smit um borð í skipinu. Á íslensku merkir farast fyrir að eitthvað hafi gleymst eða lent í útideyfu. Það merkir ekki að það hafi beinlínis verið hunsað eða því hafnað eins og þarna var.
  • ábyrgð á þeim mistökum“ – hér er enn notað rangt orð til að breiða yfir alvarleik málsins. Merking orðsins mistök er 'yfirsjón, handvömm, vangá'. En þetta voru engin mistök, heldur einbeittur brotavilji.
  • mun fyrirtækið að sjálfsögðu axla.“ Þetta er klisja. Að axla ábyrgð merkir 'taka á sig ábyrgð' – ábyrgð sem manni er ekki endilega skylt að bera, og taka afleiðingum gerða sinna. Ekkert bendir til þess að það standi til.
  • Fyrirtækið biður hlutaðeigandi jafnframt einlæglega afsökunar á þessum mistökum.“ Gott, en það dregur töluvert úr einlægni afsökunarbeiðninnar að það skuli endurtekið að um mistök hafi verið að ræða.
  • Það var aldrei ætlun útgerðar eða skipstjóra að stefna heilsu og lífi áhafnar skipsins í hættu“ –  þakka skyldi. Það er örugglega aldrei ætlun útgerðar eða skipstjóra að stofna lífi sjómanna í hættu, en stórkostlegt gáleysi og brot á reglum og lögum geta jafngilt því.
  • fyrirtækinu þykir þungbært að sitja undir ásökunum um að ekki sé hugað nógu vel að heilsu og öryggi starfsmanna.“ Hér er málinu drepið á dreif – þetta er ekki ásökun, heldur lýsing á staðreyndum. Þetta er sagt þungbært til að reyna að skapa samúð með fyrirtækinu.
  • Ítrekað skal að fyrirtækinu þykir miður að ekki hafi verið brugðist við með réttum og viðeigandi hætti.“ Orðalagið þykir miður er auðvitað ekki í neinu samræmi við alvarleik málsins. Og með réttum og viðeigandi hætti er sakleysislegt orðalag um það sem í raun virðist vera lagaskylda.
  • Nú er verkefnið að styðja við þá áhafnarmeðlimi sem glíma við veikindi og byggja upp á ný það traust sem hefur glatast á milli áhafnar og fyrirtækisins vegna atviksins.“ Hér gefa menn sér að þarna hafi áður ríkt traust. Og atvik er ansi bragðdauf lýsing á málinu.
  • Alls staðar er talað um fyrirtækið til að firra einstaklinga ábyrgð – „Fyrirtækið telur ljóst“, „ábyrgð … mun fyrirtækið að sjálfsögðu axla“, „Fyrirtækið biður … afsökunar“, „fyrirtækinu þykir þungbært“, „fyrirtækinu þykir miður“, „traust … glatast á milli áhafnar og fyrirtækisins“.

Í þessu máli hefur augljóslega verið brotið gróflega á rétti sjómanna og það má ekki líðast. En það má heldur ekki líðast að misnota tungumálið á þann hátt sem gert er í þessari yfirlýsingu.

Posted on Færðu inn athugasemd

Máltækni

Máltækni er tiltölulega nýlegt orð í íslensku – þýðing á því sem á ensku nefnist language technology. Einnig hefur orðið tungutækni verið notað um sama hugtak. Í stuttu máli má segja að með máltækni sé átt við hvers kyns samvinnu tungumáls og tölvutækni sem hefur einhvern hagnýtan tilgang; beinist að því að hanna eða útbúa einhvern hugbúnað eða tæki sem nýtist mönnum í starfi eða leik. Þessi samvinna hefur tvær hliðar og felst annars vegar í notkun tölvutækninnar í þágu tungumálsins; hins vegar í notkun tungumálsins í þágu tölvutækninnar.

Það er hægt að nýta tölvu- og upplýsingatækni á ýmsan hátt til þess að auðvelda mönnum að nota tungumálið. Þar má nefna ýmiss konar leiðréttingarforrit fyrir stafsetningu og málfar. Slíkur búnaður fylgir til dæmis algengum forritapökkum eins og Microsoft Office og LibreOffice á ýmsum tungumálum. Einnig er hægt að sækja viðbætur af þessu tagi fyrir ýmsa vafra. Íslensk stafsetningarleiðréttingarforrit eru til, svo sem Púki og Skrambi, en ekkert málfræðileiðréttingarforrit er til fyrir íslensku.

Hér má einnig telja ýmiss konar hjálpartæki handa fólki sem á erfitt með mál eða lestur sökum einhvers konar fötlunar. Talgervill, sem er búnaður sem les upp ritaðan texta, var fyrst gerður fyrir íslensku um 1990 en nýjasti talgervillinn kom á markaðinn 2012. Hann var gerður á vegum Blindrafélagsins og býr yfir tveimur röddum, karlmannsrödd sem nefnist Karl og kvenmannsrödd sem nefnist Dóra.

Talgreinir breytir töluðu máli í ritaðan texta. Slíkur búnaður fyrir íslensku var gerður árið 2012 í samvinnu Google við íslenska aðila og er nú í símum með Android-stýrikerfi og í Google Chrome-vafranum. Hægt er að nota talgreininn við leit á netinu, til að skrifa smáskilaboð og tölvupóst, minnisatriði og fleira. Einnig er hægt að prófa talgreini á vef Háskólans í Reykjavík. Slíkur búnaður getur vitaskuld nýst öllum málnotendum en ekki síst fólki sem eru hreyfihamlað og á erfitt með að nota lyklaborð til að rita texta.

Eitt veigamesta svið máltækni eru vélrænar þýðingar, þar sem hugbúnaður er notaður til að þýða texta af einu máli á annað. Google Translate er þekktasti búnaðurinn á þessu sviði og getur þýtt milli fjölda tungumála, þar á meðal milli íslensku og annarra mála. Gæði þýðinganna eru misjöfn en fara vaxandi eftir því sem búnaðurinn er lengur í notkun og hefur fleiri gögn til að læra af. Ekkert gott þýðingarforrit hefur enn verið þróað fyrir íslensku.

En tungumálið er ekki bara þiggjandi í samvinnu við tölvutæknina. Það er líka notað á margvíslegan hátt til að gera tæknina aðgengilegri og auðvelda mönnum að nýta sér hana. Þar má nefna ýmiss konar þjónustuver þar sem tölva hlustar á erindi notandans og greinir merkingu þess. Sú greining er síðan send til gagnabanka, þar sem er að finna svör við margvíslegum fyrirspurnum, og viðeigandi svar sótt í bankann. Því svari er svo breytt í eðlilega setningu og hún send til tölvubúnaðar sem les hana fyrir notandann. Þetta ferli er alsjálfvirkt og byggist á margvíslegri og flókinni greiningu á tali notandans; hljóðgreiningu, orðgreiningu, setningagreiningu, merkingargreiningu og fleira.

Einnig má nefna notkun málsins við stjórn tölva og ýmiss konar tölvustýrðra tækja. Það fer mjög í vöxt að slíkum tækjum sé stjórnað með venjulegu máli, annað hvort rituðu eða töluðu. Skipanir eru þá ýmist slegnar inn á lyklaborð eða talaðar í hljóðnema, í stað þess að ýta á takka eða velja kost í valmynd. Þetta mun á næstunni taka til sífellt fjölbreyttari tækja, svo sem ýmiss konar framleiðslutækja, heimilistækja og bíla. En slík tæki skilja yfirleitt ekki íslensku – enn sem komið er.

Til að tölvur og tæki skilji íslensku slíkt þarf að byggja upp þekkingargrunna sem hafa að geyma margvíslegar og nákvæmar upplýsingar um tungumálið. Til að hægt sé að þróa forrit til málfarsleiðréttingar þarf til dæmis að liggja fyrir nákvæm og ítarleg greining á íslenskri setningagerð – mun nákvæmari og ítarlegri en finna má í handbókum og kennslubókum. Það er ekki hægt að útbúa leiðréttingarforrit nema skrá nákvæmlega hvaða setningagerðir eru leyfilegar í málinu og hverjar ekki og jafnframt semja lýsingu á því hvernig eigi að lagfæra það sem betur má fara.

Sprenging í hagnýtingu gervigreindar og vélræns náms á síðustu árum hefur leitt til þess að mikilvægasta forsenda þess að þróa máltæknibúnað er nú gríðarstór málleg gagnasöfn – orðasöfn, textasöfn, hljóðsöfn og fleira. Þær aðferðir sem nú eru mest notaðar byggjast á því að tölvur eru látnar lesa gríðarlega mikið af gögnum og læra af þeim – finna í þeim mynstur sem þær geta síðan notað til að byggja upp þekkingargrunna um tungumálið. Þessa þekkingargrunna er svo aftur hægt að nýta í gerð margs kyns hugbúnaðar til málvinnslu, svo sem leiðréttingabúnaðar, þýðingaforrita, talgervla, talgreina og svo framvegis.

Uppbyggingarstarf í máltækni er dýrt. Það kostar jafnmikið að koma upp máltækni fyrir íslensku og fyrir tungumál milljónaþjóða. Margs konar máltæknibúnaður er vissulega góð markaðsvara og skilar miklum tekjum sem standa undir háum þróunarkostnaði – ef markaðurinn er nógu stór. En því er ekki að heilsa á Íslandi. Vegna smæðar markaðarins er ljóst að það verður seint arðvænlegt að þróa dýran máltæknibúnað fyrir íslensku. Vilji Íslendingar að íslenska sé nothæf innan tölvu- og upplýsingatækninnar þarf opinber stuðningur við þróunarstarf að koma til.

Þegar mikilvægi máltækni fyrir íslensku er metið verður að líta til þess að upplýsingatæknin er orðin mikilvægur þáttur í daglegu lífi alls almennings í landinu. Ef ekki verður hægt að nota íslensku á öllum sviðum upplýsingatækninnar kemur upp splunkuný staða, sem ekki á sér hliðstæðu fyrr í málsögunni. Þá verður orðið til mikilvægt svið í daglegu lífi venjulegs fólks, þar sem móðurmálið er gagnslítið eða ónothæft. Hvaða áhrif hefði slíkt umdæmistap á málnotendur og málsamfélagið? Hvað gæti gerst ef móðurmálið yrði ekki lengur nothæft í nýrri tækni og öðru sem er nýtt og spennandi; á sviðum þar sem nýsköpun af ýmsu tagi á sér stað; og á sviðum þar sem ný atvinnutækifæri bjóðast?

En íslensk máltækni hefur ekki eingöngu gildi fyrir tungumálið og varðveislu þess. Málnotendurnir og hagsmunir þeirra skipta ekki síður máli. Það er mannréttindamál að geta notað móðurmálið á öllum sviðum daglegs lífs, bæði í starfi og leik – líka innan upplýsingatækninnar. Til að svo megi verða þarf allur algengur hugbúnaður að vera á íslensku, leiðréttingarhugbúnaður fyrir íslenskan texta þarf að vera til, það þarf að vera hægt að tala við ýmis tölvustýrð tæki á íslensku, til þurfa að vera þýðingarforrit sem geta þýtt milli íslensku og annarra mála, og málnotendur þurfa að eiga aðgang að hugbúnaði sem getur unnið flóknar upplýsingar úr texta- og gagnasöfnum og leitað í þeim á margvíslegan hátt. Enn vantar mikið upp á að þessi markmið náist.

Posted on Færðu inn athugasemd

Tíðir og horf

Í Facebook-hópnum Málspjall var nýlega nokkur umræða um tíðir sagna – hversu margar og hverjar þær væru. Í eldri málfræðibókum, t.d. Íslenskri málfræði Björns Guðfinnssonar sem var aðalkennslubók í málfræði í grunnskólum um áratuga skeið, var gert ráð fyrir átta tíðum. Þar af eru bara tvær ósamsettar, þ.e. koma eingöngu fram í sögninni sem um er að ræða, en hinar sex samsettar, þ.e. myndaðar með hjálparsögn (hafa og munu) og nafnhætti eða lýsingarhætti þátíðar af aðalsögninni. Í nýrri málfræðibókum eru hins vegar bara nútíð og þátíð flokkaðar sem tíðir, en hin samböndin eru flest kölluð horf, enda eru þau annars eðlis en tíðirnar tvær. Einar Freyr Sigurðsson orðaði muninn á þessu tvennu mjög vel í athugasemd hér um daginn og ég tek skýringu hans hér upp:

„[M]unurinn á tíð og horfi felst svolítið í því hversu marga viðmiðunarpunkta við höfum í tímatáknun. Tíð hefur tvo tímapunkta, taltíma (T) og atburðartíma (A) (tíma þess sem eitthvað gerist). Í þátíð, t.d. Ég borðaði í gær, er þetta A – T því atburðartíminn er á undan taltímanum (þess tíma sem setningin Ég borðaði í gær er sögð). Í nútíð falla A og T saman en í framtíð fer T á undan A. Í horfi bætist svo þriðji tíminn við, viðmunartími (V). Þú varst búin að borða (þegar ég kom heim) er dæmi um (lokið) horf: Þarna er atburðartími sem fer á undan taltíma og til viðbótar höfum við viðmiðunartíma (þegar ég kom heim) sem er í þessu tilfelli á milli atburðartíma og taltíma, þ.e. A – V – T.“

Í málinu eru til ýmis sagnasambönd sem gegna svipuðum hlutverkum og hinar samsettu „tíðir“, án þess að þau séu eða hafi verið flokkuð sem tíðir. Þannig er t.d. með sambandið vera búinn að, sem er ekki til í fornu máli í þeirri merkingu sem það hefur nú. Það kemur vissulega fyrir í fornum textum, en þá í merkingunni 'reiðubúinn'. Í Hallfreðar sögu vandræðaskálds segir: „Þú hefir og enn fyrr tekið mig með valdi og varst þá búinn að veita mér bana.“

Hér er nokkuð augljóst að vera búinn að er ekki notað í nútímamerkingunni – þá væri sögumaður ekki til frásagnar. En í „Ævintír af Eggérti Glóa“, sem Jónas Hallgrímsson þýddi og birtist í fyrsta árgangi Fjölnis, segir: „Þegar hann hafði riðið nokkra daga, varð hann ekki var við fyrr enn hann var búinn að villast inn í klettaklúngur, og sá þaðan hvurgi til vegar.“ Hér er jafnljóst að merkingin 'reiðubúinn' á ekki við, heldur nútímamerkingin. Sambandið virðist hafa fengið nútímamerkinguna á 17. öld.

Annað sagnasamband sem ekki er til í fornu máli er vera að gera eitthvaðég er að lesa bókina. Í fornum textum má hins vegar finna dæmi um vera að að gera eitthvað, þar sem er tvítekið. Þannig segir í Njálu: „Bar það saman og þá var Gunnar að að segja söguna en þeir Kári hlýddu til á meðan úti.“ Í slíkum tilvikum er fyrra -ið forsetning sem tekur með sér nafnháttarliðinn að segja söguna. Þetta er hliðstætt því að stæði þá var Gunnar að störfum, þar sem tekur með sér nafnorð í stað nafnháttarliðar í fyrra dæminu.

En sambönd þar sem sama orðið kemur fyrir tvisvar í röð, þótt það sé í mismunandi hlutverkum (það fyrra hér forsetning, það síðara nafnháttarmerki) eru óstöðug og í þessu tilviki féllu -in tvö saman og úr varð nýtt sagnasamband með fasta merkingu – vera að gera eitthvað. Þetta samband virðist hafa orðið til á 15. öld – a.m.k. kemur það fyrir í þýðingu Odds Gottskálkssonar á Nýja testamentinu frá 1540: „Og sem hann kom í musterið, gengu til hans (sem hann var að kenna) prestahöfðingjar og öldungar lýðsins.“

Posted on Færðu inn athugasemd

Uppreist æru

Í íslensku lagamáli er talað um „uppreist æru“. Þetta á einkum við almenn hegningarlög (nr. 19/1940), svo og lög um kosningar til Alþingis og sveitarstjórna, en viðkomandi ákvæði þeirra laga byggjast á hegningarlögunum. Orðalagið er þó mun eldra í lagamáli, og kemur að minnsta kosti fyrir í „Tilskipun fyrir Ísland um uppreist á æru“ sem konungur gaf út árið 1870. Mörgum kemur þetta orðalag spánskt fyrir sjónir og vilja heldur tala um uppreisn æru. Hvers vegna er myndin uppreist notuð í lagamáli; og er jafngilt að tala um uppreist æru og uppreisn æru?

Bæði uppreist og uppreisn eru kvenkynsnafnorð, mynduð af reisa upp. Bæði orðin koma fyrir í fornu máli – uppreist þó mun algengara – og merkja ‘bæting stöðu eða aðstæðna’ („Forbedring af Stilling eller Vilkaar“) samkvæmt orðabók Fritzners (Ordbog over Det gamle norske Sprog). Það er merkingin sem orðin hafa í uppreist/uppreisn æru. En auk þess merkir uppreist í fornu máli ‘samblástur til að sýna fjandskap’ („Reisning, Opstand til Udøvelse af Fiendtligheder“) samkvæmt Fritzner, en uppreisn kemur ekki fyrir í þeirri merkingu að fornu – sem er þó algengasta merking orðsins í nútímamáli.

Þegar komið er fram á 17. öld má þó finna dæmi um bæði orðin í báðum merkingum. Á seinni hluta 19. aldar virðast orðin vera alger samheiti, og eru álíka algeng ef marka má tímarit.is. Upp úr aldamótunum 1900 fer að draga í sundur með orðunum – uppreisn verður sífellt algengari mynd en uppreist sjaldgæfari. Dæmum um uppreist fækkar sérstaklega eftir 1960, og á tímabilinu frá 1980 til dagsins í dag eru 100 sinnum fleiri dæmi um uppreisn en um uppreist á tímarit.is. Lengst af hafa bæði orðin báðar merkingarnar, en síðasta aldarfjórðunginn eða svo kemur uppreist þó nær eingöngu fyrir í sambandinu uppreist æru.

Vegna þess að myndin uppreist er nær horfin úr málinu er eðlilegt að fólk hvái þegar það heyrir hana og haldi jafnvel að um villu sé að ræða. Sumir hafa líka gert því skóna að á orðunum uppreist og uppreisn sé merkingarmunur – það fyrrnefnda merki ‘endurreisn’ en það síðarnefnda ‘upprisa gegn valdi’. Slík aðgreining styðst þó ekki við neina hefð, eins og áður segir, og þótt visulega megi segja að uppreist hafi glatað merkingunni ‘upprisa gegn valdi’ á allra síðustu árum lifa báðar merkingar góðu lífi í uppreisn.

Þegar hugtakið „uppreist æru“ kom inn í lagamálið voru báðar myndirnar uppreist og uppreisn algengar í málinu og höfðu sömu merkingu. Ekki er hægt að fullyrða neitt um það hvers vegna myndin uppreist var notuð í þessu sambandi í lagamálinu í upphafi – ef til vill hefur það verið alger tilviljun. Hins vegar er alþekkt að lagamál er íhaldssamt og þess vegna eðlilegt að uppreist haldist þar í þessu sambandi þótt sú mynd verði undir í almennu máli.

En í almennu máli er langoftast talað um uppreisn æru – dæmin um það samband á tímarit.is eru 20 sinnum fleiri en dæmin um uppreist æru. Þótt myndin uppreisn sé ekki notuð í texta laganna er hún stundum notuð í lagamáli, til dæmis finnast dæmi um hana bæði í héraðsdómum og hæstaréttardómum. Það verður því ekki séð að neitt sé athugavert við það að tala um uppreisn æru í stað uppreist æru, ef menn kjósa svo, enda hefði fyrrnefnda myndin rétt eins getað ratað inn í lagatexta á sínum tíma.

Posted on Færðu inn athugasemd

Hvernig er hægt að skilgreina íslenska tungu?

Við sem eigum íslensku að móðurmáli erum ekki í vandræðum með að þekkja hana þegar við heyrum hana talaða eða sjáum hana á prenti, en málið vandast ef við eigum að skilgreina tunguna. Fram á síðustu öld hefði dugað að segja: „Íslenska er það tungumál sem er talað á Íslandi“, því að tæpast voru önnur tungumál töluð í landinu nema hjá fáeinum dönskum kaupmönnum og embættismönnum.

Nú eru aðstæður gerbreyttar og fjölmörg tungumál töluð á Íslandi, þótt íslenska sé vitaskuld ennþá móðurmál yfirgnæfandi meirihluta íbúanna. Ef skilgreining af þessu tagi er notuð verður því að minnsta kosti að breyta orðalaginu og segja: „Íslenska er það tungumál sem langflestir íbúar Íslands eiga að móðurmáli“. (Athugið að hér er sagt „íbúar Íslands“ en ekki „Íslendingar“, vegna þess að skilgreining þess hver sé Íslendingur er ekki síður snúin en skilgreining tungumálsins.)

Það má líka hugsa sér að skilgreina íslensku út frá ákveðnum formseinkennum í hljóðafari, beygingum og setningagerð. Til dæmis má segja að íslenska sé tungumál þar sem tiltekin málhljóð eru notuð (og telja þau upp) og tilteknar reglur gilda um það hvernig þau geta raðast saman; þar sem fallorð hafa þrjú kyn, tvær tölur og fjögur föll, og sagnir beygjast í persónum tölum, tíðum og háttum; þar sem sögn í persónuhætti er yfirleitt ekki aftar en annar liður í setningu; og svo framvegis. Hvert þessara atriða um sig getur átt við fleiri mál en íslensku, en þegar þau koma öll saman fáum við lýsingu sem fellur væntanlega ekki að neinu öðru máli. En skilgreining af þessu tagi er flókin og vandmeðfarin.

Væntanlega liggur þó beinast við skilgreina íslensku út frá uppruna, segja að hún sé indóevrópskt mál, nánar til tekið norðurgermanskt, og enn nánar vesturnorrænt. Það er svo álitamál hvenær íslenska hafi orðið til. Tæpast er hægt að segja að það hafi verið þegar við landnám – eðlilegra er að segja að íslenska verði til sem sérstakt tungumál þegar einhver tiltekinn munur er orðinn á því máli sem talað er á Íslandi og málinu í Noregi.

Það er hins vegar útilokað að tímasetja tilurð íslensku – í þessum skilningi – nákvæmlega. Bæði skortir okkur heimildir um það hversu mikill munurinn var á hverjum tíma, og eins er skilgreiningaratriði hversu mikill hann þarf að vera til að réttlætanlegt sé að tala um íslensku sem sérstakt tungumál – frekar en sem norska mállýsku. Munurinn á máli og mállýsku er raunar sérstakt viðfangsefni sem ekki verður leyst á einfaldan hátt.

Skilgreining tungumáls er að einhverju leyti háð tíma og ytri aðstæðum. Hvað ef íslenskan breytist verulega í framtíðinni? Hættir hún þá að vera íslenska? Fyrir rúmum 40 árum fór ég á fyrirlestur sem Jón Helgason prófessor flutti í Háskóla Íslands – fyrirlesturinn var kynntur þannig að Jón spjallaði um það sem honum dytti í hug. Þá nefndi hann að nú stefndi í það að íslenska hyrfi af landinu og bara yrði eftir reykvíska – sem væri gott, því að þá hefði viðfangsefni hans bæði upphaf og endi.

Þetta var auðvitað sagt í hálfkæringi eins og Jóns var von og vísa, en spurningin er samt gild. Íslenska nútímans er talsvert frábrugðin íslensku Sturlungaaldar á ýmsan hátt – hljóðkerfið er gerbreytt, fjöldi nafnorða hefur breytt um beygingarflokk og beygingarflokkar runnið saman, talsverðar breytingar hafa orðið á sagnendingum, ýmislegt í setningagerð hefur breyst, og merking margra orða er nú önnur en hún var – en við erum þó ekki í vafa um að þetta sé sama tungumálið.

Enska er enn skilgreind sem vesturgermanskt mál, enda þótt hún hafi tekið upp aragrúa orða og orðstofna af rómönskum toga (úr latínu og frönsku). Sú enska sem töluð var fyrir þúsund árum er að flestu leyti ólík enskunni nú á dögum – hljóðafar, beygingar, setningagerð og orðaforði hefur gerbreyst, og enginn enskumælandi maður getur lesið þúsund ára gamla enska texta án verulegs náms og þjálfunar. En málið er samt enn kallað enska.

Það sem skiptir hér meginmáli er óslitin söguleg þróun. Á nokkrum öldum eða heilu árþúsundi getur innri gerð tungumáls gerbreyst, og sömuleiðis ytri aðstæður þess. En breytingarnar gerast ekki eins og hendi sé veifað – sáralítil breyting verður frá ári til árs, en þegar litið er til áratuga og alda eru breytingarnar augljósar. Út frá þessu má spyrja: Hvaða tungumál verður talað á Íslandi eftir hundrað ár? Því er vitaskuld ógerlegt að svara með nokkurri vissu. Það verður örugglega talsvert frábrugðið því máli sem við tölum nú.

En ef þróunin verður óslitin næstu öld verður þetta örugglega íslenska. Hún kann að hafa tekið upp mikinn fjölda enskra orða, hún kann að hafa misst eitthvað af beygingum, setningagerðin kann að hafa tekið breytingum, og það kann að vera að þeir sem þá verða ungir eigi í erfiðleikum með að lesa það sem við skrifum nú – en það verður samt engin ástæða til að kalla þetta neitt annað en íslensku. Öðru máli gegnir ef þjóðin tæki sig saman um það einhvern daginn að skipta um tungumál og fara til dæmis að tala ensku. Þá væri ekki lengur um óslitna þróun að ræða.

Hugsanleg skilgreining á íslensku væri því á þessa leið: Indóevrópskt (vesturnorrænt) tungumál, beygingamál sem hefur tekið minni breytingum frá fornnorrænu en önnur norræn mál, aðaltungumálið og opinbert tungumál á Íslandi og móðurmál meginhluta íbúa landsins.