Í haust skrifaði ég pistil sem hét „Notum orðabækur!“. Tilefnið var að ég hafði orðið var við að í stað þess að fletta merkingu íslenskra orða upp í traustum orðabókum var fólk farið að spyrja ChatGPT eða önnur gervigreinarlíkön – og treysta svörunum. Það er hins vegar stórvarasamt – þótt gervigreindarlíkönin geti svarað einföldum spurningum um algeng og óumdeild atriði í íslensku bregst þeim oftast bogalistin þegar farið er út í flóknari atriði, einkum þau sem skiptar skoðanir eru um. Þar fyrir utan eru líkönin þekkt að meðvirkni og veita oft svör í samræmi við væntingar fyrirspyrjanda, og þess vegna skiptir miklu máli hvernig fyrirspurnir eru orðaðar – hægt er að fá mismunandi svör við sömu fyrirspurn með því að breyta orðalagi svolítið.
Síðan ég skrifaði áðurnefndan pistil hef ég séð fjölmörg dæmi um sífellt vafasamari notkun gervigreindar til að svara spurningum um íslenskt mál og bókmenntir. Til að svara nýlegri fyrirspurn um höfund tilgreindra vísuorða í Facebook-hópnum „Skemmtileg íslensk orð“ spurðu ýmsir svarendur gervigreind og fengu ótrúlegustu svör – að þetta væri úr gamalli þulu í þjóðsagnasafni Jóns Árnasonar, að þetta væri eftir Bólu-Hjálmar, og jafnvel að þetta væru „þekktar línur úr kvæðinu Gunnarshólmi eftir Jónas Hallgrímsson, þar sem lýst er aðförinni að Gunnari á Hlíðarenda“ – og uppdiktað erindi tilfært í heild. Smávegis gúgl leiddi hins vegar í ljós að vísuorðin eru úr kvæði eftir Bjarna Thorarensen amtmann, vissulega ekki mjög þekktu.
Versta dæmið fékk ég þó í morgun í tölvupósti frá manni í fyrirtækjarekstri sem sagðist hafa staðið í stríði við markaðsdeildina hjá sér og auglýsingastofu um tiltekið atriði í stafsetningu. Hann hafði fyrir sér auglýsingu menntamálaráðuneytisins um íslenska stafsetningu þar sem réttur ritháttur er sérstaklega nefndur, og auk þess grein á Vísindavefnum þar sem sami ritháttur er tilgreindur. Gegn þessu var því einu teflt að gervigreindin styddi annan rithátt. En ef spurt er um rithátt orðs er það væntanlega vegna þess að fyrirspyrjandi er í vafa – við spyrjum ekki um það sem við erum viss um. Þess vegna er afskaplega vond hugmynd að nota gervigreind til að ráðleggja sér um stafsetningu – enn verri en nota hana til að fá upplýsingar um merkingu orða.
Ef fyrirspyrjandi er í vafa um ritháttinn er nefnilega ekki ólíklegt að sama gildi um fleiri málnotendur – og þá er jafnframt líklegt að einhver dæmi séu um að viðkomandi atriði sé skrifað á fleiri en einn hátt í textum. Þar með er fjandinn laus – því að gervigreindarlíkönin hafa þar með séð fjölda dæma um ranga ritun orðsins. Í því tilviki sem um var spurt eru dæmi um ranga ritun í miklum meirihluta í Risamálheildinni – hlutfallið er 2:5, þ.e. tvö rétt rituð dæmi á móti fimm rangt rituðum. Á tímarit.is er munurinn nokkru minni en þó rúmlega tvöfaldur. Þess vegna er eðlilegt að gervigreindarlíkön velji ranga ritháttinn – þau hafa séð mun fleiri dæmi um hann. Spyrjið aldrei gervigreind um stafsetningu – notið Íslenska stafsetningarorðabók og Ritreglur!

+354-861-6417
eirikurr