Orðalyklar og orðafar

Árið 1989 var okkur Örnólfi Thorssyni veittur styrkur úr Vísindasjóði til að gera lemmaða tíðniskrá og orðstöðulykil yfir útgáfu Svarts á hvítu á Íslendingasögum. Ég skipulagði verkið og stjórnaði því, sá um alla tölvuvinnslu og forritun í sambandi við það. Síðar var lykillinn, ásamt texta Íslendinga sagna, gefinn út á geisladiski (1996d) og er nú aðgengilegur á Snöru.

Á árunum 1991-1995 gekkst ég einnig fyrir gerð orðstöðulykla að Sturlungu, Heimskringlu, Landnámu og Íslendingaþáttum, en stúdentar unnu það verk að mestu leyti undir minni stjórn. Þessir lyklar eru til í handriti en hafa ekki verið gefnir út.

Í framhaldi af þessu gerði ég ýmsar rannsóknir á orðtíðni og orðfæri Íslendingasagna og flutti fyrirlestra um þær rannsóknir á nokkrum ráðstefnum og málþingum hérlendis og erlendis, einkum á árunum 1994-1996. Sumt af því efni hefur birst á prenti (sjá hér að neðan).

Árið 1997 var ég upphafsmaður að gerð orðstöðulykils að verkum Halldórs Laxness. Ég mótaði gerð lykilsins og stjórnaði verkinu lengst af en ýmsir unnu að því, einkum stúdentar. Lykillinn var unninn hjá Orðabók Háskólans og kostaður af Vöku-Helgafelli og Eddu, en einnig fengust til hans styrkir frá Nýsköpunarsjóði námsmanna og Málvísindastofnun Háskólans. Lykillinn var gefinn út á netinu vorið 2002 og er nú á Snöru.

Um aldamótin tók ég þátt í gerð íslensks talmálsbanka (ÍS-TAL) sem Þórunn Blöndal, dósent við Kennaraháskóla Íslands (nú Menntavísindasvið HÍ) stjórnaði. Í framhaldi af þeirri vinnu hef ég skrifað greinar um talmálsbankann og greiningu hans (sjá hér að neðan). Einnig hef ég fjallað um leit í málfræðilega greindum textasöfnum.

Árið 2015 var ég í forsvari fyrir hóp sem fékk styrk úr Innviðasjóði til að koma upp risastórri íslenskri málheild. Steinþór Steingrímsson, Sigrún Helgadóttir o.fl. unnu verkið að mestu leyti. Risamálheildin var svo opnuð vorið 2018.

Rit og fyrirlestrar sem tengjast þessu rannsóknarsviði

  1. Steinþór Steingrímsson, Sigrún Helgadóttir, Eiríkur Rögnvaldsson, Starkaður Barkarson og Jón Guðnason. 2018. Risamálheild: A Very Large Icelandic Text Corpus. Proceedings of LREC 2018, s. 4361-4366. Myazaki, Japan.
  2. Eiríkur Rögnvaldsson. 2013. Chomsky og gagnamálfræði. Höskuldur Þráinsson og Matthew Whelpton (ritstj.): Chomsky: Mál, sál og samfélag, s. 197-206. Háskólaútgáfan, Reykjavík.
  3. Eiríkur Rögnvaldsson. 2013. Talmál og tilbrigði. Skráning, mörkun og setningafræðileg nýting talmálsgagna. Höskuldur Þráinsson, Ásgrímur Angantýsson og Einar Freyr Sigurðsson (ritstj.): Tilbrigði í íslenskri setningagerð I, s. 69-82. Málvísindastofnun Háskóla Íslands og Háskólaútgáfan, Reykjavík.
  4. Eiríkur Rögnvaldsson og Sigrún Helgadóttir. 2011. Morphosyntactic Tagging of Old Icelandic Texts and Its Use in Studying Syntactic Variation and Change. Sporleder, Caroline, Antal P.J. van den Bosch og Kalliopi A. Zervanou (ritstj:): Language Technology for Cultural Heritage: Selected Papers from the LaTeCH Workshop Series, s. 63-76. Springer, Berlín.
  5. Eiríkur Rögnvaldsson og Sigrún Helgadóttir. 2008. Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. 2nd Workshop on Language Technology for Cultural Heritage Data, s. 40-46. LREC 2008 workshop. Marrakech, Marokkó.
  6. Eiríkur Rögnvaldsson. 2006. The Corpus of Spoken Icelandic and Its Morpho­syn­tac­tic Annotation. Peter Juel Henrichsen & Peter Rossen Skadhauge (ritstj.): Treebanking for Discourse and Speech. Proceedings of the NODALIDA 2005 Special Session on Treebanks for Spoken Language and Discourse. Copenhagen Studies in Lan­guage 32, s. 133-145. Samfundslitteratur, Copenhagen.
  7. Eiríkur Rögnvaldsson. 2002. Corpus of Spoken Icelandic (ÍS-TAL). Henrik Holmboe (ritstj.): Nordisk Sprog­teknologi. Årbog 2001:43-44.
  8. Eiríkur Rögnvaldsson. 1997. Orðafar Íslendinga sagna. Anna Agnarsdóttir, Pétur Pétursson og Torfi H. Tulinius (ritstj.): Milli himins og jarðar, s. 271-286. Háskólaútgáfan, Reykjavík.
  9. Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson, Guðrún Ingólfsdóttir og Örnólfur Thorsson (ritstj.). 1996. Íslendinga sögur. Orðstöðulykill og texti. Mál og menning, Reykjavík.
  10. Eiríkur Rögnvaldsson. 1996. Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. LexicoNordica 3:19-34.
  11. Eiríkur Rögnvaldsson. 1995. A Concordance to Old Icelandic Texts and its Lexicographic value. Nordiske studier i leksikografi 3:123-135.
  12. Eiríkur Rögnvaldsson. 1993. Collocations in the Minimalist Framework. Lambda 18:107-118.
  13. Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson, Guðrún Ingólfsdóttir og Örnólfur Thorsson. 1990. Frá orðalykli til orðabókar. [Fjölritaður kynningarbæklingur, 16 s.]
  14. Eiríkur Rögnvaldsson. 1990. Orðstöðulykill Íslendinga sagna. Skáldskaparmál 1:54-61.
  15. Eiríkur Rögnvaldsson og Örnólfur Thorsson. 1989. Fornir textar í tölvubanka. Saga News 4:19-24.
  16. Eiríkur Rögnvaldsson og Vilhjálmur Sigurjónsson. 1986. Um orðasafn með WordPerfect og íslenska orðtíðni. [Óprentuð skýrsla.]

Árið 1989 var okkur Örnólfi Thorssyni veittur styrkur úr Vísindasjóði til að gera lemmaða tíðniskrá og orðstöðulykil yfir útgáfu Svarts á hvítu á Íslendingasögum. Ég skipulagði verkið og stjórnaði því, sá um alla tölvuvinnslu og forritun í sambandi við það. Síðar var lykillinn, ásamt texta Íslendinga sagna, gefinn út á geisladiski (1996d) og er nú aðgengilegur á Snöru.

Á árunum 1991-1995 gekkst ég einnig fyrir gerð orðstöðulykla að Sturlungu, Heimskringlu, Landnámu og Íslendingaþáttum, en stúdentar unnu það verk að mestu leyti undir minni stjórn. Þessir lyklar eru til í handriti en hafa ekki verið gefnir út.

Í framhaldi af þessu gerði ég ýmsar rannsóknir á orðtíðni og orðfæri Íslendingasagna og flutti fyrirlestra um þær rannsóknir á nokkrum ráðstefnum og málþingum hérlendis og erlendis, einkum á árunum 1994-1996. Sumt af því efni hefur birst á prenti (1990d, 1995b, 1996a, 1997).

Árið 1997 var ég upphafsmaður að gerð orðstöðulykils að verkum Halldórs Laxness. Ég mótaði gerð lykilsins og stjórnaði verkinu lengst af en ýmsir unnu að því, einkum stúdentar. Lykillinn var unninn hjá Orðabók Háskólans og kostaður af Vöku-Helgafelli og Eddu, en einnig fengust til hans styrkir frá Nýsköpunarsjóði námsmanna og Málvísindastofnun Háskólans. Lykillinn var gefinn út á netinu vorið 2002 og er nú á Snöru.

Um aldamótin tók ég þátt í gerð íslensks talmálsbanka (ÍS-TAL) sem Þórunn Blöndal, dósent við Kennaraháskóla Íslands (nú Menntavísindasvið HÍ) stjórnaði. Í framhaldi af þeirri vinnu hef ég skrifað greinar um talmálsbankann og greiningu hans (2002e, 2006a). Einnig hef ég fjallað um leit í málfræðilega greindum textasöfnum (2007a, 2008e).

Rit og fyrirlestrar sem tengjast þessu rannsóknarsviði

2011b: Morphosyntactic Tagging of Old Icelandic Texts and Its Use in Studying Syntactic Variation and Change. (Ásamt Sigrúnu Helgadóttur.) Væntanlegt í Sporleder, Caroline, Antal P.J. van den Bosch og Kalliopi A. Zervanou (ritstj:): Language Technology for Cultural Heritage. Springer, Berlín.
2008e: Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. (Ásamt Sigrúnu Helgadóttur.) 2nd Workshop on Language Technology for Cultural Heritage Data, s. 40-46. LREC 2008 workshop. Marrakech, Marokkó.
2006a: The Corpus of Spoken Icelandic and Its Morpho­syn­tac­tic Annotation. Peter Juel Henrichsen & Peter Rossen Skadhauge (ritstj.): Treebanking for Discourse and Speech. Proceedings of the NODALIDA 2005 Special Session on Treebanks for Spoken Language and Discourse. Copenhagen Studies in Lan­guage 32, s. 133-145. Samfundslitteratur, Copenhagen.
2002e: Corpus of Spoken Icelandic (ÍS-TAL). Henrik Holmboe (ritstj.): Nordisk Sprog­teknologi. Årbog 2001:43-44.
1997: Orðafar Íslendinga sagna. Anna Agnarsdóttir, Pétur Pétursson og Torfi H. Tulinius (ritstj.): Milli himins og jarðar, s. 271-286. Háskólaútgáfan, Reykjavík.
1996d: Íslendinga sögur. Orðstöðulykill og texti. Ritstjórar Orðstöðulykils Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson (aðalritstjóri), Guðrún Ingólfsdóttir og Örnólfur Thorsson. Mál og menning, Reykjavík.
1996a: Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. LexicoNordica 3:19-34.
1995b: A Concordance to Old Icelandic Texts and its Lexicographic value. Nordiske studier i leksikografi 3:123-135.
1993c: Collocations in the Minimalist Framework. Lambda 18:107-118.
1990j: Frá orðalykli til orðabókar. (Ásamt Bergljótu Kristjánsdóttur, Guðrúnu Ingólfsdóttur og Örnólfi Thorssyni.) [Fjölritaður kynningarbæklingur, 16 s.]
1990d: Orðstöðulykill Íslendinga sagna. Skáldskaparmál 1:54-61.
1989d: Fornir textar í tölvubanka. (Ásamt Örnólfi Thorssyni.) Saga News 4:19-24.
1986d: Um orðasafn með WordPerfect og íslenska orðtíðni. (Ásamt Vilhjálmi Sigurjónssyni.) [Óprentuð skýrsla.]