Orðalyklar og orðafar
Árið 1989 var okkur Örnólfi Thorssyni veittur styrkur úr Vísindasjóði til að gera lemmaða tíðniskrá og orðstöðulykil yfir útgáfu Svarts á hvítu á Íslendingasögum. Ég skipulagði verkið og stjórnaði því, sá um alla tölvuvinnslu og forritun í sambandi við það. Síðar var lykillinn, ásamt texta Íslendinga sagna, gefinn út á geisladiski (1996d) og er nú aðgengilegur á Snöru.
Á árunum 1991-1995 gekkst ég einnig fyrir gerð orðstöðulykla að Sturlungu, Heimskringlu, Landnámu og Íslendingaþáttum, en stúdentar unnu það verk að mestu leyti undir minni stjórn. Þessir lyklar eru til í handriti en hafa ekki verið gefnir út.
Í framhaldi af þessu gerði ég ýmsar rannsóknir á orðtíðni og orðfæri Íslendingasagna og flutti fyrirlestra um þær rannsóknir á nokkrum ráðstefnum og málþingum hérlendis og erlendis, einkum á árunum 1994-1996. Sumt af því efni hefur birst á prenti (sjá hér að neðan).
Árið 1997 var ég upphafsmaður að gerð orðstöðulykils að verkum Halldórs Laxness. Ég mótaði gerð lykilsins og stjórnaði verkinu lengst af en ýmsir unnu að því, einkum stúdentar. Lykillinn var unninn hjá Orðabók Háskólans og kostaður af Vöku-Helgafelli og Eddu, en einnig fengust til hans styrkir frá Nýsköpunarsjóði námsmanna og Málvísindastofnun Háskólans. Lykillinn var gefinn út á netinu vorið 2002 og er nú á Snöru.
Um aldamótin tók ég þátt í gerð íslensks talmálsbanka (ÍS-TAL) sem Þórunn Blöndal, dósent við Kennaraháskóla Íslands (nú Menntavísindasvið HÍ) stjórnaði. Í framhaldi af þeirri vinnu hef ég skrifað greinar um talmálsbankann og greiningu hans (sjá hér að neðan). Einnig hef ég fjallað um leit í málfræðilega greindum textasöfnum.
Árið 2015 var ég í forsvari fyrir hóp sem fékk styrk úr Innviðasjóði til að koma upp risastórri íslenskri málheild. Steinþór Steingrímsson, Sigrún Helgadóttir o.fl. unnu verkið að mestu leyti. Risamálheildin var svo opnuð vorið 2018.
Rit og fyrirlestrar sem tengjast þessu rannsóknarsviði
- Steinþór Steingrímsson, Sigrún Helgadóttir, Eiríkur Rögnvaldsson, Starkaður Barkarson og Jón Guðnason. 2018. Risamálheild: A Very Large Icelandic Text Corpus. Proceedings of LREC 2018, s. 4361-4366. Myazaki, Japan.
- Eiríkur Rögnvaldsson. 2013. Chomsky og gagnamálfræði. Höskuldur Þráinsson og Matthew Whelpton (ritstj.): Chomsky: Mál, sál og samfélag, s. 197-206. Háskólaútgáfan, Reykjavík.
- Eiríkur Rögnvaldsson. 2013. Talmál og tilbrigði. Skráning, mörkun og setningafræðileg nýting talmálsgagna. Höskuldur Þráinsson, Ásgrímur Angantýsson og Einar Freyr Sigurðsson (ritstj.): Tilbrigði í íslenskri setningagerð I, s. 69-82. Málvísindastofnun Háskóla Íslands og Háskólaútgáfan, Reykjavík.
- Eiríkur Rögnvaldsson og Sigrún Helgadóttir. 2011. Morphosyntactic Tagging of Old Icelandic Texts and Its Use in Studying Syntactic Variation and Change. Sporleder, Caroline, Antal P.J. van den Bosch og Kalliopi A. Zervanou (ritstj:): Language Technology for Cultural Heritage: Selected Papers from the LaTeCH Workshop Series, s. 63-76. Springer, Berlín.
- Eiríkur Rögnvaldsson og Sigrún Helgadóttir. 2008. Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. 2nd Workshop on Language Technology for Cultural Heritage Data, s. 40-46. LREC 2008 workshop. Marrakech, Marokkó.
- Eiríkur Rögnvaldsson. 2006. The Corpus of Spoken Icelandic and Its Morphosyntactic Annotation. Peter Juel Henrichsen & Peter Rossen Skadhauge (ritstj.): Treebanking for Discourse and Speech. Proceedings of the NODALIDA 2005 Special Session on Treebanks for Spoken Language and Discourse. Copenhagen Studies in Language 32, s. 133-145. Samfundslitteratur, Copenhagen.
- Eiríkur Rögnvaldsson. 2002. Corpus of Spoken Icelandic (ÍS-TAL). Henrik Holmboe (ritstj.): Nordisk Sprogteknologi. Årbog 2001:43-44.
- Eiríkur Rögnvaldsson. 1997. Orðafar Íslendinga sagna. Anna Agnarsdóttir, Pétur Pétursson og Torfi H. Tulinius (ritstj.): Milli himins og jarðar, s. 271-286. Háskólaútgáfan, Reykjavík.
- Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson, Guðrún Ingólfsdóttir og Örnólfur Thorsson (ritstj.). 1996. Íslendinga sögur. Orðstöðulykill og texti. Mál og menning, Reykjavík.
- Eiríkur Rögnvaldsson. 1996. Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. LexicoNordica 3:19-34.
- Eiríkur Rögnvaldsson. 1995. A Concordance to Old Icelandic Texts and its Lexicographic value. Nordiske studier i leksikografi 3:123-135.
- Eiríkur Rögnvaldsson. 1993. Collocations in the Minimalist Framework. Lambda 18:107-118.
- Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson, Guðrún Ingólfsdóttir og Örnólfur Thorsson. 1990. Frá orðalykli til orðabókar. [Fjölritaður kynningarbæklingur, 16 s.]
- Eiríkur Rögnvaldsson. 1990. Orðstöðulykill Íslendinga sagna. Skáldskaparmál 1:54-61.
- Eiríkur Rögnvaldsson og Örnólfur Thorsson. 1989. Fornir textar í tölvubanka. Saga News 4:19-24.
- Eiríkur Rögnvaldsson og Vilhjálmur Sigurjónsson. 1986. Um orðasafn með WordPerfect og íslenska orðtíðni. [Óprentuð skýrsla.]
- Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. (Meðhöfundur Sigrún Helgadóttir.) LREC 2008 workshop: 2nd Workshop on Language Technology for Cultural Heritage Data, Marrakech, 1. júní 2008.
- Talmál og tilbrigði. Hugvísindaþing. (Meðhöfundur Ásta Svavarsdóttir.) Hugvísindastofnun og Guðfræðistofnun Háskóla Íslands, Reykjavík, 5. apríl 2008.
- Automatiske metoder til excerpering af nye ord. (Meðhöfundur Kristín Bjarnadóttir.) Seminar om sprogrøgt, sprogteknologi og sprogresurser i Norden. Nordens Sprogråd – arbejdsgruppen for sprogteknologi, Kaupmannahöfn, 29. október 2007.
- The Electronic Corpus of Old Icelandic and Its Use in Syntactic Research. The US-Iceland NSF Workshop. Samstarfshópur íslenskra og bandarískra málvísindamanna, Reykjavík, 1. júní 2007.
- Setningagerð í textasöfnum – greining og leit. Tungutækni og orðabækur – málþing á vegum Orðabókar Háskólans. Orðabók Háskólans, Reykjavík, 17. febrúar 2006.
- Efnisöflun og efniviður í málrannsóknum. (Meðhöfundur Ásta Svavarsdóttir.) 20. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 28. janúar 2006.
- The Corpus of Spoken Icelandic and Its Morphosyntactic Annotation. Special Session on Treebanks for Spoken Language and Discourse. Nodalida, Joensuu, 19. maí 2005.
- Omkring ord og ordforråd i de islandske sagaer. Faggruppe i nordisk språkvitenskap, Nordisk institutt, Háskólanum í Bergen, 12. mars 2001.
- Orðafar Íslendinga sagna. Milli himins og jarðar. Heimspekideild og Guðfræðideild Háskóla Íslands, Reykjavík, 19. október 1996.
- Brugen af et gammelislandsk tekstkorpus i lingvistisk og leksikografisk forskning. Seminar on the Use of Corpora in Linguistic Research, Þrándheimi, 25. apríl 1996.
- Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. Symposium om korpusbaseret leksikografi. Nordisk forening for leksikografi, Kaupmannahöfn, 11. febrúar 1996.
- A Concordance to Old Icelandic Texts and its Lexicographic Value. Konference om leksikografi i Norden. Nordisk forening for leksikografi, Reykjavík, 9. júní 1995.
- Orðaforði Íslendinga sagna. (Meðhöfundur Örnólfur Thorsson.) Rannsóknarstofnun Kennaraháskóla Íslands, Reykjavík, 22. mars 1994.
- En konkordanse og en ny ordbog over de islandske sagaer. (Meðhöfundur Guðrún Ingólfsdóttir.) Helsingfors Universitet, 6. september 1990.
- Orðstöðulykill Íslendinga sagna. 4. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 25. nóvember 1989.
- Orðstöðulykill Íslendinga sagna. Skáldskaparmál. Reykjavík, 29. apríl 1989.
- Um merkingu, notkun og tíðni nokkurra viðskeyta. 3. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 19. nóvember 1988.
- Nokkur viðskeyti og tíðni þeirra. 1. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 8. nóvember 1986.
Árið 1989 var okkur Örnólfi Thorssyni veittur styrkur úr Vísindasjóði til að gera lemmaða tíðniskrá og orðstöðulykil yfir útgáfu Svarts á hvítu á Íslendingasögum. Ég skipulagði verkið og stjórnaði því, sá um alla tölvuvinnslu og forritun í sambandi við það. Síðar var lykillinn, ásamt texta Íslendinga sagna, gefinn út á geisladiski (1996d) og er nú aðgengilegur á Snöru.
Á árunum 1991-1995 gekkst ég einnig fyrir gerð orðstöðulykla að Sturlungu, Heimskringlu, Landnámu og Íslendingaþáttum, en stúdentar unnu það verk að mestu leyti undir minni stjórn. Þessir lyklar eru til í handriti en hafa ekki verið gefnir út.
Í framhaldi af þessu gerði ég ýmsar rannsóknir á orðtíðni og orðfæri Íslendingasagna og flutti fyrirlestra um þær rannsóknir á nokkrum ráðstefnum og málþingum hérlendis og erlendis, einkum á árunum 1994-1996. Sumt af því efni hefur birst á prenti (1990d, 1995b, 1996a, 1997).
Árið 1997 var ég upphafsmaður að gerð orðstöðulykils að verkum Halldórs Laxness. Ég mótaði gerð lykilsins og stjórnaði verkinu lengst af en ýmsir unnu að því, einkum stúdentar. Lykillinn var unninn hjá Orðabók Háskólans og kostaður af Vöku-Helgafelli og Eddu, en einnig fengust til hans styrkir frá Nýsköpunarsjóði námsmanna og Málvísindastofnun Háskólans. Lykillinn var gefinn út á netinu vorið 2002 og er nú á Snöru.
Um aldamótin tók ég þátt í gerð íslensks talmálsbanka (ÍS-TAL) sem Þórunn Blöndal, dósent við Kennaraháskóla Íslands (nú Menntavísindasvið HÍ) stjórnaði. Í framhaldi af þeirri vinnu hef ég skrifað greinar um talmálsbankann og greiningu hans (2002e, 2006a). Einnig hef ég fjallað um leit í málfræðilega greindum textasöfnum (2007a, 2008e).
Rit og fyrirlestrar sem tengjast þessu rannsóknarsviði
2011b: | Morphosyntactic Tagging of Old Icelandic Texts and Its Use in Studying Syntactic Variation and Change. (Ásamt Sigrúnu Helgadóttur.) Væntanlegt í Sporleder, Caroline, Antal P.J. van den Bosch og Kalliopi A. Zervanou (ritstj:): Language Technology for Cultural Heritage. Springer, Berlín. |
2008e: | Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. (Ásamt Sigrúnu Helgadóttur.) 2nd Workshop on Language Technology for Cultural Heritage Data, s. 40-46. LREC 2008 workshop. Marrakech, Marokkó. |
2006a: | The Corpus of Spoken Icelandic and Its Morphosyntactic Annotation. Peter Juel Henrichsen & Peter Rossen Skadhauge (ritstj.): Treebanking for Discourse and Speech. Proceedings of the NODALIDA 2005 Special Session on Treebanks for Spoken Language and Discourse. Copenhagen Studies in Language 32, s. 133-145. Samfundslitteratur, Copenhagen. |
2002e: | Corpus of Spoken Icelandic (ÍS-TAL). Henrik Holmboe (ritstj.): Nordisk Sprogteknologi. Årbog 2001:43-44. |
1997: | Orðafar Íslendinga sagna. Anna Agnarsdóttir, Pétur Pétursson og Torfi H. Tulinius (ritstj.): Milli himins og jarðar, s. 271-286. Háskólaútgáfan, Reykjavík. |
1996d: | Íslendinga sögur. Orðstöðulykill og texti. Ritstjórar Orðstöðulykils Bergljót Kristjánsdóttir, Eiríkur Rögnvaldsson (aðalritstjóri), Guðrún Ingólfsdóttir og Örnólfur Thorsson. Mál og menning, Reykjavík. |
1996a: | Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. LexicoNordica 3:19-34. |
1995b: | A Concordance to Old Icelandic Texts and its Lexicographic value. Nordiske studier i leksikografi 3:123-135. |
1993c: | Collocations in the Minimalist Framework. Lambda 18:107-118. |
1990j: | Frá orðalykli til orðabókar. (Ásamt Bergljótu Kristjánsdóttur, Guðrúnu Ingólfsdóttur og Örnólfi Thorssyni.) [Fjölritaður kynningarbæklingur, 16 s.] |
1990d: | Orðstöðulykill Íslendinga sagna. Skáldskaparmál 1:54-61. |
1989d: | Fornir textar í tölvubanka. (Ásamt Örnólfi Thorssyni.) Saga News 4:19-24. |
1986d: | Um orðasafn með WordPerfect og íslenska orðtíðni. (Ásamt Vilhjálmi Sigurjónssyni.) [Óprentuð skýrsla.] |
- Textasöfn og málrannsóknir. Erindi flutt í Ríkisútvarpinu, Reykjavík, 11. janúar 2011.
- Morphological Tagging of Old Norse Texts and Its Use in Studying Syntactic Variation and Change. (Meðhöfundur Sigrún Helgadóttir.) LREC 2008 workshop: 2nd Workshop on Language Technology for Cultural Heritage Data, Marrakech, 1. júní 2008.
- Talmál og tilbrigði. Hugvísindaþing. (Meðhöfundur Ásta Svavarsdóttir.) Hugvísindastofnun og Guðfræðistofnun Háskóla Íslands, Reykjavík, 5. apríl 2008.
- Automatiske metoder til excerpering af nye ord. (Meðhöfundur Kristín Bjarnadóttir.) Seminar om sprogrøgt, sprogteknologi og sprogresurser i Norden. Nordens Sprogråd – arbejdsgruppen for sprogteknologi, Kaupmannahöfn, 29. október 2007.
- The Electronic Corpus of Old Icelandic and Its Use in Syntactic Research. The US-Iceland NSF Workshop. Samstarfshópur íslenskra og bandarískra málvísindamanna, Reykjavík, 1. júní 2007.
- Setningagerð í textasöfnum – greining og leit. Tungutækni og orðabækur – málþing á vegum Orðabókar Háskólans. Orðabók Háskólans, Reykjavík, 17. febrúar 2006.
- Efnisöflun og efniviður í málrannsóknum. (Meðhöfundur Ásta Svavarsdóttir.) 20. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 28. janúar 2006.
- The Corpus of Spoken Icelandic and Its Morphosyntactic Annotation. Special Session on Treebanks for Spoken Language and Discourse. Nodalida, Joensuu, 19. maí 2005.
- Omkring ord og ordforråd i de islandske sagaer. Faggruppe i nordisk språkvitenskap, Nordisk institutt, Háskólanum í Bergen, 12. mars 2001.
- Orðstöðulykill Íslendinga sagna. Sumarnámskeið Samtaka móðurmálskennara, Selfossi, 21. ágúst 1997.
- Orðstöðulykill Íslendinga sagna - Concordance to the Icelandic Family Sagas. Icelandic Medieval Studies Summer Programme, Háskóla Íslands, Reykjavík, 17. júlí 1997.
- Orðafar Íslendinga sagna. Milli himins og jarðar. Heimspekideild og Guðfræðideild Háskóla Íslands, Reykjavík, 19. október 1996.
- Brugen af et gammelislandsk tekstkorpus i lingvistisk og leksikografisk forskning. Seminar on the Use of Corpora in Linguistic Research, Þrándheimi, 25. apríl 1996.
- Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. Symposium om korpusbaseret leksikografi. Nordisk forening for leksikografi, Kaupmannahöfn, 11. febrúar 1996.
- A Concordance to Old Icelandic Texts and its Lexicographic Value. Konference om leksikografi i Norden. Nordisk forening for leksikografi, Reykjavík, 9. júní 1995.
- Orðaforði Íslendinga sagna. (Meðhöfundur Örnólfur Thorsson.) Rannsóknarstofnun Kennaraháskóla Íslands, Reykjavík, 22. mars 1994.
- En konkordanse og en ny ordbog over de islandske sagaer. (Meðhöfundur Guðrún Ingólfsdóttir.) Helsingfors Universitet, 6. september 1990.
- Orðstöðulykill Íslendinga sagna. 4. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 25. nóvember 1989.
- Orðstöðulykill Íslendinga sagna. Skáldskaparmál. Reykjavík, 29. apríl 1989.
- Um merkingu, notkun og tíðni nokkurra viðskeyta. 3. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 19. nóvember 1988.
- Nokkur viðskeyti og tíðni þeirra. 1. Rask-ráðstefnan. Íslenska málfræðifélagið, Reykjavík, 8. nóvember 1986.