Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Valkvætt minnisleysi ofbeldismanna Guðný S. Bjarnadóttir Skoðun Skaðaminnkun Rauða krossins Ósk Sigurðardóttir,Sigríður Ella Jónsdóttir Skoðun Blóraböggull fundinn! Jenný Gunnbjörnsdóttir Skoðun Hvers vegna þétting byggðar? Birkir Ingibjartsson Skoðun 32 dagar Magnea Gná Jóhannsdóttir Skoðun Auglýst eftir heimili á Facebook Steinunn Gyðu- og Guðjónsdóttir Skoðun Opið bréf til frambjóðenda í Reykjavík: Hættum frösunum – leysum leikskólavandann með raunverulegum aðgerðum Nichole Leigh Mosty Skoðun Mjódd framtíðar - hjarta Breiðholts Sara Björg Sigurðardóttir Skoðun Forsendur skólakerfis hverfast um samstarf Magnús Þór Jónsson Skoðun Áfram, hærra Logi Pedro Stefánsson Skoðun Skoðun Skoðun Mönnun íslensks heilbrigðiskerfis til framtíðar í uppnámi Unnur Anna Valdimarsdóttir,Arna Hauksdóttir,Berglind Eva Benediktsdóttir,Bjarni Elvar Pétursson,Heiða María Sigurðardóttir,Helga Bragadóttir,Ólafur Ögmundarson,Sólveg Ása Árnadóttir,Sædís Sævarsdóttir skrifar Skoðun Mjódd framtíðar - hjarta Breiðholts Sara Björg Sigurðardóttir skrifar Skoðun Opið bréf til frambjóðenda í Reykjavík: Hættum frösunum – leysum leikskólavandann með raunverulegum aðgerðum Nichole Leigh Mosty skrifar Skoðun Það þarf ekki fullkomið fólk til að móta gott samfélag. Það þarf fólk sem er tilbúið að vera til staðar Liv Åse Skarstad skrifar Skoðun 32 dagar Magnea Gná Jóhannsdóttir skrifar Skoðun Blóraböggull fundinn! Jenný Gunnbjörnsdóttir skrifar Skoðun Skaðaminnkun Rauða krossins Ósk Sigurðardóttir,Sigríður Ella Jónsdóttir skrifar Skoðun Áfram, hærra Logi Pedro Stefánsson skrifar Skoðun Reykjavík stígi alla leið Þórdís Lóa Þórhallsdóttir skrifar Skoðun Valkvætt minnisleysi ofbeldismanna Guðný S. Bjarnadóttir skrifar Skoðun Gæði í uppbyggingu frekar en bara hraða og magn Dóra Björt Guðjónsdóttir skrifar Skoðun Hvers vegna þétting byggðar? Birkir Ingibjartsson skrifar Skoðun Forsendur skólakerfis hverfast um samstarf Magnús Þór Jónsson skrifar Skoðun Kirkjan sem talar fallega – og spurningin sem fylgir HIlmar Kristinsson skrifar Skoðun Samstaða í ferðaþjónustu aldrei mikilvægari Halldór Óli Kjartansson skrifar Skoðun Þegar almenningsálit er lesið sem umboð Erna Bjarnadóttir skrifar Skoðun Hættið að rukka vangreiðslugjald! Breki Karlsson,Runólfur Ólafsson skrifar Skoðun Heimsmynd byggð á öðrum fætinum Gunnar Salvarsson skrifar Skoðun Hækkum endurgreiðslu virðisaukaskatts af vinnu iðnaðarmanna Jón Sigurðsson,Pétur H. Halldórsson skrifar Skoðun Forgangsröðunarskuld Brynjar Karl Sigurðsson skrifar Skoðun Hvað gerist þegar gervigreind mætir raunveruleikanum? Björn Thor Stefánsson,Kristján Sölvi Örnólfsson,Oliver Sanchez,Viktor Már Guðmundsson skrifar Skoðun Erum við í djúpum skít? Jón Pétur Wilke Gunnarsson skrifar Skoðun Auglýst eftir heimili á Facebook Steinunn Gyðu- og Guðjónsdóttir skrifar Skoðun Félagsleg hjálp sem sviptir fátækasta fólkið sjálfsbjörg Vilhelm Jónsson skrifar Skoðun Er atvinnulífið að misnota heilbrigðiskerfið? Gunnar Ármannsson skrifar Skoðun Traust verður að endurspeglast í framkvæmd Sandra B. Franks skrifar Skoðun Það er leikur að læra fyrir suma Aðalheiður M. Steindórsdóttir skrifar Skoðun Hvað önnur lönd gera í húsnæðiskreppu – og hvað Ísland gerir ekki Yngvi Ómar Sigrúnarson skrifar Skoðun Ég vil breytingar Kristín Soffía Jónsdóttir skrifar Skoðun Hvert var samkomulagið? Geir Finnsson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Opið bréf til frambjóðenda í Reykjavík: Hættum frösunum – leysum leikskólavandann með raunverulegum aðgerðum Nichole Leigh Mosty Skoðun
Skoðun Mönnun íslensks heilbrigðiskerfis til framtíðar í uppnámi Unnur Anna Valdimarsdóttir,Arna Hauksdóttir,Berglind Eva Benediktsdóttir,Bjarni Elvar Pétursson,Heiða María Sigurðardóttir,Helga Bragadóttir,Ólafur Ögmundarson,Sólveg Ása Árnadóttir,Sædís Sævarsdóttir skrifar
Skoðun Opið bréf til frambjóðenda í Reykjavík: Hættum frösunum – leysum leikskólavandann með raunverulegum aðgerðum Nichole Leigh Mosty skrifar
Skoðun Það þarf ekki fullkomið fólk til að móta gott samfélag. Það þarf fólk sem er tilbúið að vera til staðar Liv Åse Skarstad skrifar
Skoðun Hækkum endurgreiðslu virðisaukaskatts af vinnu iðnaðarmanna Jón Sigurðsson,Pétur H. Halldórsson skrifar
Skoðun Hvað gerist þegar gervigreind mætir raunveruleikanum? Björn Thor Stefánsson,Kristján Sölvi Örnólfsson,Oliver Sanchez,Viktor Már Guðmundsson skrifar
Skoðun Hvað önnur lönd gera í húsnæðiskreppu – og hvað Ísland gerir ekki Yngvi Ómar Sigrúnarson skrifar
Opið bréf til frambjóðenda í Reykjavík: Hættum frösunum – leysum leikskólavandann með raunverulegum aðgerðum Nichole Leigh Mosty Skoðun