Meld. St. 31 (2019–2020)

Sámi giella, kultuvra ja servodateallin — Digitaliseren

Sisdollui

4 Sámi giellateknologiija

Min birastahttet eanet ja eanet digitála buktagat ja bálvalusat main lea giellateknologiija. Dat lea teknologiija mii ovdamearkka dihtii máhttá áddet olbmo hállama ja jorgalit hállama teakstan ja nuppe guvlui, teknologiija mii automáhtalaččat jorgala teavsttaid gielaid gaskka, dahje mii sáhttá analyseret ja áddehit stuorra strukturerekeahtes dáhtahivvodagaid. Dakkár teknologiija dat lea min dihtoriid stáven- ja divvunprográmmain, automáhtalaš jorgalančovdosiin, virtuála assisteanttain ja mátketelefovnnain, jierpmálaš neahttaohcamiin, dahkusuopmaniin jna.

Jagi 20121 mannosaš raporta čuoččuha ahte goalmmádas oassi dan 6000 gielas mat mis leat odne, eai dáidde ceavzit rasttideami máilmmiviidosaš digitála diehtoservodahkii. Dat lea maiddái hástalussan ođđadárogillii ja girjedárogillii, ja dan gieđahallá ráđđehus dokumeanttas Prop. 108 L (2019–2020) Lov om språk (giellaláhka) mii almmuhuvvui miessemánu jagi 2020. Sámegielaide dat mearkkaša ahte gielaid ceavzin sorjá das ahte giellageavaheaddjit sáhttet ja háliidit válljet sámegiela go sii geavahit ovdamearkka dihtii mátketelefovnna dahje dihtora.

Sámi giellalávdegoddi deattuha ahte giellateknologiija lea eaktun dasa ahte sámegielat galget ceavzit geavahangiellan ođđaáiggi servodagas. Giellalávdegoddi čujuha dasa ahte dás lea earret eará sáhka sáhttimis geavahit sámegielaid ja sámi bustávaid buot IKT-oktavuođain.

Nannen dihtii sámi giellateknologiija ásahii Sámediggi Divvuma jagi 2004. Divvun lea dutkan- ja ovddidanjoavku Romssa universitehtas – Norgga árktalaš universitehtas, mii ruhtaduvvo Gielda- ja ođasmahttindepartemeantta bušeahta bokte. Joavku bargá ovttasráđiid Sámedikkiin. Divvun lea ovddidan ja dikšon geavahan láhkai giellateknologalaš reaidduid sámi giellaservodagaid várás, oktan stávendárkkástusaiguin, grammatihkkadárkkástusaiguin, boallobevddiiguin, sátnegirjjiiguin ja eará digitála ja neahttavuđot reaidduiguin. Buot Divvuma reaiddut leat nuvttá geavaheapmái ja daid lea vejolaš viežžat sin neahttasiidduin dahje áhppan, ja eatnašiin dain lea rabas gáldokoda.

Giellatekno, Romssa universitehta – Norgga árktalaš universitehta sámi giellateknologalaš guovddáš bargá maid árjjalaččat sámegiela digitaliserema lasihemiin. Giellatekno ulbmil lea ráhkadit vuođđoreaidduid iešguđet sámegielaid analyserema várás, ja ráhkada prográmmaid ja giellaresurssaid dutkamii ja oahpahussii, ja sámi giellageavaheddjiide oppalaččat. Giellatekno lea maid ráhkadeamen mášinjorgalanreaidduid. Giellatekno lea dasto vel ráhkadan máŋga interaktiiva prográmma sidjiide geat háliidit oahppat sámegiela.

Ovttas leat Divvun ja Giellatekno sihkkarastán ahte sámi giellageavaheaddjit sáhttet geavahit gielaset beaivválaš gulahallamii gaskaneaset ja eiseválddiiguin iešguđet digitála vuođđovuogádagain. Sii leat maid ráhkadan máŋga reaiddu, ovdamearkka dihtii mášinjorgaleami davvisámegielas dárogillii, mii dagaha ahte sámegielagat sáhttet čállit davvisámegillii maiddái dakkár oktavuođain main eai buot vejolaš lohkkit máhte sámegiela. Sámi allaskuvla lea ovdamearkka dihtii válljen buvttadit eanaš oasi iežas neahttabáikesisdoalus davvisámegillii ja dasto mašiinnain jorgalan dárogillii.

Divvuma ja Giellatekno stuorámus hástalus lea ahte stuorra riikkaidgaskasaš fitnodagain eai leat rabas lavttat, rabas resurssat eai ge olámuttolaš standárddat. Dat dagaha ahte daid buktagiid maid Divvun ja Giellatekno ráhkadit, eai sáhte fállojuvvot standárda prográmmagálvun dihtoriidda ja mátketelefovnnaide, muhto daid ferte juohke ovttaskas geavaheaddji ieš viežžat. Divvun, Gielda- ja ođasmahttindepartemeanta ja Sámediggi barget ovttas áigumušain gávnnahit mo lea vejolaš gulahallat stuorra riikkaidgaskasaš fitnodagaiguin čoavdin dihtii dán hástalusa.

Dat giellateknologalaš resurssat ja prográmmat maid Divvun ja Giellatekno leat ráhkadan, leat vuođđun sámegiela digitála geavaheapmái. Sámegielaid stávendárkkástusat leat vižžojuvvon badjel 20 000 geardde, ja danne dat leat hui dehálaččat sámi teakstabuvttadeapmái. Tearbmabáŋku satni.org ja sámi neahttasátnegirjjit Neahttadigisánit vásihedje jagi 2018 namalassii 100 000 ja 2,7 miljon ohcama, mii čájeha ahte digitála giellaresurssaid olaheapmi lea dehálaš sihke fidnomáhtolaš geavaheddjiide ja olles giellaservodahkii.

Go buohtastahttá vástideaddji giellaservodagaiguin, de leat sámi giellaservodagat buori dilis: Eanaš sámegielain lea boallobeavdi olámuttus eanaš operatiivavuogádagaide, ja dain lea maid divvunprográmma olámuttus máŋga vuođđovuogádahkii. Dattetge leat ollugat geat eai dieđe ahte dihtoriin leat jo sámi boallobeavddit, dahje eai dieđe guđe boallobeavddi sii galget geavahit.

4.1 Sámi gielladáhtaid lágideapmi

Buori sámi giellateknologiija ovddideapmái dárbbašuvvojit bures ovddiduvvon sátnegirjjit ja máŋga sámegielalaš lingvistta ja programmerejeaddjit geat sáhttet leat mielde ovddideamen buriid resurssaid. Dasa lassin dárbbašuvvo eanet vuođđodáhta, elektrovnnalaččat čálalaš dahje njálmmálaš gielladáhta, nu gohčoduvvon korpus. Dálá giellateknologalaš bálvalusaid viidáseappot ovddideapmái sámegillii, erenoamážit hállanteknologiijas, dárbbašuvvo stuorát korpus go dálá korpus. Áiggi vuollái dat lea maid dehálaš dakkár goanstajierpmi ovddideapmái mii ádde sámegiela.

Dat resurssat mat leat čohkkejuvvon Romssa universitehtii, leat čohkkejuvvon sámi korpusii maid Sámediggi eaiggáduššá, ja maid Divvun Romssa universitehtas hálddaša. Dál čohkkejit dán korpusa eanaš Divvuma bargit dainna lágiin ahte sii systemáhtalaččat ohcet sámi teavsttaid neahtas ja dárogiel teavsttaid mat leat jorgaluvvon sámegillii (nu gohčoduvvon buohtalasteavsttaid). Almmolaš instánssain ii leat mihkkege formála teakstalágidemiid.

Lassin Divvuma sámegiel korpusii lea Nationálagirjeráju Giellabáŋkkus ráddjejuvvon hivvodat dáhtačoakkáldagat sámegillii mat leat fidnemis friija. Ráhkadeaddjit sáhttet friija viežžat vuođđoresurssaid ja čađahit innovašuvnna ja buvtta- ja bálvalusovddideami daid vuođul.

Norgga geatnegasvuođalágidanláhka lea medianeutrála, ja Nationálagirjeráju čoakkáldagas leat teavsttat ja hállan iešguđet hámiin: girjjit, áigečállagat, aviissat, áibmomediasáddagat, interneahtta jna. Sámi ávdnasat leat olahahttit seamma eavttuid vuođul go eará ávdnasat ge mat leat geatnegahttojuvvon lágiduvvot Nationálagirjerádjui, dat mearkkaša vuosttažettiin dutkama ja duođašteami várás, muhto olámuddu sáhttá viiddiduvvot šiehtadusaid bokte juohke vuoigatvuođalaččain.

Jáhkkimis lea nu ahte almmolašvuođas lea ollu eanet dáhta mii sáhttá geavahuvvot giellateknologiija ovddideapmái go dan maid suorgi ieš diehtá. Danne áigu ráđđehus leat mielde loktemin diehtomielalašvuođa gielladáhtaid ja giellaresurssaid birra almmolašvuođas. Kulturdepartemeanta ja Gielda- ja ođasmahttindepartemeanta leat ovttas geahčadišgoahtán guđe doaimmaheaddjit ja váikkuhangaskaoamit sáhttet leat mielde ráhkadeamen eanet giellateknologiija sámegillii. Gielda- ja ođasmahttindepartemeanta lea maid nannen Digitaliserendirektoráhta diehtohálddašanbirrasa resurssaiguin mat galget dagahit lagat ovttasbarggu vejolažžan Nationálagirjerájuin ja Giellaráđiin strategiijaid oktavuođas mat sihkkarastet ahte almmolaš giellaresurssat sáhttet geavahuvvot giellateknologalaš ulbmiliidda. Departemeanttat áigot joatkit gulahallama ja árvvoštallamiid das guđe doaibmabijut sáhttet leat guoskevaččat.

Boksa 4.1 Dutkanprošeakta «Maskinoversetting mellom samiske språk»

Dutkanráđi prográmma SAMISK III attii áigodagas 2014–2017 doarjaga dutkanprošektii «Maskinoversetting mellom samiske språk». Prošeavtta váldoulbmil lei ráhkadit doaibmi prográmma mášinjorgaleami várás davvisámegielas eará sámegielaide. Dat galggai maid addit ođđa áddejumi sámi komparatiiva syntávssas ja sátneriggodagas.

Prošeavtta boađus lea grammatihkkamodealla anárašgiela várás, mášinjorgalanprográmma davvisámegielas golmma eará sámegillii (lulli-, julev- ja anárašgillii) ja eksperimentála mášinjorgalanprográmmaid dáin gielain davvisámegillii. Jorgalanprográmmat leat integrerejuvvon prográmmagálvvuide dihtordorjojuvvon jorgaleami várás, ovttas eará veahkkeneavvuiguin, nu go buohtalas teakstačoakkáldagaiguin ja guovttegielat sátnelisttaiguin. Dasa lassin lea anárašgiela grammatihkkamodealla váldojuvvon atnui eará prográmmaide, nu go stávendárkkástussii ja e-sátnegirjjiide. Prográmmat leat buvttihan máŋga almmuheami, ja dat grammatihkkamodeallat ja prográmmat mat leat ráhkaduvvon, galget maid leat vuođđun eanet artihkkaliidda boahttevaš áiggi.

Juolgenohta

1.

META-NET, De Smedt, Lyse, Gjesdal ja Losnegaard (2012) Norsk i den digitale tidsalderen

Ovdasiidui