Denne siden finnes ikke på bokmål. Til bokmål forside

St.meld. nr. 35 (2007-2008)

Mål og meining

7.5 Språk og teknologi

7.5.1 Innleiing

Informasjons- og kommunikasjonsteknologien (IKT) set i stadig sterkare grad sitt preg på kvardagen vår, både i arbeid og fritid. Innanfor dei fleste samfunnssektorar er slik teknologi på god veg til å bli eit dominerande medium for skriftleg kommunikasjon. I tillegg fungerer IKT i seg sjølv som eit eige språkdomene.

7.5.1.1 Informasjonsmedium

Både som medium for informasjonsspreiing og som eige språkdomene er denne teknologien i utgangspunktet ein sentral innfallsport for engelskspråkleg påverknad og dermed også ein potensielt viktig premissleverandør for norsk språkutvikling. Samstundes kan teknologien også utnyttast aktivt som eit middel til å fremja prioriterte språkpolitiske mål.

Det er Internett som i dag er den raskast veksande kanalen for tekstbasert informasjonsformidling. Som verdsomfattande informasjonsmarknad er Internett samstundes det einaste massemediet der alle brukarane i prinsippet har tilgang til alt som er publisert.

Språkpolitisk er det difor eit viktig mål å leggja til rette for eit rikt utval av norskspråkleg kvalitetsinnhald på Internett, slik at eit norsk publikum har eit tilbod på sitt eige språk som kan hevda seg i konkurransen med det kvantitativt dominerande engelskspråklege innhaldet. Ikkje minst er det på Internett nødvendig å leggja meir arbeid og ressursar i å sikra eit godt tilbod av relevant nynorsk stoff.

7.5.1.2 Språkdomene

Når informasjons- og kommunikasjonsteknologien også kan definerast som eit eige språkdomene, er det fordi datamaskinen sjølv kommuniserer med brukarane gjennom språket. Med den aukande bruken av IKT blir dette språket i grensesnittet mellom maskin og menneske eit domene av særleg språkpolitisk interesse.

Det dreier seg om språk og språkbruk i alle dei dataprogramma som finst tilgjengelege på den kommersielle marknaden. I tillegg til dette kjem utvikling og bruk av alle slags produkt og tenester som byggjer på dataprogram som behandlar eller inkorporerer menneskeleg språk som eit basis­element i dei teknologiske løysingane. Eit felles kjenneteikn ved slike språkteknologiske innretningar er at dei kan etterlikna ulike sider ved den menneskelege språkevna. Det kan dreia seg om både taleteknologi og tekstorientert språkteknologi.

Anten det gjeld programvare til bruk på datamaskinen, eller nye språkteknologiske hjelperåder som vi kan tenkjast å ha nytte av i arbeid og fritid, er det avgjerande viktig at denne teknologien er tufta på vårt eige språk. Men avansert datateknologi har i utgangspunktet ein internasjonal marknad, og dei fleste dataprogramma blir som oftast utvikla først i ein engelsk versjon.

Også på den språkteknologiske marknaden går det føre seg ei rivande utvikling når det gjeld engelsk-baserte produkt og tenester. Dersom også norsk språk skal hevda stillinga si i det høgteknologiske framtidssamfunnet, må det difor byggjast opp ein språkteknologisk infrastruktur som kan skapa økonomisk grunnlag for utvikling av norskbaserte produkt og tenester.

7.5.2 Oppsummering av tidlegare ambisjonar og tiltak

7.5.2.1 «Bit for bit», rapport frå eit statssekretær­utval 1996

Alt for godt over ti år sidan, i ein rapport om de norske IT-vegen lagd fram av eit eige statssekretærutval i januar 1996, tok ein på politisk hald opp utfordringane for norsk språk og kultur i dei digitale romma.

Det vart formulert to politiske mål med direkte språkpolitisk relevans, for det første at norsk språk og norskspråkleg programvare må vera tilgjengeleg i digitale medium og kommunikasjonssystem, for det andre at styresmaktene bør satsa på norsk innhaldsproduksjon.

Rapporten slo fast at utanlandsk programvare burde omsetjast i tråd med norske definisjonar og språknormer for brukargrensesnitt.

Det vart streka under at stoff som statsinstitusjonar legg ut på datanett, til dømes på det felles informasjonssystemet for departementa, må oppfylla krava i lov om målbruk i offentleg teneste.

Det heitte også at hovudregelen for norske databasar til offentleg bruk må vera at ein skal kunna søkja både på bokmål og nynorsk, dessutan at også samisk språk må ivaretakast på tilfredstillande måte.

7.5.2.2 Handlingsplan for IT på kulturområdet 1997

Knapt to år seinare, i ein eigen handlingsplan for IT på kulturområdet som Kulturdepartementet la fram i september 1997, vart det slått fast at kampen om norsk språk kom til å gå føre seg på nye arenaer som er skapte av den informasjonsteknologiske utviklinga.

Det vart gjort framlegg om å oppretta eit sekretariat for språkteknologi som eit bindeledd mellom kultur- og forskingsmiljøa og IT-næringa. Sekretariatet skulle etter framlegget fungera som eit sent­ralt verkemiddel i arbeidet for at norsk språk kunne bestå som eit fullverdig og føretrekt uttrykksmiddel når vi arbeider med avansert språkteknologi og bruker produkt og tenester som er baserte på IT.

7.5.2.3 Språk og teknologi i målbruksmeldinga 1997

Hausten 1997 vart tanken om eit sekretariat for språkteknologi teken opp att i St.meld. nr. 13 (1997–98) om målbruk i offentleg teneste. Det heitte at ein ville vurdera om Norsk språkråd kunne bli eit slikt fagleg-administrativt knutepunkt for norsk språk og IT.

I meldinga vart det elles gjort greie for utford­ringane meir i detalj, og det vart slått til lyd for ein nasjonal innsats for bruk av norsk språk i informasjonssamfunnet. Det heitte at det trongst eit offensivt handlingsprogram der både juridiske, administ­rative, språkteknologiske og økonomiske verkemiddel blir tekne i bruk.

Meldinga slo fast at målet måtte vera å kunna gje både nynorsk- og bokmålsbrukarane gode reiskapar til støtte for språkbehandling og å tilby relevante informasjonstenester o.a. på begge målformer.

7.5.2.4 IKT-stillingar i Norsk språkråd i 2000

I statsbudsjettet for 2000 vart så Norsk språkråd tilført to nye stillingar for å vareta funksjonen som sekretariatet for språkteknologi slik som omtalt ovanfor. I budsjettframlegget heitte det at målet var at sekretariatet skulle bli eit fagleg-administrativt knutepunkt for norsk språk og IT.

7.5.2.5 Handlingsplan for norsk språk og IKT frå 2001

Etter dette bad Kulturdepartementet Norsk språkråd utarbeida ein handlingsplan for norsk språk og IKT. Planen vart lagd fram i ein endeleg versjon i juni 2001.

Handlingsplanen konsentrerte seg særleg om mål og tiltak for å leggja til rette for norskspråkleg programvare og norsk språkteknologi. Sentrale målformuleringar i planen var at mengda av norskspråkleg programvare måtte aukast, særleg programvare på nynorsk, og at norsk språkteknologi må tuftast på kunnskap om og forsking i norsk språk i form av bokmål, nynorsk og dialektar.

Av tilhøyrande tiltak var det særleg to som stod i framgrunnen.

Det eine var eit framlegg om at statlege styresmakter skulle innføra eit regelverk for offentlege innkjøp av vanleg programvare som kunna sikra at programma vart utvikla både i ein nynorsk- og ein bokmålsversjon.

Det andre var framlegget om å etablera ein norsk språkbank, dvs. ei samling av norske språkressursar i form av store mengder tekst og tale som er elektronisk lagra og tilrettelagde for ulike typar bruk og gjenbruk, særleg tenkt nytta til utvikling av språkteknologiske produkt på norsk.

Handlingsplanen inneheldt elles desse hovudmåla:

  1. I Noreg skal IKT-baserte produkt og tenester ha norskspråkleg brukargrensesnitt og vera tufta på kunnskapar om norsk tale og dei to skriftformene våre.

  2. Alle med norsk som morsmål skal ha lik tilgang til slike norskspråklege produkt og tenester og til å skaffa seg den kompetansen som krevst for å ha nytte av tilbodet.

  3. Mengda av norskspråkleg programvare må aukast, særleg programvare på nynorsk.

  4. Føresegnene i opplæringslova om språklege parallellutgåver av elektroniske læremiddel må oppfyllast i praksis.

  5. Norsk språkteknologi må tuftast på kunnskap om og forsking i norsk språk (bokmål, nynorsk og dialektar) og relevant teknologi.

  6. Noreg skal vera aktiv deltakar i det nordiske og vidare europeiske samarbeidet innanfor språkteknologi.

  7. Standardisert norsk IKT-terminologi må utvik­last og stillast til rådvelde.

  8. Noreg skal bidra til å styrkja erfaringsutvekslinga mellom språkorganisasjonane i Norden og elles i Europa om informasjons- og kommunikasjonsteknologiens innverknad på nasjonalspråka og om mottiltak for å halda språka i hevd også på dette området.

7.5.2.6 Utgreiinga om ein norsk språkbank frå 2002

Det sistnemnde framlegget førte til at Norsk språkråd i februar 2002 fekk i oppdrag av Kultur- og kyrkjedepartementet og Nærings- og handelsdepartementet å initiera og koordinera ei utgreiing om samling og tilgjengeleggjering av norske språkteknologiressursar.

Dette resulterte i ein rapport som vart lagd fram i oktober 2002. Her var konklusjonen at det ville kosta 100 mill. kroner fordelt over fem år å få på plass det minimum av språkressursar som skal til. Rapporten la dessutan til grunn at dette måtte finansierast tilnærma heilt ut med offentlege midlar.

I kulturmeldinga frå 2003, St.meld. nr. 48 (2002–2003) Kulturpolitikk fram mot 2014, vart det på dette grunnlag konkludert med at det dermed var lite realistisk å få realisert dette som eit samla prosjekt. Det heitte at det i staden måtte arbeidast vidare med saka i eit noko lengre tidsperspektiv.

Meldinga heldt altså fast ved målet om å byggja opp ein norsk språkbank.

7.5.2.7 Tiltak for å fremja nynorsk programvare

Når det gjaldt programvare, nemnde kulturmeldinga at det hadde vore vurdert om det offentlege gjennom ein samordna innkjøpspolitikk kunne stilla som krav at aktuell programvare skal liggja føre både på nynorsk og bokmål før det kan kjøpast inn av statlege eller kommunale organ eller i skuleverket.

I meldinga heitte det at ein førebels ikkje hadde funne tenlege mekanismar for å få dette til. Det vart i den samanhengen vist til at ein frå 1. januar 2003 var i ferd med å avvikla dei sentrale rammeavtalane for offentlege innkjøp. I tråd med dette skulle det vera eit overordna prinsipp at offentlege innkjøp i utgangspunktet skulle vera eit desentralisert ansvar.

I meldinga vart det likevel konkludert med at departementet ville vurdera om det var tenlege verkemiddel som bør takast i bruk for å understøtta utviklinga av nynorsk programvare og andre mekanismar som kan hindra diskriminering av nynorsk i samband med teknologisk basert språkbruk.

Det heitte også at det burde utgreiast om det kan gjerast lov- og forskriftsendringar for å sikra norske arbeidstakarar og forbrukarar norsk grensesnittspråk i meny-, styre- og hjelpetekstar i elekt­roniske apparat, maskinar og liknande og norsk språk i brukarrettleiingar og annan dokumentasjon for slikt utstyr og på all emballasje og i all merking der språket har noko å seia for helse, miljø og tryggleik.

7.5.2.8 Nynorsk innhald på Internett

Kulturmeldinga tok også til orde for at det i åra framover måtte takast eit krafttak for reell likestilling mellom nynorsk og bokmål også i teknologibasert språkproduksjon og språkkommunikasjon, mellom anna ved å arbeida for eit meir fullverdig tilbod av nynorsk programvare og for tilgang til nynorsk innhald på Internett.

7.5.2.9 Parallellsøk

Ei anna sak som vart nemnd spesielt i kulturmeldinga, var problemet med gjenfinning av digitale tekstar og dokument på tvers av målform.

Problemet består i at dei ordinære søkjefunksjonane i dag ikkje er slik innretta at ein ved søk på eit ord i bokmålsform også får treff for dei tilsvarande nynorskformene og omvendt.

I dei elektroniske arkiv- og saksbehandlingssystema som no er tekne i bruk i sentralforvaltninga, har dette ført til at ein har innført eit uoffisielt påbod om at alt skal registrerast på bokmål for at det skal vera søkbart.

Som det også er slått fast i kulturmeldinga, er eit slikt forbod mot registrering på nynorsk direkte i strid med likeverdsprinsippet i lov om målbruk i offentleg teneste.

Problemet kan løysast ved at det blir utvikla og teke i bruk ein språkmodul som lenkjer saman bokmåls- og nynorskformer slik at det lèt seg gjera å gjennomføra parallellsøk.

7.5.3 Tilgang til norsk programvare i begge målformer

Det har i mange år vore eit krav at staten må bruka marknadsmakta si til å stilla krav om at programvare som det offentlege kjøper inn, skal liggja føre i både nynorsk- og bokmålsversjon. Eit slikt verkemiddel kunne også tenkjast brukt for å sikra norskspråkleg programvare uavhengig av målform og å krevja eit visst minimum av språkleg kvalitet i programvaren. Begge delar er drøfta i Norsk i hundre!

Tanken har vore at eit slikt verkemiddel måtte byggjast inn som eit element i den offentlege innkjøpspolitikken, men omlegginga i retning av desentraliserte innkjøpsavtalar under Bondevik II-regjeringa gjorde at ein i kulturmeldinga frå 2003 konkluderte med at grunnlaget for eit samla offentleg marknadskrav ikkje lenger var til stades.

Departementet har seinare teke opp att saka med Fornyings- og administrasjonsdepartementet med sikte på oppdaterte vurderingar av det omtalte verkemidlet og eventuelle alternative tiltak for å sikra eit meir fullverdig tilbod av nynorsk programvare.

Til illustrasjon kan nemnast at det i stortingsmeldinga om IKT-politikken fremja av Fornyings- og administrasjonsdepartementet i desember 2006 heiter at regjeringa vil vurdera vilkåra for å kunna føra ein preferansepolitikk for open kjeldekode. 1 Førebels resultat tyder likevel på at det er avgrensa rom for å nytta anskaffingsregelverket til å fremja samfunnsnyttige formål som ikkje er direkte grunngjeve i eit sakleg behov hos kjøparen. Det same vil truleg gjelda for språkkrav slik som nemnt ovanfor.

Eit alternativ departementet vil vurdera, er å styrkja eller byggja ut relevante føresegner i språklovgjevinga, til dømes slik at krav til målform i programvare til bruk i det offentlege kan forankrast i målbruksreglane. Departementet vil vurdera dette i samband med gjennomgangen av målbruks­reglane, jf. kap. 3.4.4.7.

Tilsvarande reglar som dei ein her kunne tenkja seg, finst i lovverket frå før, jf. føresegna i opplæringslova om at det i andre fag enn norsk berre kan brukast lærebøker og andre læremiddel som ligg føre på bokmål og nynorsk til same tid og same pris. 2 I forskrift til denne føresegna har Kunnskapsdepartementet fastsett reglar som inneber at programvare som elevane skal nytta i undervisninga, er omfatta av den nemnde lovregelen, dvs. at slik programvare skal liggja føre på begge målformer.

Ved offentlege innkjøp er det elles slik at ein offentleg oppdragsgjevar som skal kjøpa inn programvare, kan presisera i kravspesifikasjonen at programvara skal liggja føre på både bokmål og nynorsk, til dømes slik at ein krev ordlister i begge målformer. Departementet vil oppmoda alle offentlege innkjøparar av programvare til å nytta det handlingsrommet dei på denne måten har til å stilla språklege krav til leverandøren.

Det må elles nemnast at regjeringa i april 2008 har fremja forslag til lov om forbod mot diskriminering av personar med nedsett funksjonsevne, jf. Ot.prp. nr. 44 (2007–2008). Her er det mellom anna eit pålegg om universell utforming av alle IKT-løysingar retta mot allmenta. Påbodet gjeld for all ny IKT frå 2011 og skal handhevast ved hjelp av standardar og sentrale retningslinjer.

Ei mogleg tolking av universell utforming av IKT er å krevja at grensesnitta overfor brukarane skal vera på norsk. Departementet vil i det vidare arbeidet vurdera korleis ein på sikt kan få innarbeidt standardar for tilhøvet mellom språk og tilgjengelegheit.

I spesielle tilfelle kan det også vera aktuelt å vurdera kva som eventuelt kan gjerast for å leggja betre til rette for omsetjing av fri programvare til nynorsk.

7.5.4 Revisjon av handlingsplanen for språk og IKT

I Norsk i hundre! er det gjort framlegg om at handlingsplanen for norsk språk og IKT frå 2001 må leggjast til grunn for arbeidet med ein politikk for språk og teknologi.

Departementet vil ta initiativ til å få laga ein oppdatert plan for eit meir systematisk og samordna arbeid med språk og teknologi. For dette formålet vil det mellom anna bli sett ned eit permanent interdepartementalt utval til å koordinera dette saksfeltet. Føresetnaden er at dette utvalet skal arbeida i nær kontakt med det fagrådet i Språkrådet som har språk og teknologi som ein del av ansvars- og arbeidsområdet sitt.

Både før og etter at planen vart lagd fram, har det vore arbeidt meir substansielt særleg med to spørsmål. Det eine er korleis staten kan bruka mark­nadsmakta si til å syta for at dei vanlege dataprogramma skal vera å få både i ein nynorsk- og ein bokmålsversjon. Det andre er korleis ein skal gå fram for å få bygd opp ein såkalla språkbank.

7.5.5 Ein norsk språkbank

7.5.5.1 Språkteknologi

Bakgrunnen for arbeidet med ein norsk språkbank er dei teknologiske framtidsutsiktene som opnar seg, og dei språkpolitiske utfordringane som reiser seg gjennom moderne språkteknologi.

Språkteknologi er ein tverrfagleg forskings­disiplin der språkvitskap og datavitskap møtest. Det handlar om utvikling av dataprogram med språkmodular som behandlar menneskeleg språk. Dette kan vera program som kan køyrast på ein datama­skin, men også program som kan byggjast inn i moderne tekniske innretningar.

Språkteknologi omfattar to hovuddelar, datalingvistikk og taleteknologi. Datalingvistikk byggjer på analyse av skrivne tekstar, medan taleteknologi handlar om databehandling av menneskeleg tale, både omforming av naturleg tale til tekst og tekst til kunstig tale. Taleteknologien gjer det mellom anna mogleg å styra maskinar med røysta.

Språkteknologi forenklar og betrar kommunikasjonen mellom menneske og maskin og kan også fungera som eit hjelpemiddel i kommunikasjon menneske imellom. I kvardagen kan språkteknologien vera med og effektivisera arbeidsprosessar.

7.5.5.2 Døme på språkteknologiske løysingar i praktisk bruk

Det er språkteknologiske løysingar som ligg til grunn for den intelligente ordboka som gjer oss i stand til å skriva raske tekstmeldingar på mobiltelefonen, som gjer at eit automatisk sentralbord kan forstå kva vi bed om, og som gjev oss automatisk stave- og grammatikkontroll i tekstbehandlingsprogramma på datamaskinen.

Språkteknologiske løysingar er i bruk i navigasjonssystema i moderne bilar, i styring av vaskemaskiner og alarmar.

Når vi søkjer på nettet, finst intelligente søkjesystem som tolkar det vi er ute etter, for å gje oss eit best mogleg svar. Det finst program som støttar omsetjing av tekst, til dømes til bruk ved teksting av film og anna tekstomsetjing, dessutan program som kan laga samandrag av tekstar, og som kan rangera relevante data frå ulike dokument.

Døgnopen forvaltning føreset at offentlege skjema og annan informasjon er tilgjengelege på Internett døgnet rundt, og at dei er lagde til rette for interaktiv bruk. Ulike språkteknologiske løysingar gjer at brukaren kan velja mellom å lesa og å lytta, og om han vil fylla ut skjemaet med tastatur eller stemme.

Språkteknologiske løysingar kan i høg grad vera med å på å overvinna ulike funksjonshinder. Ved hjelp av språkteknologiske metodar kan ein til dømes utvikla taleprotese til personar som manglar taleevne.

Språkteknologiske løysingar kan også vera til hjelp for dei som har lese- og skrivevanskar, og for personar som er synshemma.

Menneske med nedsette funksjonsevner som ikkje kan skriva sjølve, kan snakka til ein pc, som så set talen om til tekst. Ein pc kan styrast med stemma i staden for skrivne kommandoar, og tekst kan sendast til ein mottakar som sjølv avgjer om han vil lesa eller få teksten lesen opp for seg.

Slik sett er språkteknologi med på å leggja til rette for auka demokratisk deltaking i samfunnet mellom anna ved å gjera informasjon og tenester tilgjengelege for alle.

I eit høgteknologisk samfunn er det mange arbeidsoppgåver som kan forenklast og effektiviserast ved hjelp av språkteknologi. I framtida vil det berre vera fantasien som set grenser for kva slik teknologi kan nyttast til. Enno står likevel ein del grunnleggjande teknologisk utviklingsarbeid att å gjera, mellom anna når det gjeld utvikling av ei kunstig stemme som mest mogleg perfekt kan etterlikna naturleg tale.

7.5.5.3 Teknologiutvikling og språkversjonar

Språkteknologi er altså tufta på ein kombinasjon av språk og teknologi. Teknologien er i prinsippet nøytral, og dei same teknologiske løysingane kan difor brukast verda over. Annleis er det med dei språklege ingrediensane. Dei må skiftast ut dersom dei teknologiske løysingane skal kunna materialisera seg i ulike språkversjonar. Dette er ein føresetnad dersom potensielle brukarar skal kunna få tilgang til teknologien på sitt eige språk.

Dette skjer ikkje automatisk, og faren er i høg grad til stades for at marknadsvilkåra for språkteknologisk produktutvikling og omsetning kan fungera som ei drivkraft i ei utvikling som går i retning av at dei dominerande språka, først og fremst engelsk, styrkjer seg jamt meir på kostnad av dei mange små og mellomstore nasjonalspråka verda over.

Også når det gjeld språkteknologiske produkt, er det kommersielle og til dels militære aktørar i den engelskspråklege verda som er dei leiande produktutviklarane. Det skjer rett nok at desse også utviklar løysingar for andre språk enn engelsk, men det er sjeldan at eit språk som norsk blir rekna for eit relevant språk i denne samanhengen.

Til dømes kan det nyaste talebaserte omsetjingssystemet Phraselator P2 frå det amerikanske industriselskapet Voxtec omsetja mellom 44 ulike språk, inkludert hovudspråket i land som Irak, Iran og Afghanistan, men norsk er for tida ikkje med blant dei tilgjengelege språkmodulane.

Eit anna amerikansk selskap, Powerset, utviklar for tida ein lingvistisk basert søkjemotor som skal gje meir presise søkjeresultat ved intelligent søking på verdsveven og i store tekstdatabasar. Ironisk nok blir mellom anna norsk teknologi brukt i utvikling av søk i engelskspråklege tekstar, og søkjemotoren skal etter kvart tilpassast fleire andre språk, men heller ikkje her ligg det føre planar om ein norsk modul.

Mange språkteknologiske produkt og tenester har alt lenge vore tilgjengelege på den internasjonale marknaden, men totalt sett er det lite av dette som finst tilgjengeleg i norskspråkleg versjon.

Det er også mange språkteknologiske produkt som finst berre på engelsk, særleg dei mest avanserte.

7.5.5.4 Språkteknologi utan norske språkversjonar

Dersom vi i Noreg skal få full nytte av alle slags språkteknologiske hjelperåder, må dei teknologiske løysingane tuftast på norskspråklege versjonar. Då kan språkteknologien vera med å styrkja det norske språket og den norske kulturen. Vi har bruk for alle aktuelle og framtidige språkteknologiske løysingar, og vi har behov for dei på norsk.

Dersom vi i liten grad maktar å leggja til rette for norskspråklege versjonar, kan vi sjå føre oss fleire uheldige konsekvensar.

Dels vil resultatet kunna bli at mange språkteknologiske produkt eller tenester i liten grad blir tekne i bruk på den norske marknaden.

Dels kan det vera at ikkje alle vil sjå seg i stand til å bruka dei engelskspråklege produkta. For all røynsle tilseier at det først er når brukarane kan nytta morsmålet sitt, at alle slike teknologiske løysingar i realiteten blir tilgjengelege for alle.

Utan norskspråklege versjonar vil altså mange av dei nye teknologisk avanserte løysingane bli mindre tilgjengelege for nordmenn enn for dei som har engelsk som morsmål.

Det er også ein fare for at produkt og tenester som vil koma i norsk språkdrakt, vil ha dårlegare språkleg kvalitet enn dei tilsvarande engelske utgåvene.

Men i stor grad må vi rekna med at nordmenn flest vil ta i bruk engelskbaserte produkt, og i den grad det skjer, er vi på god veg mot eit alvorleg domenetap for norsk språk. Sett i eit språkpolitisk perspektiv er det dette siste som er den mest alvorlege konsekvensen.

Alt i kulturmeldinga frå Bondevik II-regjeringa frå 2003 vart det peikt på alvoret i dette:

Skjer ikkje slik norskspråkleg produktutvikling, må ein rekna med at det vert teke i bruk engelskspråklege produkt i staden. Her ligg truleg ei av dei store utfordringane for norsk språk i tida framover. Difor framstår dette no som eit viktig kulturpolitisk spørsmål. Språkteknologifeltet kan vera ein av dei fremste arenaene der kampen om norsk språk og kultur vil utspela seg i tida framover. 3

7.5.5.5 Føresetnader for utvikling av norske språkversjonar

Det går i dag føre seg arbeid for å utvikla til dømes dikteringsprogramvare for norsk, automatisk omsetjingssystem mellom norsk og engelsk, automatiske sentralbord og ulike telefoninformasjonstenester og system for talestyring. Men utvikling av norske modular for tekstsøking, taleanalyse og talesyntese, omsetjing og andre bruksmåtar er kostbart.

Ein stor del av desse kostnadene går til innsamling, koding og ulike former for nødvendig foredling av datagrunnlaget, dvs. relevant språkmateriale på norsk. Forsking og produktutvikling kunne skjedd monaleg raskare og billigare ved hjelp av ein påliteleg, stor, detaljert, kvalitetssikra og permanent database av norske språkressursar der dei ressursane som trongst, var tilgjengelege for bruk og gjenbruk.

Tilgangen på slike digitaliserte språkressursar i form av tekstsamlingar, talesamlingar og leksikalske data har vist seg å vera den kritiske innsatsfaktoren for å utvikla kommersielt lønnsame produkt. Det å samla inn og å koda slike språkressursar er etter måten ressurskrevjande, særleg dersom det må gjerast i kvart enkelt tilfelle eller av kvar enkelt aktør. Dette slår sterkare ut di mindre den kommersielle marknaden er, og di mindre forskingsbudsjett det er tale om.

Sjølve ideen med ein norsk språkbank er å etablera ei felles nasjonal ressurssamling av elektronisk lagra språkmateriale til bruk i ulike språkteknologiske løysingar. I ei slik ressurssamling vil det vera behov for millionar av ord i form av tekst og tale. Det vil vera behov for tale på ulike dialektar og av menneske i ulike aldrar og av begge kjønn. Han må også innehalda leksikalsk materiale og elektroniske ordbøker. Ulike brukargrupper skal kunna henta ut og gjera seg nytte av det dei måtte trenga av digitalisert språkmateriale.

Ein språkbank utgjer grunnlaget for å kunna utvikla programvare og språkteknologiske produkt på norsk både for dagen i dag og for framtida.

I tillegg til dette vil ein norsk språkbank også utgjera sjølve hjørnesteinen i språkteknologisk forsking. Å få på plass ein norsk språkbank er dermed også føresetnaden for å kunna gjennomføra avansert forsking i norsk språk.

7.5.5.6 Røynsler frå forskingsprogrammet KUNSTI

Langsiktig kunnskapsutvikling gjennom språkteknologisk forsking tufta på norsk språk har i sin tur mykje å seia for å støtta opp under seinare produktutvikling. Ein norsk språkbank vil tena som eit forskingsverktøy som i neste omgang vil generera meir forsking og nye og betre produkt og tenester.

Noregs forskingsråd brukte i perioden 2001–2006 om lag 70 mill. kroner til det store språkteknologiske programmet Kunnskapsutvikling for norsk språkteknologi (KUNSTI). Formåla var for det første å styrkja grunnforsking og kompetanse innanfor relevante fag som til dømes datalingvistikk, taleteknologi og aktuelle område innanfor informatikk/informasjonsvitskap, fonetikk og formell lingvistikk. For det andre var det eit formål å støtta forsking og utvikling med sikte på å gjera talt og skriven norsk og samisk tilgjengeleg for datamaskinell prosessering.

Men mangel på relevante språkressursar viste seg å vera eit problem for mange av prosjekta i KUNSTI. Til dels måtte det brukast tid og ressursar på å samla inn og utvikla nødvendig infrastruktur i form av språkressursar før ein kunne starta med sjølve forskingsarbeidet.

Til dømes kunne eit prosjekt som arbeidde med maskinomsetjing mellom norsk og engelsk, det såkalla LOGON-prosjektet, ha kome mykje lenger dersom prosjektet hadde hatt tilgang til språkressursar som viser grammatiske korrespondansar mellom norske tekstar og engelske omsetjingar. Ein slik ressurs, som er eit viktig grunnlag for optimalisering av omsetjingssystem, er under oppbygging for mellom anna engelsk-tysk-svensk, men ikkje for norsk.

Alt i alt vart resultatet i KUNSTI-programmet at ein hadde mindre ressursar å bruka til dei primære forskingsoppgåvene. Dette førte i sin tur at til uheldige justeringar av innretning og ambisjonsnivå i fleire av prosjekta. Samla sett måtte ambisjonane for heile programmet endrast. Bakgrunnen var at ein ved planlegging av programmet hadde lagt til grunn at arbeidet med å byggja opp språkbanken ville koma i gang samstundes med programmet.

7.5.5.7 Språkteknologiske fagmiljø og forsking i Noreg

Dei språkteknologiske fagmiljøa i Noreg er konsentrerte til Oslo, Bergen og Trondheim. Det blir dessutan arbeidt med samisk språkteknologi i Tromsø. Det er eit visst samarbeid mellom dei ulike stadene, i alle fall innanfor universiteta. Enkelte store private forskings- og utviklingsmiljø, til dømes SINTEF og Telenor, samarbeider også med universitetsmiljøa.

Universitetsmiljøa utfyller kvarandre når det gjeld språkteknologiske spesialitetar.

I Oslo arbeider ein mest med maskinomsetjing, digitale ordbøker og noko tekstlingvistikk.

I Bergen er det særleg store tekstsamlingar, ein del datalingvistikk og terminologiarbeid som står sterkt.

Miljøet i Trondheim er mest kjent for arbeidet med tale og lyd, men også her blir det arbeidt med datalingvistikk.

Den språkteknologiske kompetansen er høg jamvel om miljøa er små. Internasjonalt sett held såleis norske språkteknologiske fagmiljø eit høgt nivå. Dette er kompetanse som vi må utnytta.

Noreg har som ambisjon å vera eit kunnskapssamfunn som utviklar og bruker avansert teknologi der vi kan. Vi ønskjer å vera verdsleiande og satsa på innovasjon og utvikling. Men det står meir på spel enn ein berekraftig kunnskapsindustri. Det gjeld også å slå vakt om den norske språk- og kulturarven.

7.5.6 Vidare arbeid med etablering av ein norsk språkbank

7.5.6.1 Behovet for ein norsk språkbank

Det er ingen andre enn Noreg som vil utvikla språkteknologi på norsk. Det er store voner til utnytting av språkteknologi innanfor mange område både i næringslivet og offentleg sektor. Både i europeisk og i nordisk samanheng tek ein sikte på å oppretta ein forskingsinfrastruktur og eit samarbeid som integrerer tilgjengelege språkressursar. Oppbygging og kvalitetssikring av nasjonale ressursar vil likevel vera ei nasjonal oppgåve.

Ein norsk språkbank er eit viktig språkpolitisk tiltak for å styrkja norsk språk i ei global språkutvikling der små språksamfunn er utsette for aukande press. Språk er dessutan den fremste beraren av kulturell identitet, og satsing på ein norsk språkbank er difor eit vesentleg og vidfemnande kulturtiltak i vår tid.

I tillegg vil etablering og oppbygging av ein språkbank leggja til rette for nærings- og teknologiutvikling, forsking og undervisning, effektivisering av forvaltninga og for språk og kultur. Jamvel om Kultur- og kyrkjedepartementet har ansvar for språkpolitikken, vil tiltaket også vedkoma ansvarsområdet til fleire andre departement, i første rekke Fornyings- og administrasjonsdepartementet, Kunnskapsdepartementet og Nærings- og handelsdepartementet.

Dei norske språkteknologiske fagmiljøa står samla bak eit ønske om at det blir etablert ein norsk språkbank. Både forskingspolitiske, næringspolitiske, ikt-politiske og språkpolitiske omsyn tilseier difor no at vi kjem i gang med å byggja opp den teknologiske infrastrukturen som ein norsk språkbank vil representera.

7.5.6.2 Ein norsk språkbank skal etablerast

Regjeringa har som mål i dei næraste åra å få bygd opp ein norsk språkbank. Dette er det største enkeltståande tiltaket som blir varsla i denne meldinga.

I brev av 6. mai 2008 har departementet bedt Språkrådet gå i gang med å førebu den formelle etableringa av språkbanken frå 1. januar 2009. Departementet har for dette formålet bedt Språkrådet setja ned ei arbeidsgruppe som innan 15. august 2008 skal skissera ein plan for korleis etab­leringa kan skje.

Denne planen skal mellom anna visa kva personellressursar og kostnader språkbanken vil krevja det første driftsåret, og korleis språkbanken kan organiserast. Gruppa har også fått i oppdrag å skissera ein realistisk strategi og opptrappingsplan for perioden 2010–2014.

Det er streka under i brevet at gjennomføringa av tiltaket vil vera avhengig av og til kvar tid vil måtta tilpassast den aktuelle budsjettsituasjonen.

Språkbanken vil bli bygd opp over ein periode på fem–seks år, før han går inn i ein drifts- og vedlikehaldsfase.

Kultur- og kyrkjedepartementet vil i nært samarbeid med Kunnskapsdepartementet, Fornyings- og administrasjonsdepartementet og Nærings- og handelsdepartementet avklara organisering og finansiering av språkbanken.

7.5.6.3 Innhaldet i ein norsk språkbank

Språkbanken skal vera ein stor, samla, nasjonal språkressurs som er kvalitetssikra og bygd opp etter internasjonale standardar.

Frå før finst det spreidde ressursar i form av norske tekst- og talekorpus, ord- og termbasar, grammatikkar osv. Alt i alt er desse for små eller for lite detaljerte. Dessutan er dei i liten grad kvalitetssikra; dei er ikkje samla under eitt, dei er lite kompatible, og dermed er dei alt i alt vanskeleg tilgjengelege for aktuelle forskingsmiljø.

Rapporten frå 2002, som er omtalt under kap. 7.5.2.6 ovanfor, inneheld ei kartlegging av då­verande språkressursar og ei vurdering av kva type ressursar som det var nødvendig å byggja opp frå grunnen av.

Etter 2002 er dessutan ein del nye ressursar bygde opp og tekne vare på ved universiteta, mellom anna i samband med det nemnde KUNSTI-programmet.

Ei ny kartlegging av eksisterande ressursar ved universiteta og hos interesserte industriaktørar må til for å avklara kva språkressursar som elles kan vera aktuelle å ta inn i språkbanken, og kva som må byggjast opp frå grunnen av. Dette vil vera ein viktig del av det arbeidet som skal gjerast av den gruppa som Språkrådet har fått ansvaret for å setja ned. Kartlegginga må også omfatta den rettslege statusen til ressursane med omsyn til bruken.

Eit materiale som alt er sikra for språkbanken, er dei språkressursane som vart bygde opp av Nordisk Språkteknologi Holding (NST) på Voss. I perioden 1998–2000 utvikla dette selskapet talesyntese, talegjenkjenning og diktering for norsk, svensk og dansk i samarbeid med andre selskap, mellom andre IBM.

Selskapet samla inn og lagra ei rekkje språkressursar til bruk i produktutviklinga. Desse språkressursane omfatta taledata, leksikalske data, tekstsamlingar og applikasjonsdata. Mellom anna vart det lagt ned eit stort arbeid for å samla inn og lagra opptak av norske dialektar. NST gjekk konkurs i 2003.

Ein gjennomgang av dette materialet har vist at særleg dei akustiske basane i språkmaterialet er i god stand og godt eigna for gjenbruk. Innhaldet er utvikla systematisk, følgjer same mal, og internasjonale standardar er nytta i den grad dei fanst.

I januar 2007 vart språkressursane frå konkursbuet til NST sikra for ein framtidig språkbank gjennom eit samla oppkjøp i regi av Språkrådet, universiteta i Oslo, Bergen og Trondheim og IBM. I påvente av etablering av språkbanken er det danna eit interimsstyre for å ta hand om språkressursane. Når språkbanken er oppretta, kan ressursane overførast til språkbanken, og interimsstyret vil kunna avviklast.

7.5.6.4 Kostnadsspørsmålet

Konklusjonen i rapporten frå 2002 var at det ville kosta om lag 100 mill. kroner fordelt over fem år å få på plass det minimum av språkressursar som skal til for å få ein fullverdig norsk språkbank.

Sidan 2002 har teknologien gått framover, og det har skjedd ei viss internasjonal standardisering. Dette gjer at utgiftene til nyinnsamling og tilrettelegging truleg kan reduserast noko.

Den gjennomgangen som arbeidsgruppa i regi av Språkrådet skal gjera, vil elles gje eit betre grunnlag for etter kvart å koma fram til eit oppdatert overslag over kva investeringar som krevst.

Det er sjølve etableringa av språkbanken og oppbygginga av språkressursane som representerer det store kostnadslyftet.

Investerings- og grunnlagskostnadene i samband med innsamling av dei digitaliserte språkressursane er ikkje mindre for eit lite språk enn for eit stort. Det kostar om lag det same å etablera og halda ved like den nødvendige infrastrukturen for språkteknologi uavhengig av kva språk det gjeld. Norsk språk har få brukarar å fordela kostnadene på og ein liten marknad å selja i.

Å etablera ein norsk språkbank vil likevel kosta mindre dei første par åra og kosta meir midtvegs og mot slutten. Deretter vil ein gå over til vanleg drift med vedlikehald og generell utvikling. Her vil det vera tale om årlege kostnader til lønn for to–tre personar og eit avgrensa behov for utstyr. Noko av driftsutgiftene kan dekkjast gjennom brukaravgifter.

7.5.7 Oppsummering av prioriterte tiltak

  • 1 Departementet vil byggja opp ein norsk språkbank og Språkrådet har oppdraget å leia arbeidet med å førebu organiseringa og den vidare oppbygginga av språkressursar.

  • 2 Departementet vil gje Språkrådet i oppdrag å revidera og oppdatera handlingsplanen for Norsk språk og IKT frå 2001.

  • 3 Departementet vil ta initiativ til å setja ned eit permanent interdepartementalt utval for språk og teknologi.

  • 4 Departementet vil i samråd med Fornyings- og administrasjonsdepartementet leggja til rette for at viktig programvare til bruk i det offent­lege i størst mogleg grad skal finnast tilgjengeleg i begge målformer.

  • 5 Departementet vil ta initiativ til å få utvikla nødvendige programmodular for parallellsøk mellom bokmål og nynorsk til bruk i interne arkiv- og saksbehandlingssystem og ved Internett-søk.

1

St.meld. nr. 17 (2006–2007), s.129, tiltak 7.11.

2

Lov 17. juli 1998 nr. 61 om grunnskolen og den vidaregåande opplæringa, § 9-4 første ledd.

3

St.meld. nr. 48 (2002–2003), kap. 12.9, s. 196.