7.5.1 Innleiing
Informasjons- og kommunikasjonsteknologien (IKT) set i stadig
sterkare grad sitt preg på kvardagen vår, både
i arbeid og fritid. Innanfor dei fleste samfunnssektorar er slik
teknologi på god veg til å bli eit dominerande
medium for skriftleg kommunikasjon. I tillegg fungerer IKT i seg
sjølv som eit eige språkdomene.
7.5.1.1 Informasjonsmedium
Både som medium for informasjonsspreiing og som eige
språkdomene er denne teknologien i utgangspunktet ein sentral
innfallsport for engelskspråkleg påverknad og
dermed også ein potensielt viktig premissleverandør
for norsk språkutvikling. Samstundes kan teknologien også utnyttast
aktivt som eit middel til å fremja prioriterte språkpolitiske
mål.
Det er Internett som i dag er den raskast veksande kanalen for
tekstbasert informasjonsformidling. Som verdsomfattande informasjonsmarknad er
Internett samstundes det einaste massemediet der alle brukarane
i prinsippet har tilgang til alt som er publisert.
Språkpolitisk er det difor eit viktig mål å leggja
til rette for eit rikt utval av norskspråkleg kvalitetsinnhald
på Internett, slik at eit norsk publikum har eit tilbod
på sitt eige språk som kan hevda seg i konkurransen
med det kvantitativt dominerande engelskspråklege innhaldet.
Ikkje minst er det på Internett nødvendig å leggja
meir arbeid og ressursar i å sikra eit godt tilbod av relevant
nynorsk stoff.
7.5.1.2 Språkdomene
Når informasjons- og kommunikasjonsteknologien også kan
definerast som eit eige språkdomene, er det fordi datamaskinen
sjølv kommuniserer med brukarane gjennom språket.
Med den aukande bruken av IKT blir dette språket i grensesnittet mellom
maskin og menneske eit domene av særleg språkpolitisk
interesse.
Det dreier seg om språk og språkbruk i alle
dei dataprogramma som finst tilgjengelege på den kommersielle
marknaden. I tillegg til dette kjem utvikling og bruk av alle slags
produkt og tenester som byggjer på dataprogram som behandlar
eller inkorporerer menneskeleg språk som eit basiselement
i dei teknologiske løysingane. Eit felles kjenneteikn ved
slike språkteknologiske innretningar er at dei kan etterlikna
ulike sider ved den menneskelege språkevna. Det kan dreia
seg om både taleteknologi og tekstorientert språkteknologi.
Anten det gjeld programvare til bruk på datamaskinen,
eller nye språkteknologiske hjelperåder som vi
kan tenkjast å ha nytte av i arbeid og fritid, er det avgjerande
viktig at denne teknologien er tufta på vårt eige
språk. Men avansert datateknologi har i utgangspunktet
ein internasjonal marknad, og dei fleste dataprogramma blir som
oftast utvikla først i ein engelsk versjon.
Også på den språkteknologiske marknaden
går det føre seg ei rivande utvikling når
det gjeld engelsk-baserte produkt og tenester. Dersom også norsk
språk skal hevda stillinga si i det høgteknologiske
framtidssamfunnet, må det difor byggjast opp ein språkteknologisk
infrastruktur som kan skapa økonomisk grunnlag for utvikling
av norskbaserte produkt og tenester.
7.5.2 Oppsummering av tidlegare ambisjonar
og tiltak
7.5.2.1 «Bit for bit»,
rapport frå eit statssekretærutval 1996
Alt for godt over ti år sidan, i ein rapport om de norske
IT-vegen lagd fram av eit eige statssekretærutval i januar
1996, tok ein på politisk hald opp utfordringane for norsk
språk og kultur i dei digitale romma.
Det vart formulert to politiske mål med direkte språkpolitisk
relevans, for det første at norsk språk og norskspråkleg
programvare må vera tilgjengeleg i digitale medium og kommunikasjonssystem, for
det andre at styresmaktene bør satsa på norsk innhaldsproduksjon.
Rapporten slo fast at utanlandsk programvare burde omsetjast
i tråd med norske definisjonar og språknormer
for brukargrensesnitt.
Det vart streka under at stoff som statsinstitusjonar legg ut
på datanett, til dømes på det felles informasjonssystemet
for departementa, må oppfylla krava i lov om målbruk
i offentleg teneste.
Det heitte også at hovudregelen for norske databasar
til offentleg bruk må vera at ein skal kunna søkja
både på bokmål og nynorsk, dessutan at
også samisk språk må ivaretakast på tilfredstillande
måte.
7.5.2.2 Handlingsplan for IT på kulturområdet 1997
Knapt to år seinare, i ein eigen handlingsplan for IT på kulturområdet
som Kulturdepartementet la fram i september 1997, vart det slått
fast at kampen om norsk språk kom til å gå føre
seg på nye arenaer som er skapte av den informasjonsteknologiske
utviklinga.
Det vart gjort framlegg om å oppretta eit sekretariat
for språkteknologi som eit bindeledd mellom kultur- og
forskingsmiljøa og IT-næringa. Sekretariatet skulle
etter framlegget fungera som eit sentralt verkemiddel
i arbeidet for at norsk språk kunne bestå som
eit fullverdig og føretrekt uttrykksmiddel når
vi arbeider med avansert språkteknologi og bruker produkt
og tenester som er baserte på IT.
7.5.2.3 Språk og teknologi i målbruksmeldinga 1997
Hausten 1997 vart tanken om eit sekretariat for språkteknologi
teken opp att i St.meld. nr. 13 (1997–98) om målbruk
i offentleg teneste. Det heitte at ein ville vurdera om Norsk språkråd kunne
bli eit slikt fagleg-administrativt knutepunkt for norsk språk
og IT.
I meldinga vart det elles gjort greie for utfordringane
meir i detalj, og det vart slått til lyd for ein nasjonal
innsats for bruk av norsk språk i informasjonssamfunnet.
Det heitte at det trongst eit offensivt handlingsprogram der både
juridiske, administrative, språkteknologiske
og økonomiske verkemiddel blir tekne i bruk.
Meldinga slo fast at målet måtte vera å kunna gje
både nynorsk- og bokmålsbrukarane gode reiskapar
til støtte for språkbehandling og å tilby
relevante informasjonstenester o.a. på begge målformer.
7.5.2.4 IKT-stillingar i Norsk språkråd i 2000
I statsbudsjettet for 2000 vart så Norsk språkråd
tilført to nye stillingar for å vareta funksjonen
som sekretariatet for språkteknologi slik som omtalt ovanfor.
I budsjettframlegget heitte det at målet var at sekretariatet
skulle bli eit fagleg-administrativt knutepunkt for norsk språk
og IT.
7.5.2.5 Handlingsplan for norsk språk og IKT frå 2001
Etter dette bad Kulturdepartementet Norsk språkråd
utarbeida ein handlingsplan for norsk språk og IKT. Planen
vart lagd fram i ein endeleg versjon i juni 2001.
Handlingsplanen konsentrerte seg særleg om mål
og tiltak for å leggja til rette for norskspråkleg programvare
og norsk språkteknologi. Sentrale målformuleringar
i planen var at mengda av norskspråkleg programvare måtte
aukast, særleg programvare på nynorsk, og at norsk
språkteknologi må tuftast på kunnskap
om og forsking i norsk språk i form av bokmål,
nynorsk og dialektar.
Av tilhøyrande tiltak var det særleg to som
stod i framgrunnen.
Det eine var eit framlegg om at statlege styresmakter skulle
innføra eit regelverk for offentlege innkjøp av
vanleg programvare som kunna sikra at programma vart utvikla både
i ein nynorsk- og ein bokmålsversjon.
Det andre var framlegget om å etablera ein norsk språkbank,
dvs. ei samling av norske språkressursar i form av store
mengder tekst og tale som er elektronisk lagra og tilrettelagde
for ulike typar bruk og gjenbruk, særleg tenkt nytta til
utvikling av språkteknologiske produkt på norsk.
Handlingsplanen inneheldt elles desse hovudmåla:
I Noreg skal IKT-baserte produkt og
tenester ha norskspråkleg brukargrensesnitt og vera tufta
på kunnskapar om norsk tale og dei to skriftformene våre.
Alle med norsk som morsmål skal ha lik tilgang til
slike norskspråklege produkt og tenester og til å skaffa
seg den kompetansen som krevst for å ha nytte av tilbodet.
Mengda av norskspråkleg programvare må aukast,
særleg programvare på nynorsk.
Føresegnene i opplæringslova om språklege parallellutgåver
av elektroniske læremiddel må oppfyllast i praksis.
Norsk språkteknologi må tuftast på kunnskap om
og forsking i norsk språk (bokmål, nynorsk og
dialektar) og relevant teknologi.
Noreg skal vera aktiv deltakar i det nordiske og vidare
europeiske samarbeidet innanfor språkteknologi.
Standardisert norsk IKT-terminologi må utviklast
og stillast til rådvelde.
Noreg skal bidra til å styrkja erfaringsutvekslinga
mellom språkorganisasjonane i Norden og elles i Europa
om informasjons- og kommunikasjonsteknologiens innverknad på nasjonalspråka
og om mottiltak for å halda språka i hevd også på dette
området.
7.5.2.6 Utgreiinga om ein norsk språkbank frå 2002
Det sistnemnde framlegget førte til at Norsk språkråd
i februar 2002 fekk i oppdrag av Kultur- og kyrkjedepartementet
og Nærings- og handelsdepartementet å initiera
og koordinera ei utgreiing om samling og tilgjengeleggjering av
norske språkteknologiressursar.
Dette resulterte i ein rapport som vart lagd fram i oktober 2002.
Her var konklusjonen at det ville kosta 100 mill. kroner fordelt
over fem år å få på plass det
minimum av språkressursar som skal til. Rapporten la dessutan
til grunn at dette måtte finansierast tilnærma
heilt ut med offentlege midlar.
I kulturmeldinga frå 2003, St.meld. nr. 48 (2002–2003)
Kulturpolitikk fram mot 2014,
vart det på dette
grunnlag konkludert med at det dermed var lite realistisk å få realisert
dette som eit samla prosjekt. Det heitte at det i staden måtte
arbeidast vidare med saka i eit noko lengre tidsperspektiv.
Meldinga heldt altså fast ved målet om å byggja opp
ein norsk språkbank.
7.5.2.7 Tiltak for å fremja nynorsk programvare
Når det gjaldt programvare, nemnde kulturmeldinga at
det hadde vore vurdert om det offentlege gjennom ein samordna innkjøpspolitikk
kunne stilla som krav at aktuell programvare skal liggja føre
både på nynorsk og bokmål før
det kan kjøpast inn av statlege eller kommunale organ eller
i skuleverket.
I meldinga heitte det at ein førebels ikkje hadde funne
tenlege mekanismar for å få dette til. Det vart
i den samanhengen vist til at ein frå 1. januar 2003 var
i ferd med å avvikla dei sentrale rammeavtalane for offentlege
innkjøp. I tråd med dette skulle det vera eit
overordna prinsipp at offentlege innkjøp i utgangspunktet
skulle vera eit desentralisert ansvar.
I meldinga vart det likevel konkludert med at departementet ville
vurdera om det var tenlege verkemiddel som bør takast i
bruk for å understøtta utviklinga av nynorsk programvare
og andre mekanismar som kan hindra diskriminering av nynorsk i samband
med teknologisk basert språkbruk.
Det heitte også at det burde utgreiast om det kan gjerast
lov- og forskriftsendringar for å sikra norske arbeidstakarar
og forbrukarar norsk grensesnittspråk i meny-, styre- og
hjelpetekstar i elektroniske apparat, maskinar og liknande
og norsk språk i brukarrettleiingar og annan dokumentasjon
for slikt utstyr og på all emballasje og i all merking
der språket har noko å seia for helse, miljø og tryggleik.
7.5.2.8 Nynorsk innhald på Internett
Kulturmeldinga tok også til orde for at det i åra framover
måtte takast eit krafttak for reell likestilling mellom
nynorsk og bokmål også i teknologibasert språkproduksjon
og språkkommunikasjon, mellom anna ved å arbeida
for eit meir fullverdig tilbod av nynorsk programvare og for tilgang
til nynorsk innhald på Internett.
7.5.2.9 Parallellsøk
Ei anna sak som vart nemnd spesielt i kulturmeldinga, var problemet
med gjenfinning av digitale tekstar og dokument på tvers
av målform.
Problemet består i at dei ordinære søkjefunksjonane
i dag ikkje er slik innretta at ein ved søk på eit
ord i bokmålsform også får treff for
dei tilsvarande nynorskformene og omvendt.
I dei elektroniske arkiv- og saksbehandlingssystema som no er
tekne i bruk i sentralforvaltninga, har dette ført til
at ein har innført eit uoffisielt påbod om at
alt skal registrerast på bokmål for at det skal
vera søkbart.
Som det også er slått fast i kulturmeldinga,
er eit slikt forbod mot registrering på nynorsk direkte i
strid med likeverdsprinsippet i lov om målbruk i offentleg
teneste.
Problemet kan løysast ved at det blir utvikla og teke
i bruk ein språkmodul som lenkjer saman bokmåls-
og nynorskformer slik at det lèt seg gjera å gjennomføra
parallellsøk.
7.5.3 Tilgang til norsk programvare i begge målformer
Det har i mange år vore eit krav at staten må bruka marknadsmakta
si til å stilla krav om at programvare som det offentlege
kjøper inn, skal liggja føre i både nynorsk-
og bokmålsversjon. Eit slikt verkemiddel kunne også tenkjast
brukt for å sikra norskspråkleg programvare uavhengig
av målform og å krevja eit visst minimum av språkleg
kvalitet i programvaren. Begge delar er drøfta i
Norsk i hundre!
Tanken har vore at eit slikt verkemiddel måtte byggjast
inn som eit element i den offentlege innkjøpspolitikken,
men omlegginga i retning av desentraliserte innkjøpsavtalar
under Bondevik II-regjeringa gjorde at ein i kulturmeldinga frå 2003 konkluderte
med at grunnlaget for eit samla offentleg marknadskrav ikkje lenger
var til stades.
Departementet har seinare teke opp att saka med Fornyings- og
administrasjonsdepartementet med sikte på oppdaterte vurderingar
av det omtalte verkemidlet og eventuelle alternative tiltak for å sikra
eit meir fullverdig tilbod av nynorsk programvare.
Til illustrasjon kan nemnast at det i stortingsmeldinga om IKT-politikken
fremja av Fornyings- og administrasjonsdepartementet i desember
2006 heiter at regjeringa vil vurdera vilkåra for å kunna føra
ein preferansepolitikk for open kjeldekode.
1
Førebels
resultat tyder likevel på at det er avgrensa rom for å nytta
anskaffingsregelverket til å fremja samfunnsnyttige formål
som ikkje er direkte grunngjeve i eit sakleg behov hos kjøparen.
Det same vil truleg gjelda for språkkrav slik som nemnt ovanfor.
Eit alternativ departementet vil vurdera, er å styrkja
eller byggja ut relevante føresegner i språklovgjevinga,
til dømes slik at krav til målform i programvare
til bruk i det offentlege kan forankrast i målbruksreglane.
Departementet vil vurdera dette i samband med gjennomgangen av målbruksreglane,
jf. kap. 3.4.4.7.
Tilsvarande reglar som dei ein her kunne tenkja seg, finst i
lovverket frå før, jf. føresegna i opplæringslova
om at det i andre fag enn norsk berre kan brukast lærebøker
og andre læremiddel som ligg føre på bokmål
og nynorsk til same tid og same pris.
2
I forskrift til denne føresegna
har Kunnskapsdepartementet fastsett reglar som inneber at programvare
som elevane skal nytta i undervisninga, er omfatta av den nemnde
lovregelen, dvs. at slik programvare skal liggja føre på begge
målformer.
Ved offentlege innkjøp er det elles slik at ein offentleg
oppdragsgjevar som skal kjøpa inn programvare, kan presisera
i kravspesifikasjonen at programvara skal liggja føre på både
bokmål og nynorsk, til dømes slik at ein krev
ordlister i begge målformer. Departementet vil oppmoda
alle offentlege innkjøparar av programvare til å nytta
det handlingsrommet dei på denne måten har til å stilla språklege
krav til leverandøren.
Det må elles nemnast at regjeringa i april 2008 har
fremja forslag til lov om forbod mot diskriminering av personar
med nedsett funksjonsevne, jf. Ot.prp. nr. 44 (2007–2008).
Her er det mellom anna eit pålegg om universell utforming
av alle IKT-løysingar retta mot allmenta. Påbodet
gjeld for all ny IKT frå 2011 og skal handhevast ved hjelp
av standardar og sentrale retningslinjer.
Ei mogleg tolking av universell utforming av IKT er å krevja
at grensesnitta overfor brukarane skal vera på norsk. Departementet
vil i det vidare arbeidet vurdera korleis ein på sikt kan
få innarbeidt standardar for tilhøvet mellom språk
og tilgjengelegheit.
I spesielle tilfelle kan det også vera aktuelt å vurdera
kva som eventuelt kan gjerast for å leggja betre til rette
for omsetjing av fri programvare til nynorsk.
7.5.5 Ein norsk språkbank
7.5.5.1 Språkteknologi
Bakgrunnen for arbeidet med ein norsk språkbank er dei
teknologiske framtidsutsiktene som opnar seg, og dei språkpolitiske
utfordringane som reiser seg gjennom moderne språkteknologi.
Språkteknologi er ein tverrfagleg forskingsdisiplin
der språkvitskap og datavitskap møtest. Det handlar
om utvikling av dataprogram med språkmodular som behandlar
menneskeleg språk. Dette kan vera program som kan køyrast
på ein datamaskin, men også program
som kan byggjast inn i moderne tekniske innretningar.
Språkteknologi omfattar to hovuddelar, datalingvistikk
og taleteknologi. Datalingvistikk byggjer på analyse av
skrivne tekstar, medan taleteknologi handlar om databehandling av
menneskeleg tale, både omforming av naturleg tale til tekst og
tekst til kunstig tale. Taleteknologien gjer det mellom anna mogleg å styra
maskinar med røysta.
Språkteknologi forenklar og betrar kommunikasjonen mellom
menneske og maskin og kan også fungera som eit hjelpemiddel
i kommunikasjon menneske imellom. I kvardagen kan språkteknologien
vera med og effektivisera arbeidsprosessar.
7.5.5.2 Døme på språkteknologiske løysingar
i praktisk bruk
Det er språkteknologiske løysingar som ligg
til grunn for den intelligente ordboka som gjer oss i stand til å skriva
raske tekstmeldingar på mobiltelefonen, som gjer at eit
automatisk sentralbord kan forstå kva vi bed om, og som
gjev oss automatisk stave- og grammatikkontroll i tekstbehandlingsprogramma
på datamaskinen.
Språkteknologiske løysingar er i bruk i navigasjonssystema
i moderne bilar, i styring av vaskemaskiner og alarmar.
Når vi søkjer på nettet, finst intelligente
søkjesystem som tolkar det vi er ute etter, for å gje
oss eit best mogleg svar. Det finst program som støttar omsetjing
av tekst, til dømes til bruk ved teksting av film og anna
tekstomsetjing, dessutan program som kan laga samandrag av tekstar,
og som kan rangera relevante data frå ulike dokument.
Døgnopen forvaltning føreset at offentlege skjema
og annan informasjon er tilgjengelege på Internett døgnet
rundt, og at dei er lagde til rette for interaktiv bruk. Ulike språkteknologiske
løysingar gjer at brukaren kan velja mellom å lesa
og å lytta, og om han vil fylla ut skjemaet med tastatur eller
stemme.
Språkteknologiske løysingar kan i høg
grad vera med å på å overvinna ulike
funksjonshinder. Ved hjelp av språkteknologiske metodar
kan ein til dømes utvikla taleprotese til personar som
manglar taleevne.
Språkteknologiske løysingar kan også vera
til hjelp for dei som har lese- og skrivevanskar, og for personar
som er synshemma.
Menneske med nedsette funksjonsevner som ikkje kan skriva sjølve,
kan snakka til ein pc, som så set talen om til tekst. Ein
pc kan styrast med stemma i staden for skrivne kommandoar, og tekst kan
sendast til ein mottakar som sjølv avgjer om han vil lesa
eller få teksten lesen opp for seg.
Slik sett er språkteknologi med på å leggja
til rette for auka demokratisk deltaking i samfunnet mellom anna
ved å gjera informasjon og tenester tilgjengelege for alle.
I eit høgteknologisk samfunn er det mange arbeidsoppgåver
som kan forenklast og effektiviserast ved hjelp av språkteknologi.
I framtida vil det berre vera fantasien som set grenser for kva
slik teknologi kan nyttast til. Enno står likevel ein del grunnleggjande
teknologisk utviklingsarbeid att å gjera, mellom anna når
det gjeld utvikling av ei kunstig stemme som mest mogleg perfekt
kan etterlikna naturleg tale.
7.5.5.3 Teknologiutvikling og språkversjonar
Språkteknologi er altså tufta på ein
kombinasjon av språk og teknologi. Teknologien er i prinsippet nøytral,
og dei same teknologiske løysingane kan difor brukast verda
over. Annleis er det med dei språklege ingrediensane. Dei
må skiftast ut dersom dei teknologiske løysingane
skal kunna materialisera seg i ulike språkversjonar. Dette
er ein føresetnad dersom potensielle brukarar skal kunna
få tilgang til teknologien på sitt eige språk.
Dette skjer ikkje automatisk, og faren er i høg grad
til stades for at marknadsvilkåra for språkteknologisk
produktutvikling og omsetning kan fungera som ei drivkraft i ei
utvikling som går i retning av at dei dominerande språka,
først og fremst engelsk, styrkjer seg jamt meir på kostnad
av dei mange små og mellomstore nasjonalspråka
verda over.
Også når det gjeld språkteknologiske
produkt, er det kommersielle og til dels militære aktørar
i den engelskspråklege verda som er dei leiande produktutviklarane.
Det skjer rett nok at desse også utviklar løysingar
for andre språk enn engelsk, men det er sjeldan at eit
språk som norsk blir rekna for eit relevant språk
i denne samanhengen.
Til dømes kan det nyaste talebaserte omsetjingssystemet
Phraselator P2
frå det amerikanske industriselskapet
Voxtec
omsetja mellom 44 ulike språk,
inkludert hovudspråket i land som Irak, Iran og Afghanistan,
men norsk er for tida ikkje med blant dei tilgjengelege språkmodulane.
Eit anna amerikansk selskap,
Powerset,
utviklar for
tida ein lingvistisk basert søkjemotor som skal gje meir
presise søkjeresultat ved intelligent søking på verdsveven
og i store tekstdatabasar. Ironisk nok blir mellom anna norsk teknologi
brukt i utvikling av søk i engelskspråklege tekstar,
og søkjemotoren skal etter kvart tilpassast fleire andre
språk, men heller ikkje her ligg det føre planar
om ein norsk modul.
Mange språkteknologiske produkt og tenester har alt
lenge vore tilgjengelege på den internasjonale marknaden,
men totalt sett er det lite av dette som finst tilgjengeleg i norskspråkleg
versjon.
Det er også mange språkteknologiske produkt som
finst berre på engelsk, særleg dei mest avanserte.
7.5.5.4 Språkteknologi utan norske språkversjonar
Dersom vi i Noreg skal få full nytte av alle slags språkteknologiske
hjelperåder, må dei teknologiske løysingane
tuftast på norskspråklege versjonar. Då kan
språkteknologien vera med å styrkja det norske
språket og den norske kulturen. Vi har bruk for alle aktuelle
og framtidige språkteknologiske løysingar, og
vi har behov for dei på norsk.
Dersom vi i liten grad maktar å leggja til rette for
norskspråklege versjonar, kan vi sjå føre
oss fleire uheldige konsekvensar.
Dels vil resultatet kunna bli at mange språkteknologiske
produkt eller tenester i liten grad blir tekne i bruk på den
norske marknaden.
Dels kan det vera at ikkje alle vil sjå seg i stand til å bruka
dei engelskspråklege produkta. For all røynsle
tilseier at det først er når brukarane kan nytta
morsmålet sitt, at alle slike teknologiske løysingar
i realiteten blir tilgjengelege for alle.
Utan norskspråklege versjonar vil altså mange av
dei nye teknologisk avanserte løysingane bli mindre tilgjengelege
for nordmenn enn for dei som har engelsk som morsmål.
Det er også ein fare for at produkt og tenester som
vil koma i norsk språkdrakt, vil ha dårlegare språkleg
kvalitet enn dei tilsvarande engelske utgåvene.
Men i stor grad må vi rekna med at nordmenn flest vil
ta i bruk engelskbaserte produkt, og i den grad det skjer, er vi
på god veg mot eit alvorleg domenetap for norsk språk.
Sett i eit språkpolitisk perspektiv er det dette siste
som er den mest alvorlege konsekvensen.
Alt i kulturmeldinga frå Bondevik II-regjeringa frå 2003
vart det peikt på alvoret i dette:
Skjer ikkje slik norskspråkleg produktutvikling,
må ein rekna med at det vert teke i bruk engelskspråklege
produkt i staden. Her ligg truleg ei av dei store utfordringane
for norsk språk i tida framover. Difor framstår
dette no som eit viktig kulturpolitisk spørsmål.
Språkteknologifeltet kan vera ein av dei fremste arenaene
der kampen om norsk språk og kultur vil utspela seg i tida
framover.
3
7.5.5.5 Føresetnader for utvikling av norske språkversjonar
Det går i dag føre seg arbeid for å utvikla
til dømes dikteringsprogramvare for norsk, automatisk omsetjingssystem
mellom norsk og engelsk, automatiske sentralbord og ulike telefoninformasjonstenester
og system for talestyring. Men utvikling av norske modular for tekstsøking,
taleanalyse og talesyntese, omsetjing og andre bruksmåtar
er kostbart.
Ein stor del av desse kostnadene går til innsamling,
koding og ulike former for nødvendig foredling av datagrunnlaget,
dvs. relevant språkmateriale på norsk. Forsking
og produktutvikling kunne skjedd monaleg raskare og billigare ved
hjelp av ein påliteleg, stor, detaljert, kvalitetssikra
og permanent database av norske språkressursar der dei ressursane
som trongst, var tilgjengelege for bruk og gjenbruk.
Tilgangen på slike digitaliserte språkressursar i
form av tekstsamlingar, talesamlingar og leksikalske data har vist
seg å vera den kritiske innsatsfaktoren for å utvikla
kommersielt lønnsame produkt. Det å samla inn
og å koda slike språkressursar er etter måten
ressurskrevjande, særleg dersom det må gjerast
i kvart enkelt tilfelle eller av kvar enkelt aktør. Dette
slår sterkare ut di mindre den kommersielle marknaden er,
og di mindre forskingsbudsjett det er tale om.
Sjølve ideen med ein norsk språkbank er å etablera
ei felles nasjonal ressurssamling av elektronisk lagra språkmateriale
til bruk i ulike språkteknologiske løysingar.
I ei slik ressurssamling vil det vera behov for millionar av ord
i form av tekst og tale. Det vil vera behov for tale på ulike
dialektar og av menneske i ulike aldrar og av begge kjønn.
Han må også innehalda leksikalsk materiale og
elektroniske ordbøker. Ulike brukargrupper skal kunna henta
ut og gjera seg nytte av det dei måtte trenga av digitalisert
språkmateriale.
Ein språkbank utgjer grunnlaget for å kunna utvikla
programvare og språkteknologiske produkt på norsk
både for dagen i dag og for framtida.
I tillegg til dette vil ein norsk språkbank også utgjera
sjølve hjørnesteinen i språkteknologisk
forsking. Å få på plass ein norsk språkbank
er dermed også føresetnaden for å kunna
gjennomføra avansert forsking i norsk språk.
7.5.5.6 Røynsler frå forskingsprogrammet KUNSTI
Langsiktig kunnskapsutvikling gjennom språkteknologisk
forsking tufta på norsk språk har i sin tur mykje å seia
for å støtta opp under seinare produktutvikling.
Ein norsk språkbank vil tena som eit forskingsverktøy
som i neste omgang vil generera meir forsking og nye og betre produkt
og tenester.
Noregs forskingsråd brukte i perioden 2001–2006
om lag 70 mill. kroner til det store språkteknologiske
programmet Kunnskapsutvikling for norsk språkteknologi
(KUNSTI). Formåla var for det første å styrkja
grunnforsking og kompetanse innanfor relevante fag som til dømes
datalingvistikk, taleteknologi og aktuelle område innanfor informatikk/informasjonsvitskap,
fonetikk og formell lingvistikk. For det andre var det eit formål å støtta
forsking og utvikling med sikte på å gjera talt og
skriven norsk og samisk tilgjengeleg for datamaskinell prosessering.
Men mangel på relevante språkressursar viste seg å vera
eit problem for mange av prosjekta i KUNSTI. Til dels måtte
det brukast tid og ressursar på å samla inn og
utvikla nødvendig infrastruktur i form av språkressursar
før ein kunne starta med sjølve forskingsarbeidet.
Til dømes kunne eit prosjekt som arbeidde med maskinomsetjing
mellom norsk og engelsk, det såkalla LOGON-prosjektet,
ha kome mykje lenger dersom prosjektet hadde hatt tilgang til språkressursar
som viser grammatiske korrespondansar mellom norske tekstar og engelske
omsetjingar. Ein slik ressurs, som er eit viktig grunnlag for optimalisering
av omsetjingssystem, er under oppbygging for mellom anna engelsk-tysk-svensk, men
ikkje for norsk.
Alt i alt vart resultatet i KUNSTI-programmet at ein hadde mindre
ressursar å bruka til dei primære forskingsoppgåvene.
Dette førte i sin tur at til uheldige justeringar av innretning
og ambisjonsnivå i fleire av prosjekta. Samla sett måtte ambisjonane
for heile programmet endrast. Bakgrunnen var at ein ved planlegging
av programmet hadde lagt til grunn at arbeidet med å byggja
opp språkbanken ville koma i gang samstundes med programmet.
7.5.5.7 Språkteknologiske fagmiljø og
forsking i Noreg
Dei språkteknologiske fagmiljøa i Noreg er
konsentrerte til Oslo, Bergen og Trondheim. Det blir dessutan arbeidt
med samisk språkteknologi i Tromsø. Det er eit
visst samarbeid mellom dei ulike stadene, i alle fall innanfor universiteta. Enkelte
store private forskings- og utviklingsmiljø, til dømes
SINTEF og Telenor, samarbeider også med universitetsmiljøa.
Universitetsmiljøa utfyller kvarandre når det gjeld
språkteknologiske spesialitetar.
I Oslo arbeider ein mest med maskinomsetjing, digitale ordbøker
og noko tekstlingvistikk.
I Bergen er det særleg store tekstsamlingar, ein del
datalingvistikk og terminologiarbeid som står sterkt.
Miljøet i Trondheim er mest kjent for arbeidet med tale
og lyd, men også her blir det arbeidt med datalingvistikk.
Den språkteknologiske kompetansen er høg jamvel
om miljøa er små. Internasjonalt sett held såleis
norske språkteknologiske fagmiljø eit høgt nivå.
Dette er kompetanse som vi må utnytta.
Noreg har som ambisjon å vera eit kunnskapssamfunn som
utviklar og bruker avansert teknologi der vi kan. Vi ønskjer å vera
verdsleiande og satsa på innovasjon og utvikling. Men det
står meir på spel enn ein berekraftig kunnskapsindustri.
Det gjeld også å slå vakt om den norske
språk- og kulturarven.
7.5.6 Vidare arbeid med etablering av ein norsk språkbank
7.5.6.1 Behovet for ein norsk språkbank
Det er ingen andre enn Noreg som vil utvikla språkteknologi
på norsk. Det er store voner til utnytting av språkteknologi
innanfor mange område både i næringslivet
og offentleg sektor. Både i europeisk og i nordisk samanheng
tek ein sikte på å oppretta ein forskingsinfrastruktur
og eit samarbeid som integrerer tilgjengelege språkressursar.
Oppbygging og kvalitetssikring av nasjonale ressursar vil likevel
vera ei nasjonal oppgåve.
Ein norsk språkbank er eit viktig språkpolitisk tiltak
for å styrkja norsk språk i ei global språkutvikling
der små språksamfunn er utsette for aukande press.
Språk er dessutan den fremste beraren av kulturell identitet,
og satsing på ein norsk språkbank er difor eit
vesentleg og vidfemnande kulturtiltak i vår tid.
I tillegg vil etablering og oppbygging av ein språkbank
leggja til rette for nærings- og teknologiutvikling, forsking
og undervisning, effektivisering av forvaltninga og for språk
og kultur. Jamvel om Kultur- og kyrkjedepartementet har ansvar for språkpolitikken,
vil tiltaket også vedkoma ansvarsområdet til fleire
andre departement, i første rekke Fornyings- og administrasjonsdepartementet, Kunnskapsdepartementet
og Nærings- og handelsdepartementet.
Dei norske språkteknologiske fagmiljøa står samla
bak eit ønske om at det blir etablert ein norsk språkbank.
Både
forskingspolitiske, næringspolitiske,
ikt-politiske og språkpolitiske omsyn tilseier difor no
at vi kjem i gang med å byggja opp den teknologiske infrastrukturen
som ein norsk språkbank vil representera.
7.5.6.2 Ein norsk språkbank skal etablerast
Regjeringa har som mål i dei næraste åra å få bygd opp
ein norsk språkbank. Dette er det største enkeltståande
tiltaket som blir varsla i denne meldinga.
I brev av 6. mai 2008 har departementet bedt Språkrådet
gå i gang med å førebu den formelle etableringa
av språkbanken frå 1. januar 2009. Departementet
har for dette formålet bedt Språkrådet
setja ned ei arbeidsgruppe som innan 15. august 2008 skal skissera
ein plan for korleis etableringa kan skje.
Denne planen skal mellom anna visa kva personellressursar og
kostnader språkbanken vil krevja det første driftsåret,
og korleis språkbanken kan organiserast. Gruppa har også fått
i oppdrag å skissera ein realistisk strategi og opptrappingsplan
for perioden 2010–2014.
Det er streka under i brevet at gjennomføringa av tiltaket
vil vera avhengig av og til kvar tid vil måtta tilpassast
den aktuelle budsjettsituasjonen.
Språkbanken vil bli bygd opp over ein periode på fem–seks år,
før han går inn i ein drifts- og vedlikehaldsfase.
Kultur- og kyrkjedepartementet vil i nært samarbeid
med Kunnskapsdepartementet, Fornyings- og administrasjonsdepartementet
og Nærings- og handelsdepartementet avklara organisering
og finansiering av språkbanken.
7.5.6.3 Innhaldet i ein norsk språkbank
Språkbanken skal vera ein stor, samla, nasjonal språkressurs
som er kvalitetssikra og bygd opp etter internasjonale standardar.
Frå før finst det spreidde ressursar i form
av norske tekst- og talekorpus, ord- og termbasar, grammatikkar
osv. Alt i alt er desse for små eller for lite detaljerte.
Dessutan er dei i liten grad kvalitetssikra; dei er ikkje samla
under eitt, dei er lite kompatible, og dermed er dei alt i alt vanskeleg
tilgjengelege for aktuelle forskingsmiljø.
Rapporten frå 2002, som er omtalt under kap. 7.5.2.6
ovanfor, inneheld ei kartlegging av dåverande
språkressursar og ei vurdering av kva type ressursar som
det var nødvendig å byggja opp frå grunnen
av.
Etter 2002 er dessutan ein del nye ressursar bygde opp og tekne
vare på ved universiteta, mellom anna i samband med det
nemnde KUNSTI-programmet.
Ei ny kartlegging av eksisterande ressursar ved universiteta
og hos interesserte industriaktørar må til for å avklara
kva språkressursar som elles kan vera aktuelle å ta
inn i språkbanken, og kva som må byggjast opp
frå grunnen av. Dette vil vera ein viktig del av det arbeidet
som skal gjerast av den gruppa som Språkrådet
har fått ansvaret for å setja ned. Kartlegginga
må også omfatta den rettslege statusen til ressursane
med omsyn til bruken.
Eit materiale som alt er sikra for språkbanken, er dei
språkressursane som vart bygde opp av Nordisk Språkteknologi
Holding (NST) på Voss. I perioden 1998–2000 utvikla
dette selskapet talesyntese, talegjenkjenning og diktering for norsk, svensk
og dansk i samarbeid med andre selskap, mellom andre IBM.
Selskapet samla inn og lagra ei rekkje språkressursar
til bruk i produktutviklinga. Desse språkressursane omfatta
taledata, leksikalske data, tekstsamlingar og applikasjonsdata.
Mellom anna vart det lagt ned eit stort arbeid for å samla
inn og lagra opptak av norske dialektar. NST gjekk konkurs i 2003.
Ein gjennomgang av dette materialet har vist at særleg
dei akustiske basane i språkmaterialet er i god stand og
godt eigna for gjenbruk. Innhaldet er utvikla systematisk, følgjer
same mal, og internasjonale standardar er nytta i den grad dei fanst.
I januar 2007 vart språkressursane frå konkursbuet
til NST sikra for ein framtidig språkbank gjennom eit samla
oppkjøp i regi av Språkrådet, universiteta
i Oslo, Bergen og Trondheim og IBM. I påvente av etablering
av språkbanken er det danna eit interimsstyre for å ta
hand om språkressursane. Når språkbanken
er oppretta, kan ressursane overførast til språkbanken,
og interimsstyret vil kunna avviklast.
7.5.6.4 Kostnadsspørsmålet
Konklusjonen i rapporten frå 2002 var at det ville kosta
om lag 100 mill. kroner fordelt over fem år å få på plass
det minimum av språkressursar som skal til for å få ein
fullverdig norsk språkbank.
Sidan 2002 har teknologien gått framover, og det har
skjedd ei viss internasjonal standardisering. Dette gjer at utgiftene
til nyinnsamling og tilrettelegging truleg kan reduserast noko.
Den gjennomgangen som arbeidsgruppa i regi av Språkrådet
skal gjera, vil elles gje eit betre grunnlag for etter kvart å koma
fram til eit oppdatert overslag over kva investeringar som krevst.
Det er sjølve etableringa av språkbanken og oppbygginga
av språkressursane som representerer det store kostnadslyftet.
Investerings- og grunnlagskostnadene i samband med innsamling
av dei digitaliserte språkressursane er ikkje mindre for
eit lite språk enn for eit stort. Det kostar om lag det
same å etablera og halda ved like den nødvendige
infrastrukturen for språkteknologi uavhengig av kva språk
det gjeld. Norsk språk har få brukarar å fordela
kostnadene på og ein liten marknad å selja i.
Å etablera ein norsk språkbank vil likevel
kosta mindre dei første par åra og kosta meir
midtvegs og mot slutten. Deretter vil ein gå over til vanleg drift
med vedlikehald og generell utvikling. Her vil det vera tale om årlege
kostnader til lønn for to–tre personar og eit
avgrensa behov for utstyr. Noko av driftsutgiftene kan dekkjast
gjennom brukaravgifter.