Foreslått tiltakseier: Flere tiltak, med ulike tiltakseiere
I samarbeid med: Helsedirektoratet, Helsesektoren, de regionale helseforetakene, Kommunenes organisasjon (KS), FHI og Nasjonalbiblioteket, DSA
Relevant for: Helse- og omsorgssektoren
Problem som skal løses: Helse- og omsorgssektoren mangler et tilstrekkelig felles datagrunnlag for å utvikle, tilpasse og teste språkmodeller enklere og mer kostnadseffektivt, og dermed bidra til at det utvikles KI-verktøy av høy kvalitet som er tilpasset norske forhold.
Forslag: Helse- og omsorgssektoren bør samarbeide for å gjøre mer data av god kvalitet tilgjengelig til både trening (forhåndstrening og ettertrening), kunnskapsforankring (for eksempel RAG) og testing av språkmodeller som skal brukes i helse- og omsorgssektoren.
Arbeidet bør omfatte:
- å kartlegge åpne og lett tilgjengelige datakilder, som for eksempel retningslinjer og metodebøker, for utvikling av store språkmodeller for helse- og omsorgstjenesten (Hdir, i samarbeid med FHI). Oversikt over fritt tilgjengelige tekster og andre språkressurser med helsefaglig kunnskap og praksis kan legges på informasjonssiden om KI hos Helsedirektoratet.
- å gjøre fagspråklige datakilder som for eksempel terminologier og klassifikasjoner tilgjengelige til gjenbruk sammen med andre relevante data, for eksempel på helsedata.no, helsedirektoratet.no eller i språkbanken i Nasjonalbiblioteket (Hdir), også nynorsk og samisk.
- å etablere datagrunnlag som utgjør felles nasjonale prinsipper for verdier og etikk i språkmodeller i norsk helse- og omsorgstjeneste.
- vurdere hvordan sensitive data som for eksempel journalnotater, epikriser og skjemaer kan brukes til å utvikle store språkmodeller (klargjøre regelverk gjennom veiledning, tekniske løsninger mm.) (Hdir, i samarbeid med relevante (forsknings-) miljøer)
- å gjøre rettighetsbelagte datakilder mer tilgjengelig, for eksempel ved å vurdere å etablere en kompensasjonsordning for rettighetseiere av helsefaglig innhold i tråd med nasjonale prinsipper (se Mimir-prosjektet til Nasjonalbiblioteket [150]) å utrede behov for og etablering av en felles infrastruktur for deling av språkdata, for eksempel gjennom helsedata.no (FHI, Hdir, helseforetakene). Se også anbefalt tiltak under om etablering av infrastruktur om regnekraft (kap. 5.2)
For øvrig vises det særlig til avsnitt 4.3.1 og kapittel 4.4.
[150] Første fase av Mimir-prosjektet er dokumentert her: https://www.nb.no/content/uploads/2024/08/Mimirprosjektet_teknisk-rapport.pdf