Norwegian Marine Data Centre (NMDC)

Ny nasjonal infrastruktur for marine data som skal levere sømløs tilgang til dokumenterte marine datasett over viktige havområder for Norge til den marine forskningsverdenen

Hvorfor?

Norge mangler et integrert system for utveksling av marine data mellom institusjoner, noe som hindrer operasjonell, effektiv og nyskapende marin forskning. Tilgang til store mengder forskningsdata av høg kvalitet, inkludert lange tidsserier, vil legge grunnlag for god forskning og gjøre norske institusjoner til attraktive partnere i internasjonale forskningsprogram – et område hvor Norge har lange tradisjoner.

Utfordringer

Marine data er svært sammensatt, fra fysiske karakteristika av havet til biologien hos artene som lever der. Vi skal utvikle en integrert infrastruktur som både skal være operativ mellom samarbeidspartnerne, inneholde datadokumentasjon og –arkiv og den skal ta høyde for behov hos dataleverandør og bruker. Den nye infrastrukturen skal forenkle de tekniske hindrene forskerne møter når de bruker data fra forskjellige kildes og den skal levere et kostnadseffektivt grensesnitt for dataleverandører. Dette trengs for å etablere et bærekraftig system som sikrer rett behandling av dataene på kort og lang sikt. For å realisere potensialet i historiske datasett som per i dag ikke er dokumentert eller lagret i arkiv med langsiktig perspektiv, trenger prosjektet å legge arbeid inn i dataarkeologi.

De 16 partnerne i prosjektet representerer universitet, høgskoler, forskningsinstitusjoner og andre relevante sektorer som alle er interessert i å gjøre data tilgjengelig for publikum i tråd med OECDs prinsipp og retningslinjer for tilgang til forskningsdata. Et viktig moment er likevel at eierskapet til dataene må respekteres og restriksjoner eller lisenskrav for å motta og bruke data må ivaretas.

Hvordan

Havforskningsinstituttet skal være vertskap for kjernen i prosjektet og fasilitere langring av data for mange av partnerne. Andre partnere har egne lagringsfasiliteter og funksjoner som vil være noder i en distribuert infrastruktur.
Kjernen i systemet skal inneholde ”lagringsfasiliteter og programvare som gir effektiv tilgang til metadata og et stort antall datasett. Brukeren får tilgang til metadata og datasett fra alle partnerne gjennom en felles webinngang med kart og grafikk som skal gjøre det intuitivt å søke, velge og gjenfinne data. Systemet skal designes for å støtte forskjellige brukere ved å lage typiske ”case” som viser hvordan med kan søke på data. Tilgang til de respektive datasettene skal gå gjennom web-applikasjonen for å få til ”one-stop-shop” til dataene.
Hver node (dataeier med egen lagring) I systemet skal etablere programkomponenter som gjør det mulig å finne igjen data på forespørsel gjennom kjernesystemet.
Brukerne kan eksportere data i mange vanlig format som er vanlig å bruke i forskningsverdenen (f. eks excel, txt, shape (?), netCDF).
Systemet skal også håndtere saker knyttet til krav til gjeldende lisenser for forskjellige datasett og det skal ha register over alle forespørsler etter data.

Flere av de involverte institusjonene har egen ekspertise i systemutvikling, kommende internasjonale standarder for oprativitet mellom system og konstruksjon. Utiklingen av infrastrukturen er en felles innsats som øker tillit og samarbeid mellom institusjonene.

Gjennom prosjektperioden skal hver av partnerne legge til rette for tilgjengeliggjøring av historiske data og flyt av ferske data til bruk i NMDC distribuerte infrastruktur.