Zaupanja vredni repozitoriji

Raziskovalni repozitoriji so del digitalne infrastrukture, ki podpira odprto znanost. Kot takšni morajo zadoščati določenim strokovnim smernicam oz. standardom, spoštovati veljavne pravne in etične omejitve (npr. omogočati različne stopnje odprtosti vsebin) ter zagotavljati varno, trajno hrambo. Takšne repozitorije imenujemo zaupanja vredni.
Kot zaupanja vredne lahko obravnavamo tri skupine repozitorijev:
- certificirane repozitorije (npr. v skladu s certifikati CoreTrustSeal, DIN 31644 ali ISO 16363),
- področne repozitorije, ki jih priznava in uporablja raziskovalna skupnost na določenem znanstvenem področju, npr. HEPData, Crystallography Open Database, PubChem … ),
- splošne in institucionalne repozitorije, ki imajo značilnosti zaupanja vrednih repozitorijev (npr. Zenodo).
Zaupanja vredni repozitoriji transparentno podajajo natančne informacije o organizaciji in tehničnih značilnostih svojih storitev (npr. dostop in pridobivanje vsebin, zagotavljanje varne hrambe, dolgoročno zagotavljanje storitev, vključno s tehnično podporo in financiranjem ipd.). Takšni repozitoriji zagotavljajo ustrezne metapodatke, ki vsebujejo podatke o izvoru vsebine, so strojno berljivi ter dovolj kakovostni, da omogočajo odkrivanje podatkov, njihovo ponovno uporabo in citiranje. Zaupanja vredni repozitoriji vsebinam tudi dodeljujejo trajne, enolične identifikatorje digitalnih objektov (npr. DOI, Handle, PURL ipd.), da so vsebine nedvoumno navedene in jih je mogoče citirati.
V nadaljevanju si bomo ogledali 16 ključnih zahtev, ki jih mora izpolnjevati repozitorij, da lahko pridobi certifikat CoreTrustSeal.
1. Poslanstvo
Glavna naloga repozitorija je, da ohranja podatke pod svojim skrbništvom ter zagotavlja dostop do njih, kar mora biti dajalcem in uporabnikom podatkov jasno razumljivo. Odgovoren je za upravljanje digitalnih objektov, zato mora zagotoviti ustrezno okolje za hrambo gradiva za določeno časovno obdobje.
2. Licence
Repozitorij je imetnik vseh veljavnih licenc, ki se nanašajo na dostop do podatkov in njihovo uporabo. Nadzira skladnost podatkov s temi licencami ter vodi dialog z uporabniki. To velja tako za licence, ki jih določi repozitorij sam, kot tudi za vse kodekse ravnanja za izmenjavo in ponovno uporabo informacij, ki so splošno sprejeti na določenem raziskovalnem področju.
3. Stalnost dostopa
Repozitorij ima načrt, kako zagotoviti trajno in neprekinjeno ohranjanje svoje vsebine ter dostopa do nje. Ta načrt mora predvideti upravljanje repozitorija v prihodnosti (tudi v izrednih okoliščinah, kot so nesreče ali ukinitev financiranja) ter organizacijsko nasledstvo. Vključevati mora možnosti za spremembo lokacije, prenos aktivnosti na drugo organizacijo ali vračilo podatkov njihovim avtorjem. Načrt mora biti pripravljen za srednjeročno (tri do pet let) in dolgoročno obdobje (več kot pet let).
4. Zaupnost in etika
Repozitorij v največji možni meri zagotavlja, da so podatki odloženi, urejeni, dostopni in uporabljeni v skladu etičnimi normami in običaji določenega raziskovalnega področja, kar je ključnega pomena za odgovorno znanost. Imeti mora načrt upravljanja s tveganjem, da pride do razkritja zaupnih podatkov, npr. identifikacije posameznika, ki je sodeloval v raziskavi, ali natančne lokacije ogrožene rastlinske ali živalske vrste. Prav tako mora dajalcem in uporabnikom podatkov nuditi navodila za ravnanje z občutljivimi podatki.
5. Organizacijska infrastruktura
Repozitorij je ustrezno financiran, ima vzpostavljen učinkovit sistem upravljanja ter zaposluje zadostno število usposobljenega osebja s strokovnim znanjem in izkušnjami na področju arhiviranja podatkov. Najpogosteje ga gosti uveljavljena institucija z ustreznega tematskega področja, kar zagotavlja dolgoročni obstoj in stabilnost. Financiranje zadošča za tehnično infrastrukturo in osebje, v idealnem primeru za tri- do petletno obdobje. Osebju sta omogočena kontinuirano izobraževanje in profesionalni razvoj.
6. Strokovno svetovanje
Repozitorij se prilaga razvoju na področju tipov podatkov, njihove količine in hitrosti produkcije. Da lahko kar najbolje služi uporabniški skupnosti, svoje delovanje redno posodablja z najučinkovitejšimi novimi tehnologijami. Pri tem sodeluje z internimi ali eksternimi strokovnjaki s področja informacijskih tehnologij, arhivistike, podatkovne analitike in znanstvenih raziskav, ki zagotavljajo povratne informacije o delovanju repozitorija. Komunicira tudi z dajalci in uporabniki podatkov.
7. Integriteta in pristnost podatkov
Repozitorij zagotavlja integriteto in pristnost podatkov s pomočjo ustreznega sistema za upravljanje s podatki in metapodatki skozi njihov celoten življenjski cikel v repozitoriju. Za zaščito integritete podatkov in metapodatkov je potrebno dokumentirati vse namerne spremembe, vključno z virom sprememb in razlogi zanje. To lahko vključuje ugotavljanje identitete dajalcev podatkov. Repozitorij mora imeti mehanizme za odkrivanje nepooblaščenih posegov, nenamernih sprememb in napak v datotekah ter obnavljanje pravilnih različic podatkov in metapodatkov. Pristnost podatkov se zagotavlja z nadzorom nad zanesljivostjo prvotnih odloženih podatkov in njihove provenience (izvora), vključno z ohranjanjem obstoječih razmerij med podatkovnimi seti, metapodatki in njihovimi kasnejšimi različicami, ki so rezultat verzioniranja.
8. Presoja
Da se uporabnikom zagotovi ustreznost in razumljivost podatkov, repozitorij sprejema podatke in metapodatke na podlagi določenih meril ter zagotavlja ustrezno upravljanje s podatki, da se ohranijo njihove lastnosti. Podatki za arhiviranje so skrbno izbrani, repozitorij pa ima vzpostavljene mehanizme, kaj narediti z zavrnjenimi podatki. Repozitorij ima opredeljene tudi priporočljive datotečne formate ter nabor metapodatkov, ki morajo spremljati podatke, po možnosti v obliki standardizirane metapodatkovne sheme. Del procesov presoje in izbora podatkov in metapodatkov je lahko avtomatiziran.
9. Dokumentirani postopki hrambe
Repozitorij dokumentira procese in postopke pri arhiviranju podatkov. Podatke in metapodatke mora ohranjati od točke odložitve prek postopka vnosa in obdelave do točke dostopa v skladu s standardom ISO 14721 (Reference Model for an Open Archival Information System, OAIS). Imeti mora strategijo upravljanja za različne lokacije hrambe in večkratne kopije, če obstajajo, da se zagotovi konsistentnost hrambe. Imeti mora tudi strategijo za nadzor nad staranjem oz. propadanjem podatkovnih nosilcev ter za upravljanje s tveganji (nepredvidenimi dogodki).
10. Načrt dolgotrajne hrambe podatkov
Repozitorij prevzema odgovornost za dolgoročno hrambo podatkov, to funkcijo pa opravlja načrtovano in dokumentirano. Dajalci podatkov in uporabniki morajo razumeti njegovo vlogo in mu morajo na podlagi pogodbe oz. sporazuma podeliti določene pravice. To se nanaša predvsem na skrbništvo nad podatki, hrambo, kopiranje, spreminjanje, migracije in omogočanje dostopa do podatkov tretjim osebam. Vsi postopki morajo biti v skladu z arhivskimi standardi, natančno dokumentirani in dokončani.
11. Kakovost podatkov
Osebje repozitorija ima ustrezno strokovno znanje in izkušnje, da lahko presoja tehnično kakovost podatkov in metapodatkov ter zagotovi, da je končnim uporabnikom na voljo dovolj informacij za presojo vsebinske kakovosti. Vzpostavljeno ima strategijo kontrole kakovosti, s katero zagotovi popolnost in razumljivost odloženih podatkov ter ukrepe za ravnanje s podatki, ki kriterijem ne zadoščajo (tj., ali jih repozitorij vrne avtorjem ali jih popravi osebje repozitorija).
12. Potek dela
Arhiviranje poteka po natančno opredeljenem postopku od vnosa podatkov do dostopa s strani uporabnikov, po možnosti v skladu s standardom ISO 14721 (Reference Model for an Open Archival Information System, OAIS). Delovni proces je usklajen z vlogo in dejavnostjo repozitorija.
13. Odkrivanje in identifikacija podatkov
Repozitorij uporabnikom prek trajnih identifikatorjev omogoča najdljivost podatkov in možnost sklicevanja nanje. V ta namen mora vzpostaviti strojno zajemanje metapodatkov, katalog metapodatkov, po katerem je mogoče iskati, ter priporočljive oblike citatov. Po možnosti je repozitorij vključen tudi v enega ali več splošnih ali področno specifičnih registrov digitalnih virov.
14. Ponovna uporaba podatkov
Repozitorij omogoča ponovno uporabo podatkov in zagotavlja, da so opremljeni z ustreznimi metapodatki, ki olajšajo njihovo razumevanje. Zagotoviti mora, da bodo podatki dolgoročno razumljivi in ponovno uporabni kljub tehnološkim spremembam (npr. opuščanju datotečnih formatov in programske opreme ter nastanku novih) ter evoluciji znanja na določenem raziskovalnem področju. To vključuje tudi informacijsko podporo v primeru sprememb datotečnih formatov.
15. Tehnična infrastruktura
Repozitorij temelji na dobro podprtih operacijskih sistemih ter drugi infrastrukturni strojni in programski opremi, primerni storitvam, ki jih nudi svoji uporabniški skupnosti. To je določeno s standardom ISO 14721 (Reference Model for an Open Archival Information System, OAIS). Repozitorij vzdržuje evidenco uporabljene programske opreme in sistemsko dokumentacijo. Pasovna širina in povezljivost zadoščata potrebam uporabniške skupnosti. Repozitorij ima tudi načrt infrastrukturnega razvoja, načrt za ravnanje v primeru nesreč (npr. zagotavljanja varnostnih kopij ter možnosti obnovitve datotek v primeru prekinitve delovanja) ter dolgoročni poslovni načrt.
16. Varnost
Tehnična infrastruktura repozitorija zagotavlja zaščito organizacije ter njenih podatkov, izdelkov, storitev in uporabnikov. Repozitorij mora analizirati morebitne grožnje, oceniti tveganja zanje in vzpostaviti učinkovit varnostni sistem. Predvideti mora škodo, ki bi lahko nastala zaradi zlonamernih dejanj, človeških ali tehničnih napak. Oceniti mora verjetnost in vpliv takšnih scenarijev, določiti sprejemljive stopnje tveganja in predvideti ukrepe za zaščito proti grožnjam.
Nazadnje spremenjeno: 15. 6. 2022
Vsebina strani
- Poslanstvo repozitorija
- Licence
- Stalnost dostopa
- Zaupnost in etika
- Organizacijska infrastruktura
- Strokovno svetovanje
- Integriteta in pristnost podatkov
- Presoja
- Dokumentirani postopki hrambe
- Načrt dolgotrajne hrambe podatkov
- Kakovost podatkov
- Potek dela
- Odkrivanje in identifikacija podatkov
- Ponovna uporaba podatkov
- Tehnična infrastruktura
- Varnost