UKK: Tutkimusaineistojen säilyttäminen

Usein kysyttyjä kysymyksiä Helsingin yliopiston Datakatalogista, metadatasta ja tutkimusaineistojen säilyttämisestä.
Miksi tutkimusaineistoja säilytetään?

Tutkimusaineistojen vastuullinen säilyttäminen liittyy muun muassa avoimen tieteen tavoitteisiin, joiden edistämiseen myös Helsingin yliopisto on sitoutunut. Avoimen tieteen periaatteisiin kuuluu tehdä tutkimusaineistoista niin avoimia kuin mahdollista, ja toisaalta niin suljettuja kuin tarpeellista. Tutkijat, tutkimusyhteisö ja yhteiskunta hyötyvät siitä, että kertaalleen kerätyt aineistot saadaan hyödynnettyä mahdollisimman monipuolisesti.

Missä voin avata aineistoni?

Mikäli tutkimusaineistosi ei sisällä arkaluonteista tietoa tai GDPR:n mukaisia henkilötietoja, suosittelemme julkaisemaan data-aineiston sille soveltuvassa tallennuspalvelussa eli repositoriossa. Useimmat repositoriot antavat valita, onko aineisto täysin avointa (suoraan ladattavissa sivuilta) tai saako sen alkuperäiseltä tutkijalta esimerkiksi tutkimussuunnitelmaa vastaan (restricted access). Aineistolle on usein myös mahdollista asettaa julkaisuviive (embargo) perustellusta syystä. 

Missä voin avata arkaluonteisen aineistoni?

Mikäli data-aineistosi sisältää arkaluonteisia tietoja, eikä esimerkiksi sen anonymisointi ole mahdollista, aineistolle ei useinkaan löydy soveltuvaa repositoriota. Aineiston metatiedot voi kuitenkin aina julkaista — näin myös avoimen tieteen ja rahoittajien vaatimus FAIR-periaatteiden noudattamisesta toteutuu.  

Antamalla tutkimusaineistosi metatiedot Datakatalogiin, saat sille viittaamista helpottavan DOI-tunnisteen. 

Mitä palvelua Helsingin yliopisto suosittelee datan avaamiseen?

Pääsääntöisesti säilytyspalvelu valikoituu seuraavasti: Jos tutkimusaineisto on sellainen, että sen voi avata muiden käyttöön ilman rajoituksia, suosittelemme ensisijaisesti tieteenalakohtaista repositoriota, tai sen puuttuessa Zenodoa. Jos aineiston käyttöön liittyy rajoituksia, sopiva vaihtoehto voi olla Helsingin yliopiston Datapankki. Jos aineisto on kansallisesti merkittävää, ainutkertaista, tai sen tulisi muista syistä säilyä seuraaville sukupolville, suosittelemme pitkäaikaissäilytystä Helsingin yliopiston Data-arkistossa. Koska vaihtoehtoja on kovin monta, autamme mielellämme sopivan säilytyspalvelun valitsemisessa. 

Milloin aineisto kannattaa kuvailla?

Suosittelemme huolehtimaan dokumentoinnista tutkimuksen alusta alkaen: jälkikäteen on kovin vaikea muistaa yksityiskohtia. Hyvään datanhallintaan (tai aineistonhallintaan) kuuluukin dokumentointi osana tutkimusta. Tämä auttaa sinua esimerkiksi silloin, jos aiemmin tehtyjä analyyseja tarvitsee myöhemmin tarkistaa. Jos aineiston voi avata muiden tutkijoiden käyttöön, ymmärtävät he huolellisen kuvailun avulla, mistä aineistossasi on kyse ja mitä sille on tehty.  

Milloin aineiston kuvailutiedot kannattaa julkaista riippuu hieman omasta tarpeestasi. Yleensä kuitenkin suosittelemme tekemään aineiston kuvailun viimeistään siinä vaiheessa, kun tutkimusprojekti päättyy. Voit tehdä sen vaikkapa samassa yhteydessä, kun huolehdit tutkimusartikkelien rinnakkaistallennuksesta. 

Miten saan aineistolleni DOI:n?

DOI-tunniste tulee sen repositorion puolesta, jossa aineisto julkaistaan. Varmista siis, että valitsemasi repositorio myöntää aineistoille DOI-tunnisteita. Vaihtoehtoisesti voit kuvailla aineiston metatiedot Datakatalogiin ja saada aineistolle DOI-tunnisteen tätä kautta.  

Annetaanko DOI aineistolle vai sen metadatalle?

Jos aineisto tallennetaan datarepositorioon, aineisto saa DOI-tunnisteen. Jos aineisto kuvaillaan esimerkiksi Datakatalogiin (jolloin itse dataa ei julkaista), tällöin DOI-tunniste annetaan aineiston kuvailutiedoille (eli metadatalle). 

Mikä on Datapankki?

Datapankki on Helsingin yliopiston säilytyspalvelu, joka tarjoaa 5-15 vuoden säilytysajan sellaisille yliopiston piirissä tuotetuille aineistoille, joille ei ole löydettävissä muuta laadukasta säilytyspaikkaa. Ennen säilytystä aineistot kuratoidaan, eli niiden laatu ja soveltuvuus säilytykseen tarkistetaan. Aineistot tallennetaan Datapankkiin jäädytetyssä muodossa, eli kun niihin ei enää tehdä aktiivisesti muutoksia.  

Voinko tallentaa aineistoni sekä Datapankkiin että Zenodoon?

Tämä ei ole tarpeen. Jos aineisto soveltuu Zenodoon, ei sitä tule tallentaa Datapankkiin. Datapankki on suunniteltu sellaisille aineistoille, joille ei muita tallennuspaikkoja löydy. Zenodo tarjoaa aineistoille 25 vuoden säilytyksen sekä muille käyttäjille suoran pääsyn aineistoon. Zenodosta aineiston metatiedot siirtyvät automaattisesti Datakatalogiin, kunhan vain Helsingin yliopisto on merkitty aineiston kohdalla selkeästi näkyviin.  

Olen jäämässä eläkkeelle, mihin laitan aineistoni?

Hienoa, kun mietit tätä! Autamme sinua löytämään datallesi parhaan vaihtoehdon. Olethan meihin yhteydessä sähköpostilla: datasupport@helsinki.fi. Vastaamme yleensä parissa päivässä. Katso myös kohta Mitä palvelua Helsingin yliopisto suosittelee datan avaamiseen? 

Julkaisuni kustantaja pyytää julkaisemaan datan, joka on liian suuri repositorioon. Mitä teen?

Jos kustantaja edellyttää aineiston avaamista, mutta aineiston koko ylittää repositorioiden asettamat ylärajat aineiston koolle, ei sitä voida avata kokonaisuutena. Yksi mahdollisuus on luoda aineistosta edustava osaotos (subset), jonka avaaminen repositoriossa on mahdollista. Toinen mahdollisuus on kuvailla aineisto kokonaisuutena Datakatalogiin, jolloin aineiston metatiedoille myönnetään DOI-tunniste sekä yhteystiedot, joista datakokonaisuutta voi halutessaan pyytää. Tutkimusartikkelista voidaan viitata aineiston metatietoihin tätä DOI-tunnistetta käyttäen. Molemmissa tapauksissa artikkelin Data availability statement -osioon tulee kirjata syy siihen, miksi aineistoa ei ole voitu kokonaisuudessaan avata ja millä keinoilla (osaotoksen luominen / metatietojen avaaminen) tätä estettä on kierretty.  

Haluan julkaista aineistoni ilman tekijätietoja. Miten se onnistuu?

Joissakin tapauksissa aineiston tekijätietoja ei haluta julkaista. Tämä johtuu yleensä tutkimusaiheeseen liittyvästä kiivaasta julkisesta keskustelusta. Tällaisia aiheita voivat olla mm. eläinkokeet, abortti, ravitsemukseen liittyvät aiheet, yms. Tällaisissa tapauksissa tutkimusaineiston tekijäksi voidaan merkitä Datakatalogissa nimetön tekijä. Se tehdään näin:  

Merkitse 

  • henkilön nimen kohdalle: Anonymous 
  • henkilön organisaation kohdalle: University of Helsinki 
  • yhteystiedoksi merkitään: datasupport@helsinki.fi 

Ilmoita sähköpostilla osoitteeseen datasupport@helsinki.fi aineiston oikeat tekijät. Datatuki pitää näistä kirjaa ja ottaa yhteyttä tekijöihin, jos aineistoon tulee asiallisia tiedusteluja.