Helsingin yliopiston Datapankki

Onko sinulla aineisto, joka ei ole aktiivisessa tutkimuskäytössä, ja jolle ei löydy sopivaa säilytyspaikkaa? Helsingin yliopiston Datapankki tarjoaa yliopiston piirissä tuotetuille digitaalisille tutkimusaineistoille tallennuspaikan 5–15 vuodeksi. Tutkimusaineistoja säilytetään Datapankissa jäädytettyinä, eli niiden sisältöä ei muokata säilytyspalvelussa.
Kun tallennustila ei riitä

Datapankki on kuratoitu säilytyspalvelu, joka soveltuu myös suurille data-aineistoille. Palvelua ei ole tarkoitettu kaikkein arkaluonteisimmille aineistoille. Aineistojen sopivuus varmistetaan palveluprosessissa.  

Datapankkia koskevissa asioissa ole yhteydessä yliopiston Datatukeen: datasupport@helsinki.fi.

Laadukas valmistelu takaa säilyvyyden

Datapankissa säilytettävien aineistojen kohdalla on tärkeää käyttää pitkään säilyviä tiedostomuotoja, sillä palvelussa olevia aineistoja ei hoivata tallennuksen aikana. Tiedostomuotoja ei siis päivitetä uusien ohjelmistopäivitysten myötä.

Säilytyspalvelu on tutkijoille maksuton.

Mikä lisenssiksi?

Jos tutkimusaineistolle tai sen osalla on jo aiemmin määritelty jokin lisenssi, käytetään samaa lisenssiä myös Datapankissa säilytettävälle aineistolle. Mikäli aineistolla ei vielä ole lisenssiä, suosittelemme valitsemaan sopiva lisenssin Datapankin omista lisensseistä sen mukaan, miten aineistoa voi luovuttaa muiden tutkijoiden käyttöön. Tarkempi kuvaus Datapankin lisensseistä on Zenodossa.

Minkälaiselle tutkimusdatalle Datapankki sopii?​

Datapankki sopii tutkimudatalle, josta voi muodostaa datasetin eli data-aineiston, jonka voi kuvailla. Kuvailutiedot (nimi, aineiston lyhyt kuvaus, tekijät, jne.) julkaistaan keväällä 2025 käyttöön tulevassa Datakatalogissa. Datapankin tilauslomakkeella kysytään myös tietoa aineiston käyttöoikeuksista. Tällä varmistetaan, ettei mikään sopimus estä aineiston säilyttämistä.​

Alla olevassa taulukossa on eritelty tarkemmin millaisille aineistoille Datapankki soveltuu tietoturvan näkökulmasta. Datatuki auttaa mielellään - jos olet epävama siitä sopiiko tutkimusdatasi Datapankkiin, ota yhteys: datasupport@helsinki.fi

 

Henkilötiedot Aineistotyyppi Aineistotyypin kuvaus Sopiiko Datapankkiin?
Tavanomaisia henkilötietoja sisältävä aineisto Tavanomaisia henkilötietoja ovat mm. nimi, osoite, ammatti, sähköposti, siviilisääty, ääni, kuva, video, jne. 
Aineisto EI sisällä erityisiin henkilötietoryhmiin kuuluvaa dataa.
Sopii Datapankkiin!
Erityisiin henkilötietoryhmiin kuuluva aineisto pseudonymisoituna Kaikki aineiston henkilötiedot on suojattu koodilla. Aineisto EI sisällä suoria tunnisteita, kuten ihmisen ääntä, kuvaa tai videoita. Sopii Datapankkiin, jos pseudonymisointikoodi säilytetään eri paikassa.
Erityisiin henkilötietoryhmiin kuuluvia henkilötietoja pseudonymisoituna, mutta itse data on epäsuorasti yksilöivää Aineiston kaikki vahvat tunnisteet (nimi, henkilötunnus, yms.) on suojattu koodilla, mutta itse aineisto on yksilöivää, kuten geneettinen tieto (sekvenssit) tai aivokuvat. Saattaa sopia Datapankkiin, mikäli henkilön tunnistaminen aineistosta on mahdotonta. Aineiston riskitaso arvioidaan tapauskohtaisesti.
Anonymisoitu aineisto Kaikki henkilötiedot on poistettu/muokattu siten, ettei yksittäisiä henkilöitä pysty tunnistamaan. Saattaa sopia Datapankkiin. Aineiston riskitaso arvioidaan tapauskohtaisesti. Aineiston anonymiteetti tarkistetaan.
Salassa pidettävät tiedot Salassa pidettävä tieto Salassa pidettäviä aineistoja ovat mm. uhanalaisten kasvien kasvupaikat tai uhanalaisten eläinten sijainti, jotkin maanpuolustukseen liittyvät tiedot. Korkean riskin aineistoja ei voi tallentaa Datapankissa. Matalan ja kohtalaisen riskin aineistolle Datapankki sopii.
Liikesalaisuudet Aineiston sisältää kolmannen osapuolen (kuten toisen yliopiston tai yrityksen) liikesalaisuuksia. Jos liikesalaisuuteen liittyvä taloudellinen arvo on merkittävä, Datapankki ei välttämättä ole paras vaihtoehto. 
Datapankki sopii, mikäli liikesalaisuuteen liittyvä taloudellinen arvo ei ole merkittävä.