Helsingin yliopiston Datakatalogi

Helsingin yliopiston Datakatalogista löydät tietoa meillä tuotetuista tutkimusaineistoista. Datakatalogin avulla parannamme tutkimusaineistojen näkyvyyttä ja lisäämme niiden jatkokäyttöä uusissa tutkimuksissa. Erityisesti sellaiset aineistot, joita ei ole voitu avata repositorioissa, pääsevät nyt pöytälaatikoista päivänvaloon.
Löydä ja uudelleenkäytä tutkimusaineistoja

Datakatalogi kokoaa yhteen tietoja Helsingin yliopiston tutkijoiden ja opiskelijoiden tuottamista tutkimusaineistoista. Datakatalogi ei itsessään sisällä tutkimusaineistoja, vaan niiden meta- eli kuvailutietoja; siis tiedon myös mistä aineisto löytyy ja miten sitä voi käyttää. Jos aineisto ei ole avoimesti saatavilla, voi sitä pyytää käyttöön Datakatalogin kautta.  

Helsingin yliopiston Datakatalogi 

  • kokoaa yhteen tietoja Helsingin yliopistossa tuotetuista tutkimusaineistoista 
  • parantaa tutkimusaineistojen näkyvyyttä ja viitattavuutta 
  • auttaa tutkijoita noudattamaan tutkimusrahoittajien vaatimuksia 
  • edistää avoimen tieteen ja FAIR-periaatteiden toteutumista Helsingin yliopistossa 
  • lisää tutkimuksen yhteiskunnallista vaikuttavuutta 
Tutkimusdatan monet muodot

Datakatalogi voi sisältää metatietoja erityyppisistä tutkimukseen liittyvistä tiedoista. Ainoa edellytys on, että tiedot liittyvät jollain tavalla tutkimukseen. Katalogissa kuvattu tutkimusdata voi olla monessa muodossa riippuen sen alkuperästä, käsittelyvaiheesta ja käyttötarkoituksesta. Kerromme tarkemmin tutkimusaineistoista Datakatalogin UKK-sivulla

Mistä Datakatalogin sisältö on peräisin?

Aineistojen kuvailutiedot tulevat Datakatalogiin automaattisella tiedonsiirrolla, eli harvestoinnilla, sekä tutkijoiden täyttämänä tutkimusaineistojen kuvailulomakkeelta. Harvestoitavien repositorioiden osalta aineiston metatietojen näkyminen Datakatalogissa kuitenkin edellyttää, että aineiston julkaissut tutkija on laittanut affiliaatiokseen Helsingin yliopiston. Tällä hetkellä harvestoimme tietoja Datakatalogiin neljästä repositoriosta: 

  • Data-arkisto 
  • Kielipankki 
  • Tietoarkisto 
  • Zenodo 

Voit myös ehdottaa harvestoitavaa repositoriota meille oheisella lomakkeella!

Meiltä kysytään usein suosituksia nimenomaan Helsingin yliopiston tuottamista datan säilytyspalveluista, joten olemme Datakatalogissa jakaneet repositoriot Helsingin yliopiston omiin ja ulkopuolisiin datarepositorioihin sen mukaan, kuka palvelun tarjoaa. Ilollahan sitä myös mielenkiintoisia säilytyspalveluita tuo esiin!  

 

Helsingin yliopiston omat repositoriot  

Data-arkisto: Helsingin yliopiston Data-arkisto on digitaalisille tutkimusaineistoille tarkoitettu kuratoitu pitkäaikaissäilytyksen palvelu. Kuratoinnilla varmistetaan, että sinne tallennettavat data-aineistot säilyvät ymmärrettävänä ja käytettävänä useiden kymmenien ja jopa satojen vuosien ajan. Avoimesti saatavilla olevia aineistoja voi ladata Data-arkistosta suoraan. Rajatun käyttöoikeuden aineistot edellyttävät yhteydenottoa aineiston yhteyshenkilöön. 

Datapankki: Helsingin yliopiston Datapankki tarjoaa yliopiston piirissä tuotetuille digitaalisille tutkimusaineistoille tallennuspaikan 5–15 vuodeksi. Datapankki on kuratoitu säilytyspalvelu, joka soveltuu myös suurille data-aineistoille. Palvelua ei ole tarkoitettu kaikkein arkaluonteisimmille aineistoille. Aineistojen sopivuus varmistetaan palveluprosessissa. Jos haluat käyttää Datapankissa olevaa aineistoa, pyydä aineistoa Datakatalogin “request access” -napista.  

Kielipankki: Kielipankki on kieliaineistoja käyttävien tutkijoiden palvelukokonaisuus. Kielipankissa on laaja valikoima teksti- ja puheaineistoja, joista voi tehdä monipuolisia hakuja. Aineistoja voi tutkia ja käsitellä virtuaalisessa työtilassa Kielipankin työkaluin tai ladata omalle koneelle. Monet aineistot ovat käytettävissä avoimesti, osa puolestaan oman yliopiston myöntämin tunnuksin. Suojattujen aineistojen käyttöoikeuksia voi hakea sähköisesti. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille ilmaista. 

Muut tallennustilat: Tästä ryhmästä löydät tietoja sellaisista tutkimusaineistoista, jotka sijaitsevat esimerkiksi verkkolevyllä, OneDrivessä tai Umpiossa. Näitä tutkimusaineistoja ei ole avattu repositorioissa, ja harva tietää niiden olemassaolosta. Jos sinulla on aineisto, josta haluat muidenkin tietävän, kuvaile se Datakatalogiin — näin teet tutkimuksestasi FAIR:ia. 

 

Ulkopuoliset datarepositoriot 

Tietoarkisto: Tietoarkisto on erikoistunut erityisesti kysely- ja haastattelututkimusaineistojen säilyttämiseen. Tietoarkiston Aila-palvelussa tallennetut tutkimusaineistot ovat maksutta saatavilla kunkin aineiston käyttöehtojen mukaisesti. Ailassa on runsaasti sekä kvantitatiivisia että kvalitatiivisia tutkimusaineistoja.  

Zenodo: Zenodo on CERN:n ylläpitämä yleisluontoinen, avoin repositorio. Suosittelemme sitä erityisesti silloin, kun tieteenalakohtaista repositoriota ei ole, aineisto ei sisällä luottamuksellisia tai salaisia tietoja, ja kun tallennettavan aineiston koko on alle 50 GB. 

Muut ulkopuoliset datarepositoriot: Tähän kategoriaan olemme koonneet sellaiset repositoriot, jotka eivät (vielä) ole automaattisen tiedonsiirron piirissä. Jos julkaiset tai olet julkaissut tutkimusdataa tällaisissa repositorioissa, voit halutessasi lisätä kuvailutiedot Datakatalogiin.

Sormi suussa?

Ei hätää. Tutustu usein kysyttyihin kysymyksiin Datakatalogista, aineistojen kuvailutiedoista (metadatasta) ja tutkimusaineistojen säilyttämisestä. Jos et löydä vastausta sinua askarruttavaan asiaan, lähetä se meille sähköpostilla: datasupport@helsinki.fi