Generatiivisen tekoälyn käyttö tutkimuksessa

Helsingin yliopisto tukee generatiivisen tekoälyn vastuullista ja harkittua hyödyntämistä tutkimuksessa. Tämä sivu sisältää tutkijalle tarkoitettuja ohjeita generatiiviseen tekoälyyn perustuvien työkalujen käyttöön.

Generatiivisen tekoälyn käyttöä tutkimuksessa koskeva yliopiston linjaus perustuu Euroopan tutkimusalueen julkaisemaan ohjeistukseen generatiivisen tekoälyn vastuullisesta käytöstä tutkimuksessa (sivustolta suomeksi saatavilla konekäännös). 

Helsingin yliopiston tutkijoiden on noudatettava kaikessa toiminnassaan yliopiston julkaisemia tekoälyn käytön yleisiä periaatteita (Linkki vie Flammaan, joka vaatii kirjautumisen). Perehdy yleisiin periaatteisiin ensin. 

Tutkimusta koskeva tekoälyohjeistus täydentää Tutkimuseettisen neuvottelukunnan (TENK) ohjeita hyvästä tieteellisestä käytännöstä. Generatiivinen tekoäly on vain työkalu – tutkimuksen vakiintuneet eettiset periaatteet koskevat myös tekoälyn tuella tehtävää tutkimusta, ja tekoälytyökalujen vastuullisessa ja eettisessä käytössä pääsee pitkälle terveellä järjellä. 

Helsingin yliopiston tietotekniikkakeskus on koonnut käytännön ohjeita generatiivisen tekoälyn käytöstä yliopistolla. Ohjeet sisältävät vinkkejä erilaisten sovellusten, kuten Copilotin ja CurreChatin (ChatGPT:n pohjalta yliopistolaisille räätälöity työkalu), sekä Kontran (konekäännin, joka kääntää englannin, ruotsin ja suomen välillä) käyttöön. 

Tietotekniikkakeskuksen käytännön ohjeet antavat myös suuntaviivoja ulkoisten tekoälysovellusten, kuten ChatGPT:n ja kuvagenerointipalvelu Midjourneyn käyttöön. Ajan myötä yliopistolaisten käytössä olevien uusien vastaavien työkalujen määrä todennäköisesti kasvaa. 

Tämä ohjeistus koskee generatiivisen tekoälyn käyttöä tutkimuksessa, ja se kattaa kaikki generatiivisen tekoälyn tyypit. Ohjetta päivitetään tarvittaessa. Tulevaisuudessa yliopisto harkitsee ohjeistuksen täydentämistä generatiivisten tekoälysovellusten kehittämistä koskevalla ohjeella. 

Generatiivisen tekoälyn käytön periaatteet

Vastuullisuus

Tutkijat ovat vastuussa omasta generatiivisen tekoälyn käytöstään. Tekoälyä käytettäessä on oltava tietoinen sen tuotoksiin liittyvistä vääristymistä. Tekoälymallin koulutuksessa käytetty aineisto ei välttämättä ole puolueetonta, läpinäkyvää tai eettisesti hyväksyttävää. Lisäksi tulee pitää mielessä virheellisten, epäolennaisten tai epätarkkojen tuotosten riskit. 

ChatGPT:n kaltaiset työkalut pyrkivät tuottamaan sujuvaa, mutta ei välttämättä tosiasioihin perustuvaa tekstiä. Siksi generatiivisen tekoälyn tuotos on aina tarkistettava esimerkiksi varmistamalla asiasisällön oikeellisuus luotettavista tietolähteistä. 

Tekoälyn käyttäjä on itse vastuussa julkaisemastaan sisällöstä. Yliopisto vastaa tarjoamiensa työkalujen teknisestä toiminnasta, mutta ei ota vastuuta muutoin kuin ohjeistamalla tutkijoita niiden käytöstä.

Läpinäkyvyys

Kun generatiivista tekoälyä käytetään merkittävässä määrin tutkimuksessa, on ilmoitettava työkalun nimi ja käytetty versio, käyttöpäivä, käyttötapa sekä työkalun käyttövaihe ja -tarkoitus. Tämä edistää tutkimuksen toistettavuutta ja antaa muille mahdollisuuden arvioida tulosten luotettavuutta. Se myös edistää hyvien käytäntöjen jakamista tutkimusyhteisössä.

Yksityisyys, luottamuksellisuus ja immateriaalioikeudet

Noudata EU:n yleistä tietosuoja-asetusta (GDPR) ja tutkijan tietosuojaohjeita (Linkki vie Flammaan, joka vaatii kirjautumiseen) käsitellessäsi henkilötietoja, tekijänoikeuslaissa määriteltyjä aineistoja ja salassapitosopimuksia. On tekijänoikeuslain vastaista käyttää tekijänoikeuden suojaamia julkaisuja ja muuta materiaalia tekoälytyökalujen syötteenä. 

Älä käytä arkaluonteisia tai luottamuksellisia tietoja tai julkaisemattomia tuloksia syötteenä tietovuotoriskin vuoksi. Jos keräät tai käytät henkilötietoja, tee tietosuojaa koskeva vaikutustenarviointi ennen kuin aloitat tekoälytyökalujen käytön hankkeessasi. 

Tekoälyn etiikka

Ota myös huomioon tutkimuksesi seuraukset ja olettamukset tekoälyn käytön etiikan näkökulmasta (katso esimerkiksi Unescon suositus englanniksi). Tällaisia näkökohtia ovat esimerkiksi etujen ja kustannusten oikeudenmukainen jakautuminen, tasa-arvoinen osallisuus, oikeudenmukaisuus ja syrjimättömyys sekä pakottamisen, alistamisen ja manipuloinnin estäminen. 

Lisäksi turvallisuus- ja tietosuoja-asiat sekä eettiset kysymykset, jotka liittyvät vastuuvelvollisuuteen ja tiedon vastuulliseen jakamiseen ja avoimuuteen tulee ottaa huomioon, unohtamatta sosiaalisia ja muita vaikutuksia, kuten ympäristövaikutuksia).

Yleisiä ohjeita

Nyrkkisääntö: Generatiivisen tekoälyn käytön lisääntyessä myös tarkistamisen, huolellisuuden ja vastuunkannon tarve kasvaa.

Älä käytä

  • Generatiivista tekoälyä ei tule käyttää tilanteissa, joissa työllä on merkittäviä vaikutuksia muihin, kuten tutkimussuunnitelmien arvioinnissa ja julkaistavaksi toimitettujen käsikirjoitusten vertaisarvioinnissa. Älä käytä generatiivista tekoälyä silloin, kun erityisasiantuntemukseesi turvaudutaan. Erilaisia generatiiviseen tekoälyyn pohjautuvia tukityökaluja on kuitenkin jatkuvasti kehitteillä, ja suosittelemme seuraamaan niiden kehitystä. Huomaa, että saatavilla saattaa olla käsikirjoituksia ja julkaisuja, joissa generatiivista tekoälyä on käytetty luvattomasti.
  • Generatiivinen tekoäly vaatii valtavan määrän laskennallista tehoa, mikä johtaa suureen hiilijalanjälkeen. Älä käytä sitä tarpeettomasti. 

Kiinnitä huomiota

  • Kun hyödynnät generatiivisen tekoälyn tuotoksia, kiinnitä huomiota siihen, että saatat plagioida muun muassa tekstiä, koodia ja kuvia. Esimerkiksi ChatGPT:n tuotos voi sisältää suoria lainauksia teksteistä tai osia kuvista ilman, että alkuperäistä kirjoittajaa tai tekijää nimetään. 
  • On yleensä parempi käyttää tehtävään räätälöityjä luotettavia erikoistyökaluja kuin luottaa ChatGPT:n kaltaisiin yleishyödyllisiin sovelluksiin.  
  • Paranna tekoälylukutaitoasi. Generatiivisen tekoälyn nopean kehityksen vuoksi sen edistysaskeleita on hyvä seurata. Yleensä riittää, että seuraat generatiiviseen tekoälyyn liittyviä uutisia tavanomaisista lähteistä sekä asiaan liittyviä keskusteluja omalla tieteenalallasi. Yliopiston omat kurssit, Tekoälyn perusteet ja Tekoälyn etiikka, tarjoavat hyvän lähtökohdan tekoälyn ja siihen liittyvien eettisten kysymysten ymmärtämiseen. 

Tarkista

  • Selvitä käyttämäsi tekoälytyökalun uusimmista käyttöehdoista oikeudet, jotka luovutat palveluntarjoajalle työsi ja tuotostesi uudelleenkäyttöön. Tarkista myös sinulle myönnetyt oikeudet työkalun tuotosten käyttämiseen. 
  • Tehdessäsi yhteistyötä muiden, etenkin muita organisaatioita edustavien kumppaneiden kanssa, sovi heidän kanssaan käytettävistä generatiivisista tekoälytyökaluista ja niiden käyttötavoista. 
Generatiivisen tekoälyn käytön lisääntyessä myös tarkistamisen, huolellisuuden ja vastuunkannon tarve kasvaa.
Periaatteiden ja ohjeiden soveltaminen tutkimushankkeisiin

Generatiivisen tekoälyn käyttö tutkimuksen suunnitteluprosessissa

Tekoälyä voi käyttää ideoinnin apuna, mutta sen tuottamien tulosten tarkkuuteen tai tuoreuteen ei voi luottaa. Generatiivinen tekoäly toimii sen kouluttamiseen käytetyn aineiston varassa, joten sen ei voi odottaa tuottavan uusia, luovia ideoita. Voit käyttää tekoälyä lähteiden etsimisessä ja hyödyntää sitä kirjallisuuskatsausten laatimisessa. Se kuitenkin pystyy tarjoamaan vain vinkkejä. 

On tutkijan vastuulla varmistaa, että lähteet ovat olemassa ja että ne ovat merkityksellisiä tutkimustyön kannalta. Generatiivinen tekoäly voi tuottaa tekstistä myös tiivistelmän tai käännöksen, mutta muista ettet syötä tekijänoikeuksien suojaamaa materiaalia työkaluun. Pidä mielessä, että tekoälytyökalut saattavat tuottaa väärää tai vääristynyttä tietoa. Ne saattavat myös lisätä olemassa olevien teosten tekstiä omaan tekstiisi. Kirjoittajan vastuulla on siis tarkistaa kaikki tekoälyn tuotokset. Varmista lopuksi, että käyttämäsi työkalu ei vuoda siihen syöttämääsi tietoa, jos sitä ei ole avoimesti saatavilla. 

Generatiivisen tekoälyn käytön suunnittelu tutkimuksessa

Generatiivista tekoälyä voi käyttää tuottamaan analyysejä, tai syntetisoimaan tai tiivistämään tietoa, jos on sisäistänyt työkalun puutteet ja eettiset vaikutukset. Käytä tekoälyä asianmukaisesti ja muista kirjata ylös käyttämäsi työkalu, sen versio, käyttöpäivämäärä, ja kuvaus sen käytöstä. Jotta tuloksesi olisivat toistettavissa, tallenna käyttämäsi syötteet eli kehotteet ja saamasi tuotokset. Saatat tarvita tätä tietoa myös raportointia varten. Generatiivisen tekoälyn tuotoksia voidaan käsitellä samoin tavoin kuin tutkimusdataa.

Eettinen arviointi

Jos käytät generatiivista tekoälyä tutkimuksessasi, pohdi sen vaikutuksia. Varmista, että sen eettiset vaikutukset on otettu huomioon hakiessasi tutkimuksellesi eettistä ennakkoarviointia. 

Tarkista rahoittajan generatiivisen tekoälyn käyttöä koskevat periaatteet ja noudata niitä. Jos näitä periaatteita tai toimintatapoja ei ole ilmaistu, voit aina kysyä niistä rahoittajalta. Kerro tekoälyn käytöstä avoimesti: kuvaile hakemuksessasi, miten olet käyttänyt generatiivista tekoälyä, ja kuvaile sen suunniteltu käyttö jos aiot käyttää sitä tutkimuksessasi. Jos aiot käyttää tekoälyä suunnittelemassasi tutkimuksessa, mainitse tämä menetelmäosiossa ja ota käyttö tarvittaessa huomioon aineistonhallintasuunnitelmassa. 

Aineiston keruu

Voit käyttää generatiivista tekoälyä esimerkiksi kyselyn laadinnassa. Koska tekoäly käyttää olemassa olevaa tietoa, ota huomioon, että kysymystesi muotoilut saattavat olla peräisin aikaisemmista kyselyistä. Ideointi ja tietojen koostaminen tekoälyn avulla voivat myös olla hyödyllisiä tässä vaiheessa, kunhan pidät edellä mainitut asiat mielessä. Generatiivista tekoälyä ei kuitenkaan voi käyttää varsinaisen tutkimusdatan tuottamiseen. 

Aineiston kuratointi ja analysointi

Voit käyttää generatiivista tekoälyä sopivien tietojenkäsittely- tai analysointityökalujen (mukaan lukien sovellukset, jotka eivät perustu generatiiviseen tekoälyyn) etsimiseen tai valintaan. 

Ohjelmakoodin luonti

Voit käyttää generatiivista tekoälyä ohjelmointikoodin luomiseen, mutta sinun tulee itse tarkistaa ja testata se. 

Kun raportoit ja julkaiset tutkimustasi (mukaan lukien tieteelliset esitykset, konferenssiesitelmät, lehdistötiedotteet, puheet), tarkista julkaisufoorumin mahdolliset periaatteet generatiivisen tekoälyn suhteen ja noudata niitä. Jos näitä periaatteita tai toimintatapoja ei ole ilmaistu, sinun tulee kysyä niistä tai tutkia samanlaisten julkaisujen vastaavia käytäntöjä. 

Yleensä generatiivista tekoälyä ei voi merkitä kirjoittajaksi yhteisjulkaisuun. Tekoälyä voi käyttää hiomaan tekstin kielioppia ja sanamuotoja tai luomaan visualisointeja aineistosta ja tuloksista, mutta sinun on varmistettava, että tuotokset vastaavat tarkasti tutkimuksesi tuloksia. Kirjoita yksityiskohtainen kuvaus siitä, mitä generatiivisia tekoälytyökaluja käytit merkittävässä määrin tutkimus- ja kirjoitusprosessien aikana. Jotkut tutkijat ovat käyttäneet tekoälyä kirjallisuuskatsauksen teossa, mutta tekoäly on tuottanut esimerkiksi viittauksia olemattomiin lähteisiin ja rajoittuneita näkökantoja. Generatiivista tekoälyä voi käyttää apuna tekstin muotoiluun (kuten LaTeX-koodin tuottamisessa). Huomaa, että jos käytät generatiivista tekoälyä tekstin tai kuvien tuottamiseen, tuotokset saattavat perustua tekijänoikeuksien suojaamaan materiaaliin, jolloin voit syyllistä tahtomattasi plagiointiin. 

Metatiedoissa tulee kertoa generatiivisen tekoälyn käytöstä. 

Missä generatiivisen tekoälyn käyttö tulee kuvailla

Koska generatiivista tekoälyä voi käyttää lähes kaikissa tutkimusprosessin vaiheissa, tarvittava tieto sen käytöstä tulee dokumentoida asianmukaisesti. Yksityiskohdat ovat kuitenkin kirjoittajan harkinnan varassa. Voit esimerkiksi kuvata generatiivisen tekoälyn käyttöä tutkimussuunnitelmassa, jos aiot käyttää sitä apuna tutkimuskysymykseen vastaamisessa, tai tiedonhallintasuunnitelmassa, jos aiot käyttää sitä apuna aineistosi analysoinnissa. 

EU:n tekoälyasetuksen vaikutus tutkimukseen

Euroopan unioni on antanut uuden asetuksen tekoälystä. Tämän asetuksen soveltamisalan ulkopuolelle jäävät tekoälyjärjestelmät ja -mallit, jotka on erityisesti kehitetty ja otettu käyttöön yksinomaan tieteellistä tutkimusta ja kehittämistoimintaa varten. Asetusta kuitenkin sovelletaan, jos tekoälyjärjestelmää testataan tosielämän olosuhteissa tai aiotaan saattaa markkinoille. Jos aiot kaupallistaa tekoälytyökalun, ota yhteyttä Helsingin yliopiston lakipalveluihin mahdollisimman varhaisessa vaiheessa. 

Sanastoa

Generatiivinen tekoäly: tekoäly, joka tuottaa sisältöä, kuten tekstiä, kuvia yms. 

Vääristymät: epätäydelliset tai epätarkat tekoälyn tuottamat tiedot Mallin koulutukseen käytetty tietoaineisto voi olla vääristynyttä vaikkapa niin, että siitä puuttuu tiettyihin etnisiin ryhmiin tai vähemmistöihin kuuluvat henkilöt. Esimerkiksi ChatGPT:hen käytetty aineisto on kielellisesti ja maantieteellisesti vääristynyttä, koska se perustuu laajalti englanninkielisiin teksteihin ja julkaisuihin pääasiassa Yhdysvalloista. 

Tietovuoto: tietojen levittäminen suunnitellun ympäristön ulkopuolella, tyypillisesti tahattomasti tai vahingossa. 

LaTeX-koodi: LaTeX on ladontajärjestelmä, jossa voidaan käyttää muun muassa räätälöityjä koodityylejä, värejä ja kieliä. 

Syntetisoitu tai synteettinen data: keinotekoisesti tuotettua tietoa, jolla pyritään jäljittelemään todellista tietoa.