Generatiivisen tekoälyn käyttöä tutkimuksessa koskeva yliopiston linjaus perustuu Euroopan tutkimusalueen julkaisemaan ohjeistukseen generatiivisen tekoälyn vastuullisesta käytöstä tutkimuksessa (sivustolta suomeksi saatavilla konekäännös).
Helsingin yliopiston tutkijoiden on noudatettava kaikessa toiminnassaan yliopiston julkaisemia tekoälyn käytön yleisiä periaatteita (Linkki vie Flammaan, joka vaatii kirjautumisen). Perehdy yleisiin periaatteisiin ensin.
Tutkimusta koskeva tekoälyohjeistus täydentää Tutkimuseettisen neuvottelukunnan (TENK) ohjeita hyvästä tieteellisestä käytännöstä. Generatiivinen tekoäly on vain työkalu – tutkimuksen vakiintuneet eettiset periaatteet koskevat myös tekoälyn tuella tehtävää tutkimusta, ja tekoälytyökalujen vastuullisessa ja eettisessä käytössä pääsee pitkälle terveellä järjellä.
Helsingin yliopiston tietotekniikkakeskus on koonnut käytännön ohjeita generatiivisen tekoälyn käytöstä yliopistolla. Ohjeet sisältävät vinkkejä erilaisten sovellusten, kuten Copilotin ja CurreChatin (ChatGPT:n pohjalta yliopistolaisille räätälöity työkalu), sekä Kontran (konekäännin, joka kääntää englannin, ruotsin ja suomen välillä) käyttöön.
Tietotekniikkakeskuksen käytännön ohjeet antavat myös suuntaviivoja ulkoisten tekoälysovellusten, kuten ChatGPT:n ja kuvagenerointipalvelu Midjourneyn käyttöön. Ajan myötä yliopistolaisten käytössä olevien uusien vastaavien työkalujen määrä todennäköisesti kasvaa.
Tämä ohjeistus koskee generatiivisen tekoälyn käyttöä tutkimuksessa, ja se kattaa kaikki generatiivisen tekoälyn tyypit. Ohjetta päivitetään tarvittaessa. Tulevaisuudessa yliopisto harkitsee ohjeistuksen täydentämistä generatiivisten tekoälysovellusten kehittämistä koskevalla ohjeella.
Tutkijat ovat vastuussa omasta generatiivisen tekoälyn käytöstään. Tekoälyä käytettäessä on oltava tietoinen sen tuotoksiin liittyvistä vääristymistä. Tekoälymallin koulutuksessa käytetty aineisto ei välttämättä ole puolueetonta, läpinäkyvää tai eettisesti hyväksyttävää. Lisäksi tulee pitää mielessä virheellisten, epäolennaisten tai epätarkkojen tuotosten riskit.
ChatGPT:n kaltaiset työkalut pyrkivät tuottamaan sujuvaa, mutta ei välttämättä tosiasioihin perustuvaa tekstiä. Siksi generatiivisen tekoälyn tuotos on aina tarkistettava esimerkiksi varmistamalla asiasisällön oikeellisuus luotettavista tietolähteistä.
Tekoälyn käyttäjä on itse vastuussa julkaisemastaan sisällöstä. Yliopisto vastaa tarjoamiensa työkalujen teknisestä toiminnasta, mutta ei ota vastuuta muutoin kuin ohjeistamalla tutkijoita niiden käytöstä.
Kun generatiivista tekoälyä käytetään merkittävässä määrin tutkimuksessa, on ilmoitettava työkalun nimi ja käytetty versio, käyttöpäivä, käyttötapa sekä työkalun käyttövaihe ja -tarkoitus. Tämä edistää tutkimuksen toistettavuutta ja antaa muille mahdollisuuden arvioida tulosten luotettavuutta. Se myös edistää hyvien käytäntöjen jakamista tutkimusyhteisössä.
Noudata EU:n yleistä tietosuoja-asetusta (GDPR) ja tutkijan tietosuojaohjeita (Linkki vie Flammaan, joka vaatii kirjautumiseen) käsitellessäsi henkilötietoja, tekijänoikeuslaissa määriteltyjä aineistoja ja salassapitosopimuksia. On tekijänoikeuslain vastaista käyttää tekijänoikeuden suojaamia julkaisuja ja muuta materiaalia tekoälytyökalujen syötteenä.
Älä käytä arkaluonteisia tai luottamuksellisia tietoja tai julkaisemattomia tuloksia syötteenä tietovuotoriskin vuoksi. Jos keräät tai käytät henkilötietoja, tee tietosuojaa koskeva vaikutustenarviointi ennen kuin aloitat tekoälytyökalujen käytön hankkeessasi.
Ota myös huomioon tutkimuksesi seuraukset ja olettamukset tekoälyn käytön etiikan näkökulmasta (katso esimerkiksi Unescon suositus englanniksi). Tällaisia näkökohtia ovat esimerkiksi etujen ja kustannusten oikeudenmukainen jakautuminen, tasa-arvoinen osallisuus, oikeudenmukaisuus ja syrjimättömyys sekä pakottamisen, alistamisen ja manipuloinnin estäminen.
Lisäksi turvallisuus- ja tietosuoja-asiat sekä eettiset kysymykset, jotka liittyvät vastuuvelvollisuuteen ja tiedon vastuulliseen jakamiseen ja avoimuuteen tulee ottaa huomioon, unohtamatta sosiaalisia ja muita vaikutuksia, kuten ympäristövaikutuksia).
Nyrkkisääntö: Generatiivisen tekoälyn käytön lisääntyessä myös tarkistamisen, huolellisuuden ja vastuunkannon tarve kasvaa.
Tekoälyä voi käyttää ideoinnin apuna, mutta sen tuottamien tulosten tarkkuuteen tai tuoreuteen ei voi luottaa. Generatiivinen tekoäly toimii sen kouluttamiseen käytetyn aineiston varassa, joten sen ei voi odottaa tuottavan uusia, luovia ideoita. Voit käyttää tekoälyä lähteiden etsimisessä ja hyödyntää sitä kirjallisuuskatsausten laatimisessa. Se kuitenkin pystyy tarjoamaan vain vinkkejä.
On tutkijan vastuulla varmistaa, että lähteet ovat olemassa ja että ne ovat merkityksellisiä tutkimustyön kannalta. Generatiivinen tekoäly voi tuottaa tekstistä myös tiivistelmän tai käännöksen, mutta muista ettet syötä tekijänoikeuksien suojaamaa materiaalia työkaluun. Pidä mielessä, että tekoälytyökalut saattavat tuottaa väärää tai vääristynyttä tietoa. Ne saattavat myös lisätä olemassa olevien teosten tekstiä omaan tekstiisi. Kirjoittajan vastuulla on siis tarkistaa kaikki tekoälyn tuotokset. Varmista lopuksi, että käyttämäsi työkalu ei vuoda siihen syöttämääsi tietoa, jos sitä ei ole avoimesti saatavilla.
Generatiivista tekoälyä voi käyttää tuottamaan analyysejä, tai syntetisoimaan tai tiivistämään tietoa, jos on sisäistänyt työkalun puutteet ja eettiset vaikutukset. Käytä tekoälyä asianmukaisesti ja muista kirjata ylös käyttämäsi työkalu, sen versio, käyttöpäivämäärä, ja kuvaus sen käytöstä. Jotta tuloksesi olisivat toistettavissa, tallenna käyttämäsi syötteet eli kehotteet ja saamasi tuotokset. Saatat tarvita tätä tietoa myös raportointia varten. Generatiivisen tekoälyn tuotoksia voidaan käsitellä samoin tavoin kuin tutkimusdataa.
Jos käytät generatiivista tekoälyä tutkimuksessasi, pohdi sen vaikutuksia. Varmista, että sen eettiset vaikutukset on otettu huomioon hakiessasi tutkimuksellesi eettistä ennakkoarviointia.
Tarkista rahoittajan generatiivisen tekoälyn käyttöä koskevat periaatteet ja noudata niitä. Jos näitä periaatteita tai toimintatapoja ei ole ilmaistu, voit aina kysyä niistä rahoittajalta. Kerro tekoälyn käytöstä avoimesti: kuvaile hakemuksessasi, miten olet käyttänyt generatiivista tekoälyä, ja kuvaile sen suunniteltu käyttö jos aiot käyttää sitä tutkimuksessasi. Jos aiot käyttää tekoälyä suunnittelemassasi tutkimuksessa, mainitse tämä menetelmäosiossa ja ota käyttö tarvittaessa huomioon aineistonhallintasuunnitelmassa.
Voit käyttää generatiivista tekoälyä esimerkiksi kyselyn laadinnassa. Koska tekoäly käyttää olemassa olevaa tietoa, ota huomioon, että kysymystesi muotoilut saattavat olla peräisin aikaisemmista kyselyistä. Ideointi ja tietojen koostaminen tekoälyn avulla voivat myös olla hyödyllisiä tässä vaiheessa, kunhan pidät edellä mainitut asiat mielessä. Generatiivista tekoälyä ei kuitenkaan voi käyttää varsinaisen tutkimusdatan tuottamiseen.
Voit käyttää generatiivista tekoälyä sopivien tietojenkäsittely- tai analysointityökalujen (mukaan lukien sovellukset, jotka eivät perustu generatiiviseen tekoälyyn) etsimiseen tai valintaan.
Voit käyttää generatiivista tekoälyä ohjelmointikoodin luomiseen, mutta sinun tulee itse tarkistaa ja testata se.
Kun raportoit ja julkaiset tutkimustasi (mukaan lukien tieteelliset esitykset, konferenssiesitelmät, lehdistötiedotteet, puheet), tarkista julkaisufoorumin mahdolliset periaatteet generatiivisen tekoälyn suhteen ja noudata niitä. Jos näitä periaatteita tai toimintatapoja ei ole ilmaistu, sinun tulee kysyä niistä tai tutkia samanlaisten julkaisujen vastaavia käytäntöjä.
Yleensä generatiivista tekoälyä ei voi merkitä kirjoittajaksi yhteisjulkaisuun. Tekoälyä voi käyttää hiomaan tekstin kielioppia ja sanamuotoja tai luomaan visualisointeja aineistosta ja tuloksista, mutta sinun on varmistettava, että tuotokset vastaavat tarkasti tutkimuksesi tuloksia. Kirjoita yksityiskohtainen kuvaus siitä, mitä generatiivisia tekoälytyökaluja käytit merkittävässä määrin tutkimus- ja kirjoitusprosessien aikana. Jotkut tutkijat ovat käyttäneet tekoälyä kirjallisuuskatsauksen teossa, mutta tekoäly on tuottanut esimerkiksi viittauksia olemattomiin lähteisiin ja rajoittuneita näkökantoja. Generatiivista tekoälyä voi käyttää apuna tekstin muotoiluun (kuten LaTeX-koodin tuottamisessa). Huomaa, että jos käytät generatiivista tekoälyä tekstin tai kuvien tuottamiseen, tuotokset saattavat perustua tekijänoikeuksien suojaamaan materiaaliin, jolloin voit syyllistä tahtomattasi plagiointiin.
Metatiedoissa tulee kertoa generatiivisen tekoälyn käytöstä.
Koska generatiivista tekoälyä voi käyttää lähes kaikissa tutkimusprosessin vaiheissa, tarvittava tieto sen käytöstä tulee dokumentoida asianmukaisesti. Yksityiskohdat ovat kuitenkin kirjoittajan harkinnan varassa. Voit esimerkiksi kuvata generatiivisen tekoälyn käyttöä tutkimussuunnitelmassa, jos aiot käyttää sitä apuna tutkimuskysymykseen vastaamisessa, tai tiedonhallintasuunnitelmassa, jos aiot käyttää sitä apuna aineistosi analysoinnissa.
Euroopan unioni on antanut uuden asetuksen tekoälystä. Tämän asetuksen soveltamisalan ulkopuolelle jäävät tekoälyjärjestelmät ja -mallit, jotka on erityisesti kehitetty ja otettu käyttöön yksinomaan tieteellistä tutkimusta ja kehittämistoimintaa varten. Asetusta kuitenkin sovelletaan, jos tekoälyjärjestelmää testataan tosielämän olosuhteissa tai aiotaan saattaa markkinoille. Jos aiot kaupallistaa tekoälytyökalun, ota yhteyttä Helsingin yliopiston lakipalveluihin mahdollisimman varhaisessa vaiheessa.
Generatiivinen tekoäly: tekoäly, joka tuottaa sisältöä, kuten tekstiä, kuvia yms.
Vääristymät: epätäydelliset tai epätarkat tekoälyn tuottamat tiedot Mallin koulutukseen käytetty tietoaineisto voi olla vääristynyttä vaikkapa niin, että siitä puuttuu tiettyihin etnisiin ryhmiin tai vähemmistöihin kuuluvat henkilöt. Esimerkiksi ChatGPT:hen käytetty aineisto on kielellisesti ja maantieteellisesti vääristynyttä, koska se perustuu laajalti englanninkielisiin teksteihin ja julkaisuihin pääasiassa Yhdysvalloista.
Tietovuoto: tietojen levittäminen suunnitellun ympäristön ulkopuolella, tyypillisesti tahattomasti tai vahingossa.
LaTeX-koodi: LaTeX on ladontajärjestelmä, jossa voidaan käyttää muun muassa räätälöityjä koodityylejä, värejä ja kieliä.
Syntetisoitu tai synteettinen data: keinotekoisesti tuotettua tietoa, jolla pyritään jäljittelemään todellista tietoa.