Riktlinjer för användning av generativ artificiell intelligens inom forskning

Helsingfors universitet stöder ansvarsfull och kritisk användning av generativ artificiell intelligens (GenAI) för forskningsändamål. På denna sida hittar du anvisningar om användningen av GenAI-verktyg inom forskning.

Dessa riktlinjer grundar sig på Europeiska forskningsområdets (ERA) dokument ”Living guidelines on the responsible use of generative AI in research”. 

Forskare vid Helsingfors universitet ska följa de allmänna principerna för användningen av artificiell intelligens (kräver inloggning). Vänligen läs dessa användningsprinciper innan du fortsätter.  

Därutöver ersätter riktlinjerna på denna sida inte Forskningsetiska delegationens (TENK) riktlinjer för god vetenskaplig praxis, utan kompletterar dem. GenAI är bara ett verktyg – allmän forskningsetik gäller, och sunt förnuft är viktigt för att använda liknande verktyg på ett ansvarsfullt och etiskt sätt. 

Centret för informationsteknologi vid Helsingfors universitet har redan tagit fram praktiska riktlinjer för Generativ AI vid universitetet, som innefattar anvisningar för att använda verktyg såsom CopilotCurreChat (ChatGPT för Helsingfors universitet), och Kontra (maskinöversättning mellan finska, svenska och engelska). Därutöver erbjuder dessa praktiska riktlinjer anvisningar för att använda externa GenAI-lösningar, såsom ChatGPT och applikationer för skapande av bilder, såsom Midjourney. Troligtvis kommer nya verktyg att vara tillgängliga för universitetet senare. 

Observera att dessa riktlinjer för användningen av GenAI inom forskning är avsedda för alla typer av generativ AI, och de uppdateras enligt behov. Universitetet kommer senare att överväga att även lägga till anvisningar för utvecklingen av GenAI-lösningar. 

Principer för användning av generativ AI

Ansvar

Forskare ansvarar för sin egen användning av GenAI. När du använder GenAI ska du vara medveten om de begränsningar som gäller snedvridning (data som används för träning av AI-modellen är inte nödvändigtvis balanserade, transparenta eller etiska), risken att producera felaktiga eller icke-relevanta utdata samt oriktigheter. Verktyg såsom till exempel ChatGPT syftar till att producera välskriven text, inte nödvändigtvis faktabaserad eller faktakontrollerad text. Därför måste du alltid verifiera det som GenAI producerat genom att till exempel konsultera tillförlitliga informationskällor, eftersom du som användare ansvarar för innehållet och produktionen. Universitetet ansvarar för de tekniska elementen av de verktyg som universitetet erbjuder, men begränsar sitt ansvar till att ge forskarna anvisningar om att använda verktyget i fråga.  

Transparens

När du i betydande utsträckning använder GenAI i din forskning ska du ange namnet på verktyget och versionen som du använt, datumet för användningen, hur du använt verktyget och för vilket arbetssteg eller ändamål. Detta gör det lättare att reproducera forskningen och tillåter andra att bedöma riktigheten av dina resultat. Det hjälper även forskningssamfundet att dela bästa praxis. 

Integritet, sekretess och immateriella rättigheter

Följ GDPR och dataskyddsanvisningarna (kräver inloggning) när du behandlar personuppgifter, upphovsrättslagar och sekretessavtal. Det är emot upphovsrättslagarna att använda material som omfattas av upphovsrätt, till exempel publikationer, som indata för GenAI-verktyg. Använd inte känsliga eller sekretessbelagda data eller opublicerade resultat som indata, eftersom det finns risk att informationen ”läcker ut”. Slutligen, innan du inleder ett projekt där du använder GenAI-verktyg krävs det en konsekvensbedömning avseende dataskydd om du samlar in eller använder data som gäller individer. 

AI-etik

Beakta även din forsknings konsekvenser och antaganden med hänsyn till AI-etik (se till exempel UNESCOs rekommendationer om etik för artificiell intelligens på engelska). Sådana överväganden innefattar till exempel en rättvis fördelning av fördelar och kostnader, rättvis inkludering, frihet från oskälig snedvridning och diskriminering samt förebyggande av oberättigat tvång, underordnande och manipulation. Utöver dessa är det också viktigt att beakta säkerhet, trygghet, integritetsfrågor och etiska frågor som gäller ansvar och ansvarsfull distribution, transparens samt sociala och andra effekter (även miljöeffekter).

Allmänna råd

Tumregel: Ju mer du förlitar dig på ett GenAI-verktyg, desto mer verifiering, kontroll och ansvar krävs av dig. 

Använd inte

  • Använd inte GenAI i situationer där ditt arbete har viktiga följder för andra, såsom vid utvärdering av forskningsplaner och referentgranskning av manuskript som lämnats in för publicering. Fall där din specifika expertis behövs är inte lämpliga för användning av GenAI. Olika GenAI-stödverktyg utvecklas dock kontinuerligt, och vi rekommenderar att följa utvecklingen av dem i till exempel dessa områden. Observera att det kan förekomma manuskript och publikationer där GenAI har använts på illegitima sätt. 
  • GenAI använder en enorm mängd beräkningskraft, vilket medför ett stort koldioxidavtryck. Använd inte verktyget i onödan.  

Var uppmärksam

  • Var uppmärksam i fråga om till exempel potentiell plagiering av text, kod och bilder när du använder utdata från GenAI. Till exempel kan ett resultat från ChatGPT innehålla direkta citat ur texter eller delar av bilder, utan någon hänvisning till den ursprungliga författaren eller skaparen. 
  • Om det finns gedigna, specialiserade, pålitliga verktyg som är skräddarsydda för arbetet, är det i allmänhet bättre att använda dem istället för att förlita sig på allmänna verktyg såsom ChatGPT.   
  • Utveckla din ”AI-läskunnighet”. Eftersom GenAI utvecklas snabbt är det bra att följa utvecklingen. Vanligtvis räcker det att följa allmänna nyhetskällor och diskussioner om GenAI som förs inom ditt eget vetenskapsområde. Universitetets egna MOOC-kurser, Elements of AI och Ethics of AI, är bra utgångspunkter för att lära sig om AI och AI-etik. 

Kontrollera

  • Kontrollera de senaste användningsvillkoren för det GenAI-verktyg du planerar att använda, för att förstå vilka rättigheter du ger verktygets leverantör när det gäller återanvändning av ditt arbete och dina utdata, samt vilka rättigheter de ger dig att använda utdata som genereras av verktyget.  
  • När du arbetar med samarbetspartner, särskilt vid andra organisationer, ska du komma överens om vilka GenAI-verktyg ni använder i ert gemensamma arbete och hur. 
Ju mer du förlitar dig på ett GenAI-verktyg, desto mer verifiering, kontroll och ansvar krävs av dig.
Tillämpning av principerna och råden på ett forskningsprojekt

Användning av GenAI vid forskningsplanering

Du kan använda GenAI för brainstormning, men du kan inte lita på att resultaten som genereras av verktyget är riktiga eller nyskapande. GenAI förlitar sig på de data som getts när modellen tränades. Därför kan du inte förvänta dig nya, kreativa idéer av GenAI. Du kan använda GenAI för att hitta informationskällor och hjälpa med din litteraturöversikt. Verktyget kan dock endast ge dig förslag. Det är ditt ansvar att säkerställa att källorna existerar och att de är relevanta för ditt arbete. GenAI kan också användas för att sammanfatta en given text eller översättning, men kom ihåg att inte lägga till upphovsrättsskyddat material till ett verktyg. Kom ihåg att GenAI-verktyg är benägna att producera felaktiga utdata eller biaser. De kan också lägga till existerande verk till din text. Därför är det på författarens ansvar att utvärdera alla utdata. Slutligen ska du försäkra dig om att det använda verktyget inte läcker data, om de indata som använts inte är tillgängliga som öppet källmaterial. 

Planering av användningen av GenAI i din forskning

Du kan använda GenAI som hjälp med att producera analyser eller för att sammanställa eller sammanfatta data, om du förstår verktygets begränsningar och de etiska konsekvenserna. Du ska ha klar vetskap om hur GenAI används på ett lämpligt sätt, och kom ihåg att ange det specifika verktyget som du använt, versionen, datumet för användningen och hur du använt verktyget. För att göra dina resultat reproducerbara, och ifall att de behövs för rapportering, ska du spara dina indata (dvs. promptar) och utdata. Resultaten från GenAI-verktyget kan behandlas på samma sätt som forskningsdata.

Etikprövning

När du ber om etikprövning ska du i din begäran komma ihåg att ta upp användningen av GenAI om du kommer att använda sådan i din forskning, och säkerställa att de etiska konsekvenserna beaktas.

Kontrollera och följ finansieringsorganets GenAI-policy. Om ingen GenAI-policy har angetts, kan du alltid fråga finansiären hur de förhåller sig till användningen av GenAI. Var transparent om din användning. Beskriv i din ansökan hur du har använt GenAI. Om du använder GenAI i din forskning ska du förklara hur den används. Om du kommer att använda AI i din planerade forskning ska du komma ihåg att nämna det i metodkapitlet och ta hänsyn till användningen i datahanteringsplanen. 

Datainsamling

Du kan använda GenAI till exempel för att utarbeta ett frågeformulär. Kom ihåg att GenAI använder sig av existerande information. Således kan dina frågor förekomma i tidigare arbeten. Brainstormning och datainsamling kan också vara till nytta i detta skede om de tidigare nämnda frågorna också beaktas. GenAI kan dock inte användas för att generera dina egentliga forskningsdata. 

Datakurering och analys

Du kan använda GenAI för att hitta och välja lämpliga verktyg för datakurering eller dataanalys, även verktyg som inte är GenAI. 

Generering av datorkod

Du kan använda GenAI för att generera datorkod, men du måste kontrollera och testa den själv. 

När du rapporterar och publicerar din forskning (t.ex. vetenskapliga artiklar, konferensföredrag, pressmeddelanden) ska du kontrollera och följa den eventuella GenAI-policy som forumet i fråga har. Om ingen GenAI-policy anges ska du fråga om användningen av GenAI eller undersöka liknande publikationer.  

I allmänhet kan GenAI inte anges som medförfattare. Du kan använda GenAI för att förbättra grammatiken och formuleringen av din text eller för att skapa visualiseringar av dina data och resultat, men du måste försäkra dig om att verktygets produkt beskriver dina rön på ett korrekt sätt. Beskriv i detalj vilka GenAI-verktyg som i betydande mån har använts i forskningsprocessen och vid skrivandet. Vissa forskare har använt GenAI för att göra upp en litteraturöversikt, med dåliga resultat (t.ex. obefintliga referenser, begränsade synvinklar). Du kan använda GenAI som hjälp med editering (t.ex. för att producera LaTeX-kod). Notera att om du använder GenAI för att producera text eller illustrationer finns det en risk att den resulterande texten eller illustrationen har använt sig av upphovsrättsskyddat material och du kan oavsiktligt göra dig skyldig till plagiering.  

I eventuella metadata ska du ange information om att du använt GenAI. 

Var beskriva användningen av GenAI

GenAI-verktyg kan användas nästan i vilken fas som helst i forskningsprocessen. Därför ska du ange den behövliga informationen om dess användning där det är relevant. De exakta uppgifterna som anges är dock upp till författaren. Du kan till exempel beskriva din användning av GenAI i forskningsplanen om du planerar att använda GenAI för att hjälpa dig besvara din forskningsfråga, eller i datahanteringsplanen om du planerar att använda GenAI som hjälp med din dataanalys.  

Hur påverkar EU:s lag om artificiell intelligens forskning?

EU har utfärdat en ny förordning om artificiell intelligens. EU:s AI-förordning (på engelska) gäller inte om ett AI-system utvecklas och tas i bruk endast för vetenskaplig forskning och utveckling. Förordningen gäller dock om systemet testas i den verkliga världen eller om du planerar på att införa ett AI-system på marknaden. Om du har planer på att kommersialisera ett AI-verktyg ska du kontakta universitetets jurister så snart som möjligt.  

Ordlista

Generativ AI: artificiell intelligens som genererar data (t.ex. text, bilder) 

Snedvridning: ofullständiga eller felaktiga data som produceras av AI. De data som används för träning av AI kan vara förvrängda, till exempel så att icke-vita människor eller minoriteter exkluderas. Till exempel är de data som används för ChatGPT språkligt och geografiskt snedvridna, i och med att de är vinklade mot engelskspråkiga texter och publikationer, främst från USA. 

Dataläckage: data som görs tillgängliga utanför den tänkta miljön, vanligtvis oavsiktligt eller av misstag. 

LaTeX-kod: LaTeX är ett typsättningsprogram som kan basera sig på bland annat skräddarsydda taggar, färger och språk. 

Syntetiska data: artificiellt producerade data som försöker imitera verkliga data.