Tietosuojasta huolehtiminen on tieteellisen tutkimuksen edellytys

Käytettäessä yksikkötason aineistoja tutkimukseen on hyvä pitää mielessä aineistojen käytön eettisyys. Tutkijoilla on harteillaan vastuu siitä, ettei yksikköaineistojen tietosuoja vaarannu. Henkilöiden ja yritysten tietosuoja taataan Suomessa laeilla.

Suomessa on saatavilla kattavia hallinnollisia rekistereitä, jotka antavat hyvät edellytykset tehdä rekisteripohjaista tutkimusta. FMAS-hankkeessa edistetään tutkimuksen tekemistä kehittämällä tutkijoille erilaisia palveluja. Tilastokeskuksen kokoamia yksikköaineistoja on tilastolakiin perustuen mahdollista saada käyttöön tutkimuksia ja selvityksiä varten. Näitä aineistoja voi käyttää etäkäyttöyhteyden kautta, Tilastokeskuksen tutkimuslaboratoriossa tai tutkijan käyttöön luovutettuina otosaineistoina. Otosaineistoissa joudutaan tekemään joskus tutkimusta rajoittavia karkeistuksia ja rajauksia. Kokonaisaineistoja ja välillisesti tunnistettavissa olevia yksikkötason tietoja voi saada käyttöön etäkäyttöympäristössä tai tutkimuslaboratoriossa. 

Tietosuojasta huolehtiminen on tieteellisen tutkimuksen edellytys. Näin saadaan säilytettyä tiedonantajien luottamus tietojen salassapitoon ja mahdollistetaan tietojen saaminen myös tulevaisuudessa. Tilastokeskuksen etäkäyttöjärjestelmän kehittämisen lähtökohtina ovat olleet tutkijoiden tasapuolinen kohtelu, mikroaineistojen käytön tehostaminen sekä turvallisen ja valvotun ympäristön luominen. Etäkäyttöjärjestelmä otettiin käyttöön vuonna 2010 ja sillä on nyt noin 80 eri tutkimushankkeessa yli 140 käyttäjää.

Tilastokeskus haluaa tarjota tutkijoiden saataville tutkimuksen tarkoitukseen sopivat, hyvät aineistot ja toisaalta taata, että henkilöiden ja yritysten tietosuoja säilyy. Tilastokeskuksen etäkäyttöjärjestelmä auttaa tutkijoita huolehtimaan tietosuojasta tutkimushankkeissa. Etäkäytössä tutkijat pääsevät käyttämään käyttöluvallisia mikroaineistoja omalta työpisteeltään luotettavassa ja tietoturvallisessa ympäristössä. Tulosteet saadaan järjestelmästä ulos tarkastusmenettelyn kautta. Vastuu tietoturvan säilymisestä on kuitenkin aina tutkijalla.

Yksikkötason tunnisteet on etäkäytössä salattu pseudotunnisteilla. Pseudotunniste on suoran yksikkötunnisteen korvaava keinotekoinen tunniste, jolla yksikköä voidaan seurata aineistossa ja yksikön tietoja linkittää eri aineistojen välillä. Yksin tämä ei kuitenkaan riitä varmistamaan, etteikö henkilöitä tai yrityksiä tunnisteta. Myös muut tekijät kuten esimerkiksi yrityksen liikevaihdon suuruus yhdistettynä toimialaan tai henkilön synnyinmaa-tieto yhdistettynä kotikuntaan saattavat paljastaa yksittäisen havainnon. Onkin erityisen tärkeää, ettei tutkimustuloksia julkaistaessa esiin nouse yksilöiviä tietoja, joissa tietosuoja vaarantuu.

Tilastokeskus on julkaissut Tilastokoulu-verkkopalvelussaan Tutkimusaineistot etäkäytössä –kokonaisuuden, jossa tutkijoita opastetaan niin etäkäyttöjärjestelmän käyttöoikeuden saamiseen kuin sieltä tulostettavien tietojen tietosuojan turvaamiseen. Kannattaa käydä tutustumassa, vaikka olisit jo etäkäyttäjänä vanha konkari! Tutkimusaineistot etäkäytössä –tilastokoulu löytyy osoitteesta: http://tilastokoulu.stat.fi/verkkokoulu_v2.xql?page_type=ketusivu&course_id=tkoulu_tutki

Kirsi-Marja Aalto, Tilastokeskus/Tutkijapalvelut