Kansallinen rekisteri- ja mikroaineistojen tutkijapalvelu

Finnish Microdata Access Services (FMAS)

Hankkeen kuvaus

FMAS (Finnish Microdata Access Services, Kansallinen rekisteri- ja mikroaineistojen tutkijapalvelu) on vuonna 2014 uusitulla tutkimusinfrastruktuurien tiekartalla oleva uusi tutkimusinfrastruktuuri. Se on suunniteltu helpottamaan rekisteritietojen ja tilastoaineistojen tutkimuskäyttöä tutkimusprosessin kaikissa vaiheissa. Tutkijapalvelu koostuu neljästä keskenään yhteen toimivasta palvelusta, jotka yhdessä tarjoavat yksikanavaisen väylän tutkimuksen suunnittelusta aineiston analysointiin:

  • Aineistokatalogi: metatietojen hakupalvelu, josta saa tietoja käytettävissä olevista rekisteritietovarannoista rekisteri- ja muuttujatasoisesti
  • Käyttölupien sähköinen hakupalvelu: tietojen käyttölupien hakeminen eri viranomaisilta periaatteella yksi hakemus per yksi tutkimus
  • Etätyöpöytä: käyttölupiin perustuvien aineistojen yhdistelyyn ja analysointiin tarkoitettu varusteltu etätyöpöytä, joka on kapasiteetiltaan ohjelmistoltaan hyvin varusteltu
  • Informaatio- ja tukipalvelu: tarjoaa tukea ja neuvontaa kaikissa rekisteritutkimukseen liittyvissä kysymyksissä ja ylläpitää FMAS-webportaalia

Kokonaisuudessaan palvelu parantaa merkittävästi julkishallinnon aineistojen löydettävyyttä, saatavuutta ja käytettävyyttä. Palvelu parantaa myös henkilötietojen tietosuojan toteutumista tutkimuksen koko elinkaaren ajan.

Hankkeen tarve

Rekistereillä on Suomessa pitkät perinteet: väestötietojen kerääminen aloitettiin jo 1700-luvulla. Nykyisin väestöä ja yhteiskuntaa koskevia tietoja kerätään useisiin eri rekistereihin, joita eri viranomaiset ylläpitävät. Rekisterit muodostavat merkittävän valmiina olevan ja koko ajan kasvavan ja päivittyvän tietovarannon, jota on mahdollista hyödyntää tieteellisessä tutkimuksessa. Suuri osa näistä aineistoista on henkilörekistereitä, joita on mahdollista yhdistellä henkilötunnuksen avulla. Eri rekistereiden tietojen yhdistäminen mahdollistaa monipuolisten tutkimusaineistojen muodostamisen. Tietojen tutkimuskäyttöön saaminen on nykyisellään monimutkaista, sillä rekisterit ovat hajallaan eri hallinnonaloilla ja kullakin aineiston hallinnoijalla on omat lupa- ja aineistonluovutusmenettelynsä. Lisäksi rekistereiden tietosisällöistä saatavissa oleva tieto (metatieto) on hajallaan eri viranomaisilla ja se on sisällöltään puutteellista. Tutkijat joutuvat asioimaan useiden viranomaisten kanssa, jos tutkimuksessa halutaan yhdistää eri viranomaisten hallinnoimia tietoja. Tästä johtuen käyttöluvan ja aineiston saaminen kestää kauan, jopa yli vuoden. Rekisteritietoja ei näistä syistä hyödynnetä tieteellisessä tutkimuksessa läheskään siinä määrin kuin niissä olisi potentiaalia.

Tilastokeskuksessa on eri viranomaisten keräämistä tiedoista muodostuvia laajoja tietovarantoja, joita kerätään tilastotarkoituksiin. Näiden tietojen tietosuojan parantamiseksi Tilastokeskus kehittää tutkijoiden käyttöön monipuolista etätyöpöytää.  Etäkäytössä ongelmia ovat aiheuttaneet kapasiteetin riittämättömyys ja toimintahäiriöt,  jotka yhdessä korkeiden käyttökustannusten kanssa ovat osaltaan vaikeuttaneet rekisteritietojen tutkimuskäyttöä. Kehitteillä oleva etätyöpöytä on kapasiteetiltaan suuri ja ohjelmistoltaan monipuolinen ja mahdollistaa tietojen yhdistely ja aineiston analysoinnin.

Hankkeen taustaa

Edeltävä infrastruktuuri: Rekisteritutkimuksen tukikeskus (ReTki)

Vuosina 2003–2014 toiminut Rekisteritutkimuksen tukikeskus on edistänyt rekisteritutkimusta monin tavoin. Se on ylläpitänyt web-portaalia, josta on saanut monipuolista tietoa rekistereistä, niiden tietosisällöstä sekä lupamenettelyistä. Web-portaalin tarkoituksena on ollut rekisteritietojen tutkimuskäytön edistäminen. ReTki on myös tarjonnut koulutusta ja neuvontaa, edistänyt monin tavoin rekisteritutkimusta kansallisella tasolla ja ylläpitänyt rekisteritutkimuksen verkostoja. ReTki sai kansallisen tutkimusinfrastruktuurin statuksen, kun se valittiin Suomen ensimmäiselle kansalliselle tiekartalle vuonna 2009. ReTkin toimintaa ovat eri aikoina rahoittaneet Suomen Akatemia (2003–2005 ja 2013–2014), Kela (2006–2012), THL ja sen edeltäjät KTL ja Stakes (2006–2011) sekä Työterveyslaitos (2006–2011).

ReTkin tarjoamat palvelut jatkuvat uuden FMAS-palvelun informaatio- ja tukipalvelussa.

Edeltävät hankkeet

Keväällä 2008 ReTki esitti rekisteritietojen etäkäyttöön liittyvää hanketta kansalliselle tutkimusinfrastruktuurien tiekartalle. Ehdotusta ei pidetty riittävän pitkälle valmisteltuna, mutta se noteerattiin yhdessä 12 muun hankkeen kanssa hankkeeksi, jolla arvioitiin olevan mahdollisuus kehittyä merkittäväksi kansalliseksi infrastruktuuriksi.
Vuosien 2009–2011 aikana rekisteritietojen etäkäyttömahdollisuutta kehitettiin kolmessa erillisessä hankkeessa:

1)  MIDRAS (2009–2011) oli opetusministeriön rahoittama ReTkin ja CSC:n yhteinen hanke,  jossa selvitettiin miten rekisteritutkimusta ja rekisteripohjaisten aineistojen saatavuutta voidaan tehostaa etäkäytön avulla. Hankkeesta on julkaistu kaksi raporttia:

2) Tilastokeskuksen etätyöympäristön kehitystyö vuodesta 2008 lähtien

3)  TURE-hanke oli valtiovarainministeriön kaudelle  1.6.2010–30.9.2011 asettama työryhmä, jonka tehtäväksi annettiin

  • Selvittää Tilastokeskuksen ja Midras-projektin etäkäyttöhankkeiden yhteiskehittämismahdollisuudet,
  • Selvittää ja tehdä ehdotus etäkäyttöjärjestelmien hallintomalliksi sekä
  • Selvittää ja tehdä ehdotus järjestelmien toteuttamisen ja ylläpidon resursoinniksi ja rahoitukseksi.

Tavoite oli muotoiltu seuraavasti: Tavoitteena on, että Suomessa tarjotaan hallinnollisten aineistojen sekä tilastorekisterien ja -aineistojen tietoja tutkijoille yhtenäisen etäkäyttöjärjestelmän kautta, joka olisi osa kansallista tutkimuksen e-infrastruktuuria.

TURE-hankkeen kuvaus, asiakirjat ja loppuraportista annetut lausunnot löytyvät Valtioneuvoston hankerekisteristä .

Hankkeen hyödyt

Uusi palvelu on kansainvälisesti ainutlaatuinen. Etätyöympäristöjä on käytettävissä useiden maiden tilastokeskuksissa ja muissa organisaatioissa, mutta FMASin tyyppistä virtuaaliympäristöä, jonka kautta voidaan saada tutkimuskäyttöön ja yhdistellä eri organisaatioissa ylläpidettäviä käyttörajoitteisia yksikkötasoisia aineistoja, ei ole muualla.

Uusi palvelu tuottaa monenlaisia hyötyjä tutkijoille, tieteelle ja yhteiskunnalle:

  • Rekisteritutkimus lisääntyy, koska rekisteriaineistojen saaminen helpottuu.
  • Tieteen laatu paranee, koska tutkimuksiin tehtyjen viitteiden perusteella arvioituna rekisteritutkimus on korkeatasoista.
  • Palvelu tarjoaa ympäristön monitieteelliselle ja instituutioiden rajat ylittävälle yhteistyölle.
  • Strategisen ja päätöksentekoa tukevan tutkimuksen edellytykset paranevat.
  • Myös kansainväliset tutkijat voivat hakea käyttölupaa suomalaisiin rekisteritietoihin.
  • Kansainvälinen tutkimusyhteistyö lisääntyy, kun etäkäyttöjärjestelmää voidaan käyttää myös ulkomailta.
  • Tutkimusrahoituksen käyttö tehostuu, kun valmiiden tietovarantojen käyttö lisääntyy ja aineistot saadaan nopeammin käyttöön.
  • Palveluita voidaan hyödyntää korkeakoulujen opetusympäristönä.
  • Viranomaisten tekemä päällekkäinen työ vähenee.

Rekisterien tutkimuskäyttö tulee näkyväksi viranomaisille ja kansalaisille

Aikataulu

Palveluiden rakentaminen aloitettiin 2014 ja alkuperäisten suunnitelmien mukaan niiden oli tarkoitus olla käytössä vuoden 2015 lopussa. Todellinen toteutusaikataulu riippuu kuitenkin rahoituksesta.

Rahoitus

Hanke sai Suomen Akatemian FIRI 2013 -infrastruktuurirahoitusta vuodelle 2014.  Jatkorahoitusta haettiin vuoden FIRI 2014 -haussa, mutta hanke ei saanut jatkorahoitusta. Vuodelle 2015 on käytettävissä vain edellisen vuoden rahoituksesta jäänyt pieni rahoitus.

Kela myönsi Kansallisarkistolle syyskuussa 2015 rahoitusta hankkeen jatkamiseen. Saatu rahoitus mahdollistaa lupapalvelun toteutuksen jatkamisen, mutta suunnitelmien mukaisten palvelujen valmistumiseen saatu rahoitus ei riitä.

Lisärahoitusta on haettu ja edelleen haetaan tarvittaessa. Hanke jatkuu täysitehoisesti heti, kun jatkorahoituslähteitä löydetään.

Organisointi /hallintorakenne ja yhteystiedot

Hankkeen vastuullinen johtaja:

Tutkimusjohtaja, dosentti, FT Päivi Happonen, Kansallisarkisto, Tutkimuksen ja kehittämisen vastuualue

Hanketta toteutetaan kahdessa osahankkeessa. Kansallisarkisto vastaa sähköisen lupapalvelun ja informaatio- ja tukipalvelun toteuttamisesta. Tilastokeskus toteuttaa metatietokatalogin ja etätyöpöydän. Vastuulliset johtajat ja tämänhetkinen projektihenkilöstö:

Kansallisarkiston osahanke (sähköinen lupapalvelu ja informaatio- ja tukipalvelu):

Päivi Happonen (osahankkeen vastuullinen johtaja)

Irma-Leena Notkola (projektipäällikkö)

Yrjö Kotivuori (oa., sähköinen lupapalvelu)

Henri Tenhunen (sähköinen lupapalvelu)

Tilastokeskuksen osahanke (metatietokatalogi ja etätyöpöytä):

Jussi Heino (osahankkeen vastuullinen johtaja)

Marianne Johnson (koordinointi, sidosryhmäyhteistyö)

Mikko Saloila (metatietokatalogi)

Heli Turunen (valmisaineistot)

Valtteri Valkonen (etätyöpöytä)

Henkilöiden yhteystiedot:

Kansallisarkisto: etunimi.sukunimi@narc.fi

Tilastokeskus: etunimi.sukunimi@stat.fi

Hankkeella on Kansallisarkiston nimittämä ohjausryhmä.