Blogit

Blogit

Ei 007 vaan 30 000: Palvelutietovarannon agentilla on lupa parantaa

Marko Latvanen ja Heli Hautaniemi Julkaisupäivä 25.6.2018 12.53 Blogit

Palvelutietovarannon tarina alkoi joskus syksyllä 2011. Suomi.fi:n juuri Valtiokonttoriin siirtyneessä toimituksessa tehtiin valtioneuvoston ja VM:n toimeksiannon mukaista työtä: suunniteltiin tulevaisuuden Suomi.fi-palvelua, sen ominaisuuksia ja noiden ominaisuuksien edellyttämiä uudistuksia ja uusia elementtejä.

Monet uudet jutut olivat hyvässä kansainvälisen yhteistyön hengessä luvan kanssa uusiokäytettyjä. Tanskalaisilta lainattiin koko MinSide-konsepti (omat tietoni ja viestini), briteiltä merkattiin selkeä käyttöliittymä, opastavat sisällöt ja havainnolliset palvelupolut sekä näiden vaatima sisällönhallintatyökalusto, ja niin edelleen.

Kaksi asiaa keksittiin kuitenkin ihan itse. Sähköinen puolesta asiointi on toteutunut ensimmäisenä maailmassa Suomi.fi:n Valtuudet-palveluna. Ja palvelujen siilottomaan, yhdenmukaiseen kuvailuun ja palvelutietojen yhteis- ja uudelleenkäyttöön kehitettiin Palvelutietovaranto, se monelle jo tuttu PTV.

PTV:stä tuli teknistä todellisuutta vuosikymmenen puolivälissä ja viranomaisia velvoittava osa Kapa-lakia kesällä 2016. Kaikki kävi lopulta nopeammin kuin oli uskottu, ja eräs piirre PTV-tarinassa on ollut erityisen merkittävä: PTV-järjestelmään kuvattujen palvelujen ja asiointikanavien määrä.

Kesäkuun alussa 2018, kaksi vuotta Kapa-lain voimaantulosta, Palvelutietovarannossa on kuvattu noin 30 000 palvelua ja noin 130 000 niihin liittyvää asiointikanavaa. Koska PTV on nyt avoin myös kolmannelle sektorille ja yrityksille, siihen liittyneitä organisaatioita on enemmän kuin julkisella sektorilla on kuntia, maakuntia, virastoja ja laitoksia yhteensä. Kuvauksia palveluista, kanavista ja organisaatioista tulee koko ajan lisää.

Paitsi kansalaisten ja hallinnon tietotarpeisiin, Palvelutietovaranto on alusta asti rakennettu avoimen datan resurssiksi, jonka sisällöllä haluammekin nähdä kolmansien osapuolien käyttäjiä: palvelu- ja sovelluskehittäjiä kaikilta sektoreilta. Tämä kaikki aiheuttaa PTV-tiedolle varsin kovat laatuvaatimukset niin tarkkuuden, ajantasaisuuden kuin kattavuudenkin osalta. Suomi.fin ja PTV:n tuleva rooli sotekeskusten vertailupalvelussa kansalaisille vielä korostaa tätä.

Näin suuren tietomäärän laatua ei tarkkaile eikä kohenna mikään määrä ihmisiä, ei ainakaan sellainen, joka olisi toiminnallisesti ja taloudellisesti mielekäs tai realistinen. Tämän johtopäätöksen teimme viime vuonna, ja tulimme selvään tilannekuvaan: PTV-tietojen laadun kontrolliin ja korjaustoimien käynnistämiseen tarvitaan kone.

Syntyi ajatus ja konsepti sovelluksesta, joka pääosin nykyisen kieliteknologian avulla voisi tarkastaa palvelukuvauksia, tunnistaa niissä olevia laatuvajeita (eli puutteita suhteessa PTV-ohjeistukseen) ja antaa käytännön apua ja evästystä ihan yksittäisenkin palvelukuvauksen tekijälle kuvauksen laadun parantamiseksi. Koska sovelluksen ajateltiin tuotannossa ollessaan tarkkailevan PTV-dataa ja tekevän lempeitä ”iskuja” tietojen tuotantoon, annoimme sovellukselle nimeksi PTV-Laatuagentti, jolla on lupa parantaa koko PTV-sisällön laatua.

Kokeilukulttuurin ja ketterän kehittämisen hengessä jututimme muutamia toimittajia, joista Lingsoft sai tehtäväkseen Laatuagentin tiiviin, muutaman kuukauden kestävän proof of concept -projektin noin tuhannen palvelukuvauksen aineistolla.

Projektin tavoitteena oli tutkia, minkälaisiin laatupoikkeamiin koneellisella laadunhallinnalla voidaan puuttua ja miten poikkeamista voidaan huomauttaa tekstien laatijoille. Samalla tarkoituksena oli arvioida, paljonko tällainen työkalu helpottaisi Palvelutietovarannon sisällöntuotantoa, jos se otettaisiin tuotantokäyttöön.

Aluksi määriteltiin parikymmentä kriteeriä, joiden avulla palvelukuvauksia voitaisiin tarkistaa ja parannella. Kriteerien avulla etsittiin aineistosta esimerkiksi kirjoitus- ja kielioppivirheitä sekä pyrittiin tunnistamaan vaikeaselkoista tekstiä. Niinpä laatuagentti puuttuikin esimerkiksi tietyn raja-arvon ylittävään määrään lauseenvastikkeita, passiivimuotoja tai pitkiä virkkeitä. Jotta Palvelutietovarannon sisältämä tieto olisi rakenteellista ja koneellisesti hyödynnettävää, on palvelukuvausten noudatettava tiettyä tietomallia. Sen vuoksi tutkittiin myös mahdollisuuksia tunnistaa esimerkiksi väärissä kentissä olevia puhelinnumeroita, käyntiosoitteita tai sähköpostiosoitteita. Lisäksi kriteerien listalle pääsivät esimerkiksi viittaukset lakipykäliin sekä pohjakuvauksen tekstin toistaminen palvelun kuvauskentässä.

Kriteereitä tarkasteltiin, tarkennettiin ja tarvittaessa myös väljennettiin matkan varrella, kun saimme tarkasteltavaksi kriteerien läpi ajettuja palvelukuvauksia. Välillä raja-arvojen määrittely osoittautui haastavaksi. Jouduimme esimerkiksi tarkentamaan ennakkokäsitystämme passiivista. Passiivin käyttö ei aina tuo mukanaan epämääräisyyttä, vaan joskus asia on mahdollista ilmaista riittävän selkeästi passiivillakin.

Ajatuksena on, että mahdollinen laatuagentti ei olisi pelkkä virheiden osoittelija tai punakynän heiluttelija. Varsinaisena päämääränä on luoda PTV-laatua tukeva työkalu, joka toimii reaaliajassa PTV:n yhteydessä ja auttaa ja helpottaa hyvän palvelukuvauksen luomista jo kuvauksen luomisvaiheessa tai kuvausta päivitettäessä.

Kirjoittajat:

Marko Latvanen, erityisasiantuntija, Väestörekisterikeskus

Heli Hautaniemi, suunnittelija, Väestörekisterikeskus

Suomen väkiluku 5 624 557