Blogit

Blogit

Onko kirjoituskone nyt keksitty, eli osaako kone kirjoittaa?

Marko Latvanen Julkaisupäivä 9.5.2019 9.00 Blogit

Muistan hyvin erään valtioneuvoston hankkeena käynnistetyn toimielimen vuosilta 2007-2011. Arjen tietoyhteiskunnan neuvottelukunta toimi liikenne- ja viestintäministeriön alaisuudessa ja sillä oli seuraava missio:

Neuvottelukunnan työn tavoitteena on luoda Suomesta kansainvälisesti vetovoimainen, ihmisläheinen ja kilpailukykyinen osaamis- ja palveluyhteiskunta. Toimilla helpotetaan ihmisten arjen palveluiden saatavuutta, lisätään kilpailukykyä ja tuottavuutta, edistetään alueellista ja sosiaalista tasa-arvoa sekä turvataan julkisten palveluiden saatavuus ja laatu. Erityistä huomiota kiinnitetään julkisen sektorin palvelurakenteiden asiakaslähtöiseen uudistamiseen tieto- ja viestintätekniikkaa laajamittaisesti hyödyntämällä sekä toimintamalleja uudistamalla.

Kuulostaako tutulta tuo 12 vuotta vanha teksti? Onko joku muukin viranomainen ja jokin muukin hanke tuota ennen ja tuon jälkeen tavoitellut ihmisläheistä, arkea helpottavaa, tasa-arvoista, kilpailukykyä edistävää ja toimintamalleja muuttavaa digitaalista Suomea?

Virkahenkilö voi toki turhautuneena repiä hiuksia ja voihkia ”miksi ei vieläkään?”, kun teknologia syöksyy eteenpäin Maantiekiitäjänä ja virkahenkilö tuntee itsensä Kelju K. Kojootiksi, jonka tilaama uusinkaan ACME-tuote ei toiminut odotetulla tavalla. Liikkuvan työpisteeni roskiksessakin on useita ACME-kääreitä ja -pakkauksia, mutta niistä voi sentään (toivottavasti) ottaa oppia jatkoon.

Ei se teknologia, vaan ihminen

Käsitykseni mukaan pääsyyt siihen, että kauniit tavoitteet ovat edelleen tavoitteita, ovat ihminen itse ja ihmisten tavoitteelliset yhteisöt eli organisaatiot. Homo sapiens on heimoutumiseen, ryhmäidentiteettiin ja elämän ennakoitavuuteen suuntautunut laji. Kun esille tulee uudistuksia, jotka uhkaavat rikkoa tunteen oman ryhmän prioriteetista yhteisen hyvän eduksi, samalla vaarantaen tutun ja ennakoitavan työarjen, henkiset jarrulevyt laulavat ja savu nousee. Se on täysin inhimillistä eikä kenenkään vika ja näin käy myös omalla kohdallani. Mutta loppupelissä haasteemme hallintona on siinä, miten rakentavasti lähestymme ihmisen kiusallisia epätäydellisyyksiä.

Toinen usein esiintyvä syy uudistushitauteen on pieni populaatiomme. Hallinnossa väkeä ja rahaa ei riitä joka paikkaan yhtä aikaa; isojakin muutoksia koetetaan usein tehdä resurssilla, joka saattaa olla kirjaimellisesti murto-osa jonkin arvostetun ulkomaisen benchmarkin resursseista. Lisätään tähän vielä aitosuomalainen tapa satsata suunnittelu- ja käyttöönottoprojektiin ja jättää jatkuva tuotanto ns. lillumaan.

Olemme eräiden Suomi.fi-palvelujen laajasti hajautetun sisältötuotannon puitteissa joutuneet pohtimaan näitä dilemmoja. Miten asioita korjataan, kun omaa resurssia on hyvin rajallisesti eikä toisaalta haluta laittaa koko viranomaiskenttää tasatahtimarssiin sanktioilla ja management by perkeleellä. Kun ihmisen lajiominaisuudet muodostavat haasteita, pitäisikö byrokraattisen pakottamisen sijasta hakea aivan toisenlaisia ratkaisuja uuden teknologian parista, koska se, mikä ei ollut mahdollista viisi vuotta sitten, saattaa olla sitä nyt?

Palvelukuvauksia tekoälyn voimalla?

Suomi.fi-palvelutietovaranto (PTV) tulee kevään ja kesän aikana olemaan koekenttä kokeilulle, jossa tutkimme, missä määrin luonnollista suomen kieltä käsittelevä, tekoälyyn perustuva järjestelmä voisi auttaa palvelukuvausten tuottajia ja ylläpitäjiä julkishallinnossa. PTV on ollut aiemminkin kehityksen raamina, kun olemme tuottaneet siihen automaattisen asiasanoittajan ja koneellisen tekstintarkastajan – kenties alkeellista sisältörobotiikkaa, mutta robotiikkaa kuitenkin.

Syy PTV:n rooliin uusien ratkaisujen ”koekeittiönä” liittyy ylempänä kuvattuihin asioihin: lähes 2000 henkilöä kaikkialta julkishallinnosta pitäisi saada tuottamaan koneymmärrettävyyden kannalta riittävän yhteismitallista ja yhteensopivaa aineistoa, josta merkittävä osuus on vapaasti kirjoitettua proosaa. Haasteen luonne lienee selvä.

Noin suuresti hajautettua ja heterogeenistä tietotuotantoa voi yrittää hallita ohjeilla ja koulutuksilla ja tuella, mutta rajat tulevat siinäkin vastaan. Nyt, tekoälyteknologian noustessa scifi-tarinoista todellisuuteen, ryhdymme kokeilemaan uusimman teknologian mahdollisuuksia paitsi tutkia, myös korjata, yhdistellä ja lopulta tuottaa luonnollista kieltä juuri tiettyyn tarkoitukseen. Mitä enemmän saamme siirrettyä kunnissa ja virastoissa palvelutietojen tuottamisen taakkaa ihmisiltä kehittyneille järjestelmille, sen parempi. Parempi laatu vähemmällä työpanoksella ei voi olla kuin voittava yhtälö.

Mitä sitten käytännössä teemme? Käytämme kokeiluprojektin toimittajan semanttisen AI-teknologian järjestelmää, jolle annamme pienen, käsin poimitun valikoiman eräiden viranomaisten verkkosivuja ja hyvälaatuisiksi todettuja palvelukuvauksia tämän hetken Suomi.fi-palvelutietovarannosta. Nämä luonnollisella suomen kielellä kussakin viranomaisessa kirjoitetut tekstit liittyvät kahteen eri palveluun, joita käytetään koekohteina.

Valitut sisällöt toimivat malliaineistona toimittajan tekoälylle. Järjestelmänä kyse on mikropalveluarkkitehtuurista, jossa yksi palvelu analysoi tekstit ja vertaa niitä toisiinsa, toinen yhdistelee sisältöjä parhaaksi katsomallaan tavalla ja kolmas ”neutraloi” tuotoksen siten, että tuloksena on geneerinen tietyn typpisen palvelun malliteksti, joka voidaan jakaa koko viranomaiskentälle saatteella ”kuvatkaa aiheeseen X liittyvä palvelunne tällä sapluunalla”. Tällöin palvelukuvauksia ei tarvitsisi tuottaa nollapisteestä, vaan lähinnä ”täytä tähän puuttuvat tiedot” -otteella, ja yhdenmukaisuus on sekin varmistettu.

Oppiiko kone lukemaan ja kirjoittamaan – ja milloin?

Arvelen, että PTV-ylläpitäjien kentällä kokeilumme onnistuminen tuottaisi paljon iloa. Mutta tuosta on toki vielä pitkä matka siihen vielä hypoteettiseen visiotilaan, jossa kieliteknologinen tekoälyjärjestelmä lukisi kaikkien viranomaisten julkiset sivustot, tunnistaisi automaattisesti jokaisen niissä esillä olevan palvelun ja muokkaisi, ihmisen koskematta, noista sisällöistä keskenään yhteentoimivia ja yhdenmukaisia kuvauksia PTV-tietokantaan. Kunkin viranomaisen tehtäväksi jäisi vain tarkistaa koneen tuotos ja hyväksyä suoraan tai tehdä tarvittavat muutokset. Jokainen muutostieto tietenkin tallentuisi koulutusaineistona oppivaan tekoälyjärjestelmään, jolloin seuraava iteraatio olisi taas askelen parempi.

Olemme siis vielä todella kaukana tuosta tilasta. Mutta nyt alkava mikroskooppisen pieni kokeilumme saattaa olla ensimmäinen askel useisiin vuosiin ulottuvalla tiellä, jonka tarkoitus ei ole viedä ihmisten työpaikkoja tai alistaa meitä koneiden vallalle, vaan tutkia, voisiko jo nyt tekoälypalveluista kouluttaa sisältötyöhön assistentteja ja työkavereita, jotta kaikilla olisi vähän helpompaa ja enemmän aikaa säästyisi olennaiseen.

On samalla huomattava, että nyt, kun toimintaympäristö muuttuu, PTV alkaa löytää laajemman roolinsa kuin vain Suomi.fi-verkkopalvelun tausta-aineistona. Jos Suomelle halutaan digitaalinen palvelumalli, jossa yksittäiselle asiakkaalle voidaan koneellisesti tarjota hänen juuri hetkessä ja tilanteessa tarvitsemansa palvelut, meillä on oltava keinot, jolla kaikkien palvelujen tiedot saadaan tuossa käyttöön. On siis oltava PTV tai jokin sen jälkeläinen, jossa tiedon laatu on yhtenäinen ja korkea ja joka muodostaa sen rekisterin, josta asiakkaille palveluja noudetaan, olipa käyttöliittymänä Suomi.fi, digiminäsovellus, laite kuten Alexa/Siri/Echo – tai jotain aivan muuta…

Toivotan meidän kokeilutiimillemme ja kaikille hallinnon digitalisaatiossa toimiville mielenkiintoisia aikoja!

Marko Latvanen, erityisasiantuntija
Kirjoittaja suhtautuu tekoälyn mahdollisuuksiin neutraalisti mutta pitää kelttimusiikkia yksiselitteisesti hyvänä asiana.

Suomen väkiluku 5 626 922