Paikkatietoa avustushakemuksista

Kerroimme taannoisessa blogauksessamme Helsingin kaupungin kokeilukiihdyttämössä tekemästämme kaupunkilaisten palautteiden tekstianalyysistä. Nyt paneudumme toiseen kokeilukiihdyttämöhankkeeseemme, jonka tavoitteena oli analysoida ja tutkia paikkatiedon keräämistä Helsingin kaupungin vastaanottamista avustushakemuksista. 

Kokeilukiihdyttämön hankkeiden tarkoituksena on hakea uusia kokeiluja, jotka kehittävät kaupungin palveluita ja toimintaa. Tässä hankkeessa tarkastelumme keskiössä olivat kulttuurin, liikunnan ja nuorisotyön toimialojen avustukset. Kokeilussa loimme kuvan paikkatiedon keräämisen nykytilanteesta ja tulevaisuuden tavoitetilasta. Näiden lisäksi teimme konkreettisia kehitysehdotuksia Helsingin kaupungin avustusjärjestelmän kehittämiseksi. Hanketta varten loimme QGIS-projektiimme demodataa, jonka pohjalta teimme esimerkkejä mahdollisista tulevaisuuden analyyseistä. Tämän artikkelin kuvituskuvat eivät perustu kaupungin aineistoihin, vaan gispolaisten luomaan esimerkkiaineistoon.

Miksi kerätä paikkatietoa?

Helsingin kaupunki myöntää vuosittain lukuisia avustuksia. Eri toimialat myöntävät avustuksia pitkin vuotta, ja myönnetyt avustukset voivat olla mm. projektikohtaisia, kertaluontoisia, monivuotisia tai tila-avustuksia. Kaupungin työntekijöitä on jo pitkään kutkuttanut ajatus saada tukisummat kartalle, ja asiaa on hieman jo tutkittu vuonna 2017 (Arttu Antila). 

Avustushakemusten paikkatiedon paremmalla keräämisellä ja analysoinnilla saataisiin kaupungin työntekijöille parempi käsitys siitä, missä kaupungin tukemaa toimintaa tapahtuu ja miten avustukset jakautuvat alueellisesti. Paikkatietoa voitaisiin käyttää päätöksenteon tueksi ja toisaalta avustushakemuspäätösten seurantaan. Hyvä visualisointi kertoo datasta paljon ja tuo erilaista konkretiaa aineistoon kuin pelkkä Excel-tiedosto. Paikkatieto voi myös mahdollistaa mahdollisimman oikeellisen kuvan saamisen avustushakemustilanteesta.

Vaikka kokeilun kärkenä oli tutkia ja visioida paikkatiedon keräämistä, tulimme samalla tehneeksi katsauksen avustushakemusten käsittelyprosessiin ulkopuolisten silmin. Tämä oli ehdottoman tarpeellista, sillä paikkatiedon keruu, käyttö ja analyysi eivät tapahdu irrallaan nykyisestä avustusjärjestelmästä, vaan sen sisällä ja sen asettamissa reunaehdoissa. Kysymällä paikkatietoon liittyviä kysymyksiä pystyimme kartoittamaan järjestelmän nykytilaa ja suunnittelemaan tavoitetilaa, jota kohti pyrkiä.

Selvityksiä, visualisointi-ideoita ja dataputkia

Kuten monet selvitystyöt, aloitimme hankkeen kartoittamalla asiakkaan tarpeita. Onko paikkatietoa kerätty aiemmin avustushakemuksista? Millaisia tarpeita kaupungin työntekijöillä on paikkatiedolle? Mitä paikkatiedolla voitaisiin tehdä?

Tietenkin avustushakemuksista puhuttaessa kiinnostavin analyysi liittyy rahasummien alueelliseen jakautumiseen. Kuitenkin kaupungin avustushakemuspohjiin tarkemmin syventymällä ja kaupungin työntekijöiden kanssa keskustelemalla potentiaalisia analyysi-ideoita alkoi nousta enemmän. Tuomalla avustuskohteet kartalle voidaan mm. nähdä eri toimijoiden keskittyminen ja palvelujen saavutettavuus. Jos aineisto saadaan pisteinä, voidaan paikkatieto-ohjelmassa suodattaa karttanäkymään vain esimerkiksi tiettyä toimintaa tarjoavat toimijat.

Nuorisotyön toimijat kartalla (demoaineisto, ei perustu oikeaan dataan). Pisteiden väri kertoo minkä tyyppisestä nuorisotyöstä on kyse. Pisteiden ympärillä oleva vaalea isokroni näyttää alueen, jolta palvelut ovat saavutettavissa 15 minuutin kävelyllä.

15 minuutin saavutettavuusanalyysi, mutta nyt vain partiotoimintaa tarjoavilla toimijoilla (suodatettu näkymä demoaineistosta).

Samalla kun toimijat saadaan kartalle, voidaan myös tarkastella katvealueita. Kaivamalla hakemuksista niiden toimialoja (tässä tapauksessa taide/liikunta/nuoriso), voidaan tutkia avustusten jakautumista eri toimialojen välillä alueiden sisällä. Samoin aineistoa voidaan luokitella ja tarkastella eri avustustyyppien perusteella. 

Avustussummien jakautuminen postinumeroalueiden sisällä, tarkastelussa eri taidetyypit (Gispon luoma demoaineisto, ei kuvaa Helsingin kaupungin todellisia avustuksia). Ympyrän koko kuvaa alueelle myönnettyjen avustusten kokonaissummaa; mitä isompi ympyrä, sitä suurempi rahasumma alueelle on myönnetty.

Yksinkertaista aineistoluokittelua, joka kuitenkin havainnollistaa toimintojen sijoittumista, palveluverkon laajuutta ja ylipäänsä sitä, mitä toimintaa tuetaan ja missä. (Perustuu demoaineistoon.)

Visualisoinneissa ei ole siis kyse pelkästään toimijoiden sijoittelusta kartalle. Mutta miksi jäädä vain staattisiin visualisointeihin? Monet analyyseistä voidaan automatisoida, jolloin karttanäkymä voi päivittyä sitä mukaa kun avustuspäätöksiä tehdään. Suurin hyöty prosessien automatisoinnista kuitenkin on päällekkäisen työn vähentyminen: sama analyysi, jota eri työntekijät ovat tahoillaan tehneet käsin, voidaan ohjelmoida ja saada valmiina kaikille työntekijöille jaettuun näkymään.

Datan keruu ja laatu

Prosessien automatisointiin pääseminen ei tapahdu toki hetkessä, vaan matka ideaalitilanteeseen vaati työtä ja välivaiheita. Avustustietokannan kylkeen voidaan rakentaa paikkatietokanta (esim. PostGIS), joka kerää halutut tiedot avustuksista ja suorittaa tietyt analyysit aineistolle. Toimiva dataputki puolestaan vaatii sen, että käytetyn datan on lähtökohtaisesti oltava kunnossa.

Datan laatuun törmätään lähes kaikissa projekteissa. Lähtöaineistoa ei päästä analysoimaan, mikäli osoitteet on kirjoitettu väärin tai avustuksen hakija on ilmoittanut oman kotiosoitteensa eikä järjestämänsä toiminnan tapahtumapaikkaa. Jotta dataa voidaan siis jatkojalostaa ja analysoida, pitää miettiä kuinka dataa kerätään ja miten sen laatu varmistetaan. Datan keruuprosesseja kehittäessä on toisaalta ajateltava sitä, kuinka aineistoa käsitellään ja mitä sieltä halutaan nähdä.

Vaikka puhutaan kaupungin sisäisistä tarpeista, tiedon käyttäjiä ei kuitenkaan ole vain yksi vaan useita. Eri toimialoilla saattaa olla erilaisia tarpeita ja toiveita kerätyn datan tarkkuudesta, ja toisaalta on mietittävä datan keräämisen käyttäjäystävällisyyttä. Avustushakemuksen täyttäminen voi vaatia hakijalta jo lähtökohtaisesti paljon työtä ja monien liitteiden lähettämistä, eikä työmäärää haluta tietenkään lisätä tekemällä paikkatiedon ilmoittamisesta hankalaa tai monivaiheista. Ei ole kuitenkaan mielekästä, että työntekijät joutuisivat esimerkiksi etsimään haluttua dataa useammasta hakemukseen liittyvästä tiedostosta tai korjaamaan väärinkirjoitettuja osoitteita.

Yksinkertainen parannus, jolla on merkittävä hyöty datan jatkokäsittelyyn: avustushakemuksen taustalle voidaan tuoda esimerkiksi Väyläviraston tieaineisto, josta osoitteet haetaan. Kun osoitetta ei voida kirjoittaa vapaana tekstinä vaan ennakoiva tekstinsyöttö ehdottaa osoitetta pudotusvalikosta, aineiston laatu ja siten myös käytettävyys paranee huomattavasti. Lopullinen tieto paikasta, jossa avustussumma käytetään, tulee ideaalitapauksessa tästä omaan kenttäänsä tietokantaan.

Toimintapaikkaa voidaan toki kysyä muunakin kuin osoitteena. Esimerkiksi kaupunginosa- tai postinumeroaluetarkkuus voi olla riittävä monissa yhteyksissä. Myös se mahdollistaa erilaisia näkymiä aineistoon ja avustussummien alueelliseen jakautumiseen. Potentiaalisia jatkoideoita tässä tapauksessa ovat esimerkiksi päällekäisanalyysi Tilastokeskuksen postinumeroaineiston kanssa, joka sisältää tietoja alueiden väestörakenteista. Näin voitaisiin tarkastella vaikkapa sitä, mitkä ikäryhmät ovat avustuksen saajan välittömässä vaikutuspiirissä samalla postinumeroalueella.

Tarkastelua kaupunginosan tarkkuudella: kuinka monta prosenttia kaupunginosan avustushakemuksista sai myönteisen päätöksen (analyysi demoaineistosta).

Toivottu tarkkuus paikkatietoasiantuntijalle on yleensä kuitenkin tarkin mahdollinen – tässä tapauksessa eksakti osoite, jossa avustettu toiminta tapahtuu. Pisteaineistosta saadaan tehtyä tarkimmat analyysit, mutta pisteet voidaan myös liittää halutessa postinumeroalueisiin. Pisteaineisto on siis tarkasteltavissa useammalla skaalalla; yksittäisinä kohteina, postinumeroaluetarkkuudella – tai vaikkapa 250 neliömetrin ruudukkona. 

Myönnettyjä avustuksia 1km2 tarkkuudella. Mitä tummempi väri, sitä useampi myönnetty avustus. Analyysi projektia varten luodun demoaineiston perusteella.

Demoaineiston myönnetyt avustukset 250m2 väestötietoruudukkoon suhteuttuna (laajempi tausta-aineisto kuin yllä).

Mikäli avustushakuprosessissa päästään keräämään toimijoiden toimintapaikkojen tarkkoja, ajantasaisia osoitteita, olisi mahdollista myös julkaista kaupungin tukemista toimijoista vaikkapa selainpohjainen kartta. Näkymään voidaan suodattaa esimerkiksi vain avustuksen saaneen toimijan perustiedot (nimi, osoite, kotisivut, mitä toimintaa tarjoaa). Näin saataisiin kaupunkilaisten käyttöön selainpohjaisia karttoja mm. kaupungin tukemista nuorisopalveluista tai eri liikuntaharrastusmahdollisuuksista.

Toimintapaikkatiedot voidaan kysyä esimerkiksi hakijalta raportointivaiheessa, kun hänellä on tarkka tieto siitä, missä toiminta tapahtui. Tällöin tieto on varmemmin paikkansapitävää kuin hakuvaiheen suunnitelmissa, eikä tiedon ilmoittaminen kuormita hakijaa hakuvaiheessa. Toisaalta tiedon ajankohtaisuus voi kärsiä, mikäli toimija ei jatka toimintaansa samassa paikassa vielä avustuskauden jälkeen. Käytännössä yksittäinen taidenäyttely ei todennäköisesti ole pitkään samassa paikassa, mutta ympärivuotinen nuorisotoiminta avustuksen saajan itse omistamassa tilassa voi jatkua pitkäänkin.

Mockup selainkarttanäkymästä. Kartalla pistekohteina avustuksia saaneet nuorisotoimijat (projektia varten luodusta demoaineistosta), klikkaamalla lisätietoja toiminnasta ja toimijan nettisivu. Samalle kartalle on mahdollista tuoda myös muiden toimialojen tukemaa toimintaa, jota käyttäjä pystyy suodattamaan oman mielenkiintonsa mukaan, esim. “näytä kaikki paikat, missä voi pelata tennistä”.

Lopputulokset ja jatko

Vaikka tässä tekstissä on esitetty visioita avustushakemusten paikkatiedon keruusta ja sen mahdollisuuksista, ei näihin analyyseihin ja tavoitetilanteisiin päästä heti. Kyse ei ole yksittäisestä loikasta, vaan sarjasta pienempiä askeleita, jotka pitää suorittaa järjestyksessä. Monesti myös näiden muutosten tekeminen järjestelmiin ja työorganisaation sisällä voi olla hidasta. Nyt kuitenkin pohjatyöt ovat valmiina ja lista tarvittavista toimenpide-ehdotuksista tehtynä Helsingin kaupungille.

Tämän hankkeen aikana tuotimme Helsingin kaupungille nykytilasta analyysin sekä suunnitelman nykyisen avustustietojärjestelmän parantamiseksi kohti yhdessä hahmoteltua tavoitetilaa. Teimme myös QGIS-työtilan, joka sisältää erilaisia näkymiä tekemällämme demoaineistolla ja mockupeja avustushakemusten parantamiseksi (aineisto löytyy kokonaisuudessaan Gispon GitHubista).

Näiden ideoiden ei kuitenkaan tarvitse jäädä vain avustushakemuksiin. Vaikka kyseessä on paikkatietoprojekti, hankkeesta on saatu oppeja myös yleiseen tietojärjestelmähallintaan. Samoin monet tässäkin esitetyt prosessit ja huomiot ovat sovellettavissa muihinkin lomakkeisiin, joissa kerätään tai halutaan kerätä paikkatietoa.

Profiilikuva

Juho Rekilä

Juho on folkloristiikan FM, jota kiinnostavat paikkatieto, data-analyysi ja viestintä. Valmistumisen jälkeen hän on jatkokouluttautunut data-analytiikan parissa (mm. Python, datan visualisointi, koneoppiminen) ja tehnyt myös graafista suunnittelua ja äänisuunnittelua.