Kaupunkipyörien dataa käsittelemässä

Tässä tekstissä kerrotaan, millaista yhteistyötä Savonia ja Kuopion kaupunki ovat tehneet suosittujen Vilkku-fillari-kaupunkipyörien dataan liittyen. Vuoden 2022 kaupunkipyöräkausi – neljäs kaikkiaan – alkaa olla lopuillaan. On hyvä hetki katsoa, miten kaupunkipyörien suosio ja käyttö on kehittyneet näiden vuosien aikana.

Vilkku-fillarit ovat sivunneet useita hankkeitamme Savonialla ja viimeisimpänä Green Data Future Solutions -hankkeessa olemme olleet tekemisissä kertyneen datan kanssa. Allekirjoittanut on ollut mukana vuoden 2020 alusta lähtien aina ajoittain mm. käsittelemässä datasettejä ja tekemässä analyysejä. Tässä koonnissa kerron erityisesti datasta ja tehdyistä analyyseistä menemättä sen syvemmin koodiin tai löydöksiin.

Savonian ja kaupungin yhteistyö

Savonia on ollut alusta asti vahvasti tukemassa ja suosittamassa Vilkku-fillareiden käyttöä. Jo ensimmäisellä kaudella 2019 alkoi perinne, jossa Savonia tarjoaa henkilöstölle ja opiskelijoille Vilkku-fillareiden käytön loppukauden ajan. Nyt on jo neljäs syksy menossa tätä kampanjaa.

Savonian ja Kuopion kaupungin yhteistyö Vilkku-fillari-kaupunkipyöristä kertyvän datan käsittelyssä alkoi alkuvuodesta 2020 Havuja-hackathonin yhteydessä. Hackathoniin yhdeksi aiheeksi kaupunki antoi datasetin ensimmäisen kauden lainauksista. Tuolloin hackathonissa nelisen ryhmää teki visualisointeja datasta ja nähtiinpä siellä hauska pelikin.

Yhteistyötä jatkettiin vuoden 2021 keväällä, kun Green Data Future Solutions -hanke järjesti hackathonin, johon jälleen annettiin aiheeksi edellisen vuoden lainausten datasetin analyysi. Hankkeessa esikäsittelimme datan hackathonia varten. Tästä lähti yhteistyö syvenemään ja olemmekin tehneet datasettien käsittelyä, analyysia ja visualisointia kaupungille. Saman vuoden keväällä Savonialla toteutettiin myös asemien pyörämäärien tallennusjärjestelmä. Kahdelta ensimmäiseltä kaudelta asemien pyörämäärien dataa ei valitettavasti ole tallessa, kun sitä ei hoksattu laittaa tallentumaan.

Viimeisimpänä yhteistyön tuotoksena on vuoden 2022 aikana syntynyt https://fillaridata.savonia.fi sivusto, jolla kaikki pääsevät tutkiskelemaan lainausmääriä interaktiivisten visualisointien avulla. Green Data -hanke oli ohjaamassa sivuston toteutusta yhdessä kaupungin edustajien kanssa.

fillaridata.savonia.fi sivusto
Vilkku-fillareiden datasivusto, jonka ovat kehittäneet Savonian opiskelijat vuoden 2022 aikana.

Miten datan käsittelyä ja analyysiä on tehty

Vilkku-fillareista olemme pyöritelleet kahta erilaista – mutta toisiinsa liittyvää – dataa: matkadataa ja pyörämäärädataa. Matkadatassa jokainen taulukon rivi vastaa yhtä käyttäjän tekemään lainausta. Pyörämäärädata puolestaan kertoo jonkin ajankohdan pyörien lukumäärän asemilla.

Henkilökohtaisesti pidän R-kielestä sekä RStudiosta ja olenkin sitä käyttänyt pääosin datasettien käsittelyyn ja analyysiin. Analyysiin liittyviä visualisointeja olen tehnyt pääosin ggplot2 -paketilla. R-skriptille syötetään kaupunkipyörien järjestelmätoimittajan järjestelmästä ladattu raakamuotoinen taulukko matkoista ja tuloksena se tuottaa käsitellyn datasetin monine johdannaistauluineen CSV- ja Excel -muodossa, raportin analyysin tuloksista sekä kuvaajia PNG-muodossa. Alla kuvankaappaus analyysin muodostamasta raportista. Skripti ei ole vielä julkisesti saatavilla, mutta julkaisukelpoinen versio on suunnitelmissa. Seuraavana askeleena olisi muokata interaktiivinen käyttöliittymä eksploratiivisen analyysin tueksi esim. Shiny-työkalun avulla. Kaupungilla on tosin jo omat Power BI -muotoiset käyttöliittymänsä tehtynä tutkailuun.

Kuvankaappaus vuoden 2021 matkojen analyysin raportista. Kuvassa näkee käyttäjien matkamääriä kuvaajana sekä kuvan muodostaneen koodin.
Kuvankaappaus vuoden 2021 matkojen analyysin raportista. Kuvassa näkee käyttäjien matkamääriä kuvaajana sekä kuvan muodostaneen koodin.

Alusta asti kaupungin toiveissa on ollut asemien välisen liikenteen visualisointi. Visualisoinnista tulisi nähdä, mistä mihin liikenne on suuntautunut ja milloin. Asemien suurehkosta määrästä johtuen kuvaajista on vaarana tulla sekavia. Erilaisten toteutusvaihtoehtojen kartoituksen ja kokeilujen jälkeen työkaluksi valittiin FlowmapBlue, jolla voi ilmaiseksi luoda interaktiivisia karttoja matkojen tarkasteluun. Alla on vuoden 2021 datoista tehty näkymä.

FlowmapBlue-näkymä vuoden 2021 matkoista.
FlowmapBlue-näkymä vuoden 2021 matkoista. Näkymässä TORI-aseman tulleet ja lähteneet matkat.

Matkoista kertyneen datataulun yksi rivi vastaa yhtä pyörällä ajettua matkaa. Keskeistä on lähtöaika ja -asema sekä vastaavasti palautusaika ja -asema. Rivillä olevia lisätietoja ovat mm. pyörän ja käyttäjän tunnistenumero, matkan pituus, hinta, kauppaehdot, mahdollinen arvosana ja kulutettu sekä korjattu energia. Näiden tietojen pohjalta pystytään sitten muodostamaan erilaisia koontitauluja. Tekemiämme koontitauluja olivat mm. asemakohtaiset koosteet, asemien väliset matkat, pyöräkohtaiset koosteet, käyttäjäkohtaiset koosteet, lipputyypin mukaiset koosteet ja ajanjakson mukaiset koosteet (tunti, vuorokaudenaika, viikonpäivä, kuukausi, kausi…). Kiinnostavaa oli myös mm. luokitella matkoja pituuksien, kestojen, nopeuksien ja lainatyyppien mukaan sekä tarkkailla asemittain lainauksia sekä palautuksia. Kausista pystyy laskemaan myös monenlaisia tunnuslukuja. Osan koontitauluista voitte ladata ihmeteltäväksi täältä.

Asemien pyörämääriä on tallennettu kaudesta 2020 alkaen 5 minuutin välein avoimesta rajapinnasta. Tallennus-skripti toteutettiin Pythonilla (lähdekoodia ei vielä julkaistu). Tästä datasta pystyy mm. tutkimaan pyörien jakaumaa asemien välillä eri ajankohdissa. Datasta muodostettiin koontitauluja ajankohdan mukaan jaoteltuna: kausi, kuukausi, viikonpäivä, päivä, vuorokaudenaika ja tunti sekä näiden yhdistelmiä. Asemittain muodostuvia aikasarjoja analysoimalla voidaan selvittää, paljonko pyöriä asemilla milloinkin on ja milloin asema on tyhjillään. Kaupunkia kiinnostaa erityisesti asemien tyhjänäoloajat, jolloin operaattoria voidaan ohjeistaa jo ennakoivasti siirtämään pyöriä täydemmiltä asemilta tyhjemmille. Datasta näkee selvästi, miten pyörät kerääntyvät joillekin asemille, kun taas joillain asemilla on jatkuvaa pyöräpulaa. Esimerkiksi Pirtissä ja Keilankannassa on jatkuvasti keskimäärin 18 pyörää ollut tällä kaudella, kun taas Uimahallin ja Kuopio-Hallin pysäkeillä on ollut keskimäärin alle kaksi. Joillain pysäkeillä tilanne vaihtelee suuresti kellonajan mukaan, kuten esimerkiksi yliopiston läheisillä pysäkeillä lukukausien aikaan. Alla on kuvankaappaus analyysistä muodostuneesta raportista.

Kuvankaappaus asemien pyörämäärä-analyysin raportista.
Kuvankaappaus asemien pyörämäärä-analyysin raportista. Kuvassa näkee heatmap-näkymän CANTHIA-aseman keskimääräisistä pyörämääristä viikonpäivän ja kellonajan mukaan.

Asemien pyörämäärädatan interaktiivinen tarkastelunäkymä on vielä työn alla. Tämä olisi tarkoitettu erityisesti kaupungin työntekijöiden käyttöön, mutta harkinnassa on julkisenkin näkymän tekeminen kaupunkilaisia varten. Analyysiä kehittämällä pystytään ennakoimaan paremmin kysyntäpiikkejä ja tasaamaan pyöriä asemille.

Asemien pyörämäärädatan avoimeen rajapintaan on toivottu järjestelmän toimittajalta parannuksia. Tälläkin hetkellä kaupunkipyörien sivuston kartalta näkee avoimesti, mitkä pyörät ovat milläkin asemalla ja miten paljon niiden akuissa on varausta jäljellä. Karttanäkymässä näkyvät myös asemien ulkopuoliset pyörät. Kaikki tämä data olisi suhteellisen helposti laitettavissa myös avoimeen rajapintaan näkyviin, jolloin pystyttäisiin keräämään tarkemmin tietoa kauden aikana ja tekemään parempia analyysejä.

Data julkiseksi

Pääosa tekemästämme työstä on suunnattu kaupungin väen käyttöön. Mietiskelimme hankkeessa paljon, mikä tässä datassa kiinnostaisi tavallista kuopiolaista ja mitä haluamme datalla kertoa. Vuoden 2022 alussa annoimme Savonian tietotekniikan opiskelijoille projektityön aiheeksi tehdä kaupunkilaisia varten julkinen sivusto, johon koottaisiin keskeisiä tietoja Vilkku-fillareiden käytöstä. Kevään aikana työ saatiin hyvin alulle ja kesän 2022 aikana kolme tietotekniikan opiskelijaa tekivät harjoitustyönään projektin loppuun. Nyt syyskuussa 2022 sivuston ensimmäinen versio saatiin viimein julkaistua osoitteeseen https://fillaridata.savonia.fi

Sivusto on toteutettu niin, että kuluvan kauden dataa on mahdollista lisätä kauden aikana tai viimeistään kauden jälkeen. Sivuston luonnissa käytettiin hyväksi aiemmin analyysissä käsiteltyjä datasettejä ja johdannaistauluja. Tietokannassa kokeiltiin erilaisia vaihtoehtoja, mutta lopulta päädyttiin perinteisen kaltaiseen relaatiotietokantaan yksinkertaisen toiminnan ja siirrettävyyden vuoksi. Käyttöliittymä toteutettiin React-pohjaisena. Kuvaajat tehtiin aluksi erilaisia Javascript-kirjastoja hyödyntäen, mutta kesän aikana toteutustavaksi päätettiin vaihtaa avoimen lähdekoodin Metabase. Metabase on Power BI:n kaltainen tiedolla johtamisen työkalu.

Metabase-työkalulla toteutettu karttapohjainen näkymä asemakohtaisen datan tarkasteluun.
Metabase-työkalulla toteutettu karttapohjainen näkymä asemakohtaisen datan tarkasteluun.

Sivusto interaktiivisine kuvaajineen on hyvä, mutta halusimme vielä nostaa keskeisimpiä tunnuslukuja aiemmilta kausilta nopeasti ja yksinkertaisesti nähtäville. Mikäs siihen on parempi kuin visuaalisesti näyttävä infograafi? Toteutimme hankkeessa mm. infograafin aiempien kausien keskeisistä luvuista.

Vilkku-fillareiden kolmesta ensimmäisestä kaudesta tehty infograafi keskeisistä luvuista.
Vilkku-fillareiden kolmesta ensimmäisestä kaudesta tehty infograafi keskeisistä luvuista. Infograafi aukeaa uuteen välilehteen klikkaamalla kuvaa.

Aiempien kausien lainauksien muokatut datasetit löytyvät Avoindata.fi-sivustolta ja analyysissä johdettuja tauluja täältä. Kiinnostuneet voivat pyöritellä dataa ja poimia itseään kiinnostavia asioita. Data sopii hyvin vaikkapa harjoitteludataksi opintoihin. Avoimesti julkaistussa datassa ei ole käyttäjiä yksilöiviä tunnisteita mukana. Tarpeen mukaan voi pyytää tunnisteet sisältävän datasetin (kaupungin edustajat hyväksyvät pyynnöt). Vaikka käyttäjän yksilöivä tunnistenumero ei vielä kerro käyttäjän nimeä tai muita henkilötietoja, mahdollistaa se kuitenkin yksittäisen käyttäjän matkojen etsinnän ja jonkinasteisen profiloinnin.

Lähdekoodeista kiinnostuneet voivat ottaa yhteyttä allekirjoittaneeseen. Savonialla meillä on vielä tarkoitus jatkokehittää fillaridata-sivustoa, kehittää analyysiä erityisesti asemien pyörämääristä ja viestiä Vilkku-fillareiden käytöstä mm. tekemällä uusia infograafeja. Kaupunki puolestaan julkaissee kauden jälkeen jälleen anonymisoidun datasetin lainauksista.

 

Jesse Honkanen

TKI-asiantuntija, Savonia-ammattikorkeakoulu

jesse.honkanen(at)savonia.fi

 

Projektissa mukana

Viime aikoina tässä projektissa mukana ovat olleet seuraavat henkilöt (etunimen mukaan aakkosjärjestyksessä).

Green Data Future Solutions -hankkeesta:

  • Anne Vartiainen
  • Jesse Honkanen
  • Laura Leppänen
  • Mikko Vidgren

Kesällä 2022 fillaridata-sivuston viimeistelleet Savonian tietotekniikan opiskelijat:

  • Aku Tonteri
  • Joonas Vaija
  • Tino Puustinen
  • (kiitos myös muille kevään 2022 tietotekniikkaprojektissa sivuston eteen töitä tehneille opiskelijoille)

Kuopion kaupungilta:

  • Jouni Huhtinen
  • Juho-Pekka Hukkanen

Kiitos muillekin pienemmällä roolilla mukana olleille!

 

Linkkejä

Kaupunkipyörien kotisivut

Vilkku-fillarit -datasivusto

Avoindata.fi Kaupunkipyörien käyttötilastot

Analyysissä johdettuja tauluja (Google Drive)

Infograafi kausien 2019-2021 käyttötilastoista

Mediatiedote Fillaridata-sivustosta

Savon Sanomien artikkeli yhteistyöstä