Menetelmäkuvaus: Miten pääkaupunkiseudun asuinalueet segmentoitiin tekoälyn avulla
Ihmisten asuinaluevalintoihin liittyen, toteutimme yhteistyössä Kiinteistömaailman ja Avaran kanssa tutkimushankkeen, jossa ryhmittelimme nykyaikaisia koneoppimismenetelmiä hyödyntäen pääkaupunkiseudun asuinalueet seitsemään omaleimaiseen segmenttiin. Tutkimuksen mahdollisti Kiinteistömaailman ja Avaran koostama laaja ja hyvälaatuinen data-aineisto alueen muuttoliikkeistä. Aineisto käsitti yli 125 000 muuttoa 2000-luvun vaihteesta lähtien.
Tässä blogipkirjoituksessa kuvataan tarkemmin hankkeessa käytetty menetelmä, jolla todelliseen muuttoliikenteeseen ja tilastoihin perustuen supistettiin pääkaupunkiseudun asuinalueet ensiksi listaksi numeroita ja sen jälkeen ryhmiteltiin osaksi seitsemänluokkaista asuinalueryhmittelyä.
Tavoitteena ryhmitellä pk-seudun asuinalueet tekoälyn avulla seitsemään omaleimaiseen luokkaan
Tavoitteena projektissa oli saada kone ryhmittelemään pääkaupunkiseudun asuinalueet seitsemään omaleimaiseen luokkaan, jossa yhden luokan sisällä olevat asuinalueet ovat keskenään samankaltaisia ja mahdollisimman erilaisia suhteessa muiden luokkien asuinalueisiin. Tämän ryhmittelyn tarkoituksena oli jäljitellä sitä, miten ihmiset todellisuudessa ryhmittelisivät asuinalueita.
Tämänlaista ryhmittelyä ei kuitenkaan ole mahdollista tehdä pelkän postinumeron perusteella, vaan ryhmittelyn täytyy perustua asuinalueen ominaisuuksiin, jotka ovat ihmisille asumisen kannalta merkityksellisiä. Esimerkkinä tällaisista asumisen kannalta merkityksellisistä ominaisuuksista, joiden merkitys ihmisille on olennaista, ovat vaikkapa lapsiperheiden määrä alueella ja alueen hintataso. Projektissa oli siis keksittävä tapa pisteyttää asuinalueiden eri ominaisuudet sen mukaan, miten tärkeitä yksittäiset ominaisuudet ovat muuttopäätöstä tehtäessä.
Mitä tietoa asuinalueiden ominaisuuksista sitten on saatavilla? Tilastokeskuksen ylläpitämä Paavo (Postinumeroalueittainen avoin tieto) -tietokanta pitää sisällään 104 postinumeroalueeseen liittyvää tilastoitua ominaisuutta. Nämä tilastoidut ominaisuudet sisältävät tietoja mm. alueen sijainnista kartalla, alueen väestön ikäjakaumasta, koulutustasosta, tulotasosta, talouksien tyypeistä, asumismuodoista, rakennuskannasta, työpaikoista ja ihmisten pääasiallisesta toiminnasta. Näiden tietojen lisäksi käytettiin eCraftin omaa tietokantaa postinumeroalueiden tarkemmasta rakennuskannasta ja alueen kiinteistöjen hintatasosta.
Lue koko blogi.
Lisätietoja
Tagit
Liiketoimintaprosessi
BI ja raportointi | |
Tietohallinto |
Erikoisosaaminen
Dokumenttien hallinta | |
Tekoäly (AI) ja koneoppiminen |
Tarjonnan tyyppi
Toteutustyö |
Omat tagit
Fellowmind - Asiantuntijat ja yhteyshenkilöt
Fellowmind - Muita referenssejä
Fellowmind - Muita bloggauksia
It- ja ohjelmistoalan työpaikat
- Laura - Mobiilikehittäjä, Android
- Laura - Ohjelmistoarkkitehti, Tampere/Oulu
- Laura - Development Team Manager, Sports Games
- Taito United Oy - Senior Full Stack -kehittäjä
- Webscale Oy - Head of Sales, Cloud Services
- Laura - Hankinta-asiantuntija, tietohallinto
- Laura - Development Manager, Operations
Premium-asiakkaiden viimeisimmät referenssit
- SD Worx - Kehitystyö SD Worxin kanssa takaa Clas Ohlsonille parhaat palkanmaksun prosessit kasvun tiellä
- Digiteam Oy - Case Esperi Care Oy: Ketterä kumppanuus vei Esperin verkkosivu-uudistuksen maaliin sujuvasti ja aikataulussa
- Kisko Labs Oy - Howspace Hub - Mukautuva oppimisen hallintajärjestelmä kasvaviin oppimisalustavaatimuksiin
- Kisko Labs Oy - Sanoma Pro: Multimediasisältöjen hallinnan uudistaminen
- Kisko Labs Oy - Svean helppokäyttöinen palvelu asiakkaan verkko-ostosten hallintaan
- Kisko Labs Oy - Yhtenäinen käyttöliittymä luovien alojen ammattilaisille
- Codemate - Digitaalisen murroksen nopeuttaminen Flutterin avulla
Tapahtumat & webinaarit
- 27.11.2024 - Green ICT -ekosysteemitapaaminen III: Ohjelmistojärjestelmien virrankulutuksen mittaaminen ja kasvihuonepäästöjen arviointi
- 27.11.2024 - Digitaalisen asiakaskokemuksen uusi aikakausi
- 28.11.2024 - Webinaari: Keskity myyntityön laatuun!
- 28.11.2024 - Copilot-webinaari – Mielekkäämpää tietotyötä turvallisesti
- 04.12.2024 - Kuinka oikea matka- ja kululaskujärjestelmä tehostaa prosesseja?
- 05.12.2024 - Green ICT VICTIS -hankkeen kick off -tilaisuus
- 15.01.2025 - Datavastuullisuuden valmennus: hanki valmiudet vastuulliseen datan ja tekoälyn hyödyntämiseen
Premium-asiakkaiden viimeisimmät bloggaukset
- Kisko Labs Oy - Heroku: Millaisiin projekteihin se sopii ja mitkä ovat sen todelliset hyödyt ja haitat?
- Zimple Oy - Pipedrive vai Hubspot? Kumpi kannattaa valita?
- SC Software Oy - Jatkuvat palvelut – asiakaslähtöistä kumppanuutta projekteista ylläpitoon
- Timeless Technology - Ohjelmoitavat logiikat (PLC): Ratkaisevat työkalut automaatioon ControlByWebiltä.
- Kisko Labs Oy - Heroku: Ohjelmistokehittäjän ykköstyökalu skaalautuvien sovellusten rakentamiseen
- SD Worx - Näin luot vakuuttavan Business Casen palkkahallinnon ulkoistukselle
- Timeless Technology - Kyberriskien tunnistaminen Profitap IOTA verkkoanalysaattorin avulla.
Digitalisaatio & innovaatiot blogimediaBlogimediamme käsittelee tulevaisuuden liiketoimintaa, digitaalisia innovaatioita ja internet-ajan ilmiöitä |