Mitä on aikasarja-analyysi ja ennustaminen?
Aikasarja-analyysin ja ennustamisen perusteista
Aikasarja-analyysi on data-analytiikan osa-alue, jossa kohteena on joukko ajan suhteen järjestettyjä havaintoja.
Yleisesti ottaen tulevaisuuden ennustaminen on vaikeaa, mutta silti on olemassa menetelmiä, joilla voimme yrittää hyödyntää erilaisten ilmiöiden välistä tai sisäistä ajallista riippuvuusrakennetta. Tähän aikasarja-analyysi ja ennustaminen tarjoaa ratkaisuvaihtoehtoja.
Aikasarja-analyysi on kokoelma erilaisia menetelmiä, joilla aikasarjojen sisäisen sekä keskinäisten riippuvuuksien avulla voidaan toisaalta ennustaa tulevaisuuden havaintoja tai selittää sarjojen vaihtelun luonnetta.
Aikasarjamallien tuottamat ennusteet voivat olla äärimmäisen tärkeitä osana jotain laajempaa optimointia, esimerkiksi vaikka varastokantaan sitoutuneen pääomakustannuksen minimisoinnissa ehdolla, että liikevaihtoa ei menetetä tuotteiden loppumisen vuoksi. Ja toisaalta sähkön tai kaasun tai periaatteessa minkä tahansa energiatuotteen vähittäismyyjälle kysynnän ennustaminen voi olla erittäin tärkeää.
Sovellettu matematiikka, tilastotiede, ekonometria sekä signaalinkäsittely ovat kaikki tuottaneet teoreettista pohjaa sekä menetelmiä aikasarja-analyysiin. Esimerkiksi ajoneuvon sijainti tiettynä ajanhetkenä voidaan estimoida GPS – laitteen signaaleista Extended Kalman Filter – algoritmilla tai vastaavalla, vaikka ajoneuvon sijainnin mittaus ei olisikaan reaaliaikaista.
Aikasarja-analyysin terminologiasta
Aikasarja on ajan suhteen järjestetty jono havaintoja.
Autokorrelaatio tarkoittaa aikasarjan arvojen riippuvuutta omasta historiastaan.
Autoregressiivinen prosessi tarkoittaa sitä että prosessia voi selittää sen omalla ja muiden muuttujien historialla
Frekvenssi tarkoittaa aikasarjan havaintojen määrää per sykli, esimerkiksi 12 kuukausidatalla kun sykli on yksi vuosi
Kausivaihtelu on toistuva, säännöllinen vaihtelu aikasarjassa.
Poikkeava havainto on aikasarjan muista havainnoista selkeästi poikkeava havainto.
Suhdannevaihtelu on toistuva, mutta ei välttämättä säännöllinen, vaihtelu sarjan tasossa. Toistuu harvemmin kuin kausivaihtelu.
Suodin / Suodatin / Filter on kaava, jolla voidaan korvata aikasarjan havainnot siten että tiettyjen komponenttien vaikutus sarjasta on eliminoitu.
Trendi on pitkän aikavälin muutos sarjan tasossa.
Valkoinen kohina / white noise tarkoittaa aikasarjaa, jossa sen vaihtelua ei pysty selittämään historiallaan.
Aika-alueen ja taajuusalueen näkökulmat
Sen lisäksi että aikasarjat ovat suoraan ajan suhteen järjestetty jono havaintoja, niin aikasarjojen vaihtelun voidaan teoriassa ajatella koostuvan erilaisilta taajuuksilta koostuvista komponenteista. Historiallisia menetelmiä tämän ns. taajuusalueen analyysiin ovat olleet periodogrammi ja spektritiheysfunktio.
Suodatin tai suodin on matemaattinen kaava, jonka avulla poistetaan aikasarjasta tietyiltä taajuuksilta tulevia komponentteja, voidaan esimerkiksi pyrkiä saamaan esiin aikasarjan trendi ilman muita komponentteja. Jos aikasarjan rakenteesta voidaan tehdä olettamuksia niin erilaiset Kalmanin suotimen kaltaiset algoritmit mahdollistavat aikasarjan tilavektorin eli trendin erottamisen.
Aikasarjojen komponentit
Aikasarjan ajatellaan useimmiten koostuvan neljästä komponentista
- Trendi
- Kausivaihtelu
- Suhdannesykli tai syklinen vaihtelu
- Jäännösvaihtelu
Perinteiset menetelmät (moving averages, X11, X12-ARIMA, STL) pyrkivät erottelemaan aikasarjasta eri komponentit eri tarkoituksia varten. Taloudellisissa analyyseissä tarkastellaan useimmiten kausitasoitettuja sekä trendisarjoja. Trendisarjat voivat revisioitua käännepisteissä menetelmällisten syiden vuoksi! Komponenttien vaikutus aikasarjan tasoon ajatellaan joko summautuvana tai kertautuvana (additive, multiplicative).
Trendi kuvaa pitkän aikavälin muutosta sarjan tasossa, trendin ei tarvitse olla lineaarinen, esimerkiksi sigmoidinen käyrä kuvaisi markkinaosuuden saturoituvaa trendiä.
Kausivaihtelu on aikasarjan säännöllistä vaihtelua, joka on sidottu johonkin ajanjaksoon. Esimerkiksi vuoden sisällä voi olla useita erilaisia kausia. Suhdannesyklissä syklin pituus on pidempi ja epäsäännöllinen suhteessa kausivaihteluun. Suhdannesykli kuvaa muunlaista vaihtelua sarjassa kuin kausivaihtelua, suhdannesyklin syynä ovat useimmiten taloudelliset tekijät.
Aikasarjojen ominaisuudet
Yksinkertaisin aikasarja-analyysin aineisto esiintyy datana Tx2 matriisina, jossa toinen kenttä on aikaa kuvaava muuttuja ja toinen on aikasarjan arvo kyseisellä ajanhetkellä. Useimmiten aikasarja-analyysin data on kuitenkin datamatriisi useammasta muuttujasta. Tyypillisiä aikamuuttujaan liittyviä muunnoksia ajan eri jaksojen suhteen ovat:
- Arki / viikonloppu
- Juhlapäivät
- Vuodenaika
- Valoisa / pimeä
Aikasarja-analyysissä on äärimmäisen tärkeää huomioida sen autoregressiivinen luonne eli riippuvuusrakenne omasta historiastaan, monesti aikasarjan selitettävän muuttujan nykyisiä arvoja voidaan suhteellisen tarkasti selittää sen omalla sekä selittävien muuttujien historialla. Viiverakenne on pystyttävä valitsemaan optimaalisesti.
Ennusteet ja ennusteiden laadunvarmistus
Kun aikasarja-analyysin tarkoitus on tuottaa tarkkoja ennusteita ja saada tietoa ennuste-epävarmuudesta niin mitä asioita ennusteiden laadunvarmistus sisältää? Tyypillisesti ajatellaan että ennustevirheen rakenne kertoo paljon mallin kyvystä ennustaa sekä erilaisista puutteista.
Jos ennustevirheen aikasarja itsessään ei ole valkoista kohinaa, sisältää erilaisia rakennemuutoksia taikka heteroskedastisuutta tai autokorrelaatiorakenteen niin silloin mallissa on vielä parannettavaa.
Erilaiset visualisaatiot sekä tunnusluvut sekä testisuureet voivat olla tässä laadunvarmistuksessa avuksi.
Aikasarja-analyysi ja ennustaminen
Ready Solutionin edistyneen analytiikan – palvelut, pilvipalvelut sekä data-alustojen kehittämisen palveluiden avulla on mahdollista ottaa käyttöön erilaisia aikasarja-analyysin menetelmiä sekä ennustemalleja joilla voidaan optimoida prosesseja kun ennustekoneisto on tuottanut tarvittavat ennusteet.
Lisätietoja
Tagit
Liiketoimintaprosessi
BI ja raportointi |
Erikoisosaaminen
Analytiikka | |
Big Data | |
Integraatiot | |
Tekoäly (AI) ja koneoppiminen |
Tarjonnan tyyppi
Konsultointi | |
Koulutus | |
Toteutustyö | |
Tuki- ja ylläpitotyö |
Ready Solutions - Asiantuntijat ja yhteyshenkilöt
Ready Solutions - Muita referenssejä
Ready Solutions - Muita bloggauksia
It- ja ohjelmistoalan työpaikat
- Laura - Ohjaaja media- ja it-tiimi / oppisopimus
- Laura - Kesätyöpaikat IT-ala
- Frends iPaaS - Technical Community Manager
- Druid Oy - Myyjä - hunter-henkinen tekijä, joka saa tuloksia aikaiseksi!
- Laura - Järjestelmäasiantuntija, Millog Oy Pansio
- Laura - Signaalinkäsittelijä
- Nordea - Senior IT Analyst with Mainframe Experience / Cards Technology Requirements and Analysis Team
Premium-asiakkaiden viimeisimmät referenssit
- Identio Oy - Identio x Svenska litteratursällskapet i Finland - Täsmäosaamista modernin sisällönhallintajärjestelmän kehittämiseen
- Hellon - Redefining Digital Insurance for Vodafone
- Agenda Digital - Fican.fi WordPress-verkkosivut
- Red & Blue Oy - Taivalkosken uusi saavutettava ja erottuva verkkopalvelu
- Hion Digital Oy - Vauvan ja vanhemman matkassa – Verkkosovellus, jonka sisältö mukautuu elämäntilanteeseen
- Verkkovaraani Oy - Uudet kotisivut Talin ja Ruusulan keilahalleille
- S1 Networks Oy - Pitäiskö teidän hankkia parempi netti?
Tapahtumat & webinaarit
- 15.01.2025 - Datavastuullisuuden valmennus: hanki valmiudet vastuulliseen datan ja tekoälyn hyödyntämiseen
- 15.01.2025 - SaaS-klubi: Myyntivetoinen kasvu
- 23.01.2025 - Generatiivisen tekoälyn hyödyt liiketoimintajohtajalle
- 29.01.2025 - Modern toolchain and AI breakfast seminar with Eficode, AWS and HashiCorp
- 30.01.2025 - Suuri Rahoitusilta
Premium-asiakkaiden viimeisimmät bloggaukset
- Aveso Oy - Kestävää tulevaisuutta rakentamassa teknologian avulla – IFS ESG-työkalut integroituna järjestelmään
- Identio Oy - Web Applications: How We Build Minimum Lovable Products in 2025 – Launching the Product
- Kisko Labs Oy - Ideasta innovatiiviseksi ohjelmistoksi ja menestyväksi liiketoiminnaksi
- Timeless Technology - Tempmate dataloggerit äärimmäisten lämpötilojen mittaamiseen.
- Efima Oyj - Vastuullisuusjohtaminen on liiketoiminnan johtamista – Muista nämä 10 asiaa, kun valitset työkalua kestävyysraportointiin
- Nordea - Mietteitä Nordean graduaattiohjelmasta
- Kisko Labs Oy - Hackathonien haasteet ja ratkaisut: reiluuden ja tuloksellisuuden tavoittelu
Digitalisaatio & innovaatiot blogimediaBlogimediamme käsittelee tulevaisuuden liiketoimintaa, digitaalisia innovaatioita ja internet-ajan ilmiöitä |