GPT-kielimallin mukaan Suomessa Pohjoismaiden hilpeimmät joululaulut
On taas se aina vuodesta, että lauletaan joululauluja – niin hilpeitä kuin kaihoisiakin.
Kolme vuotta sitten kirjoitin blogin, jossa esittelin leikkimielisen analyysini pohjoismaisten joululaulujen tunnelmasta. Analyysiin arvioin joululauluista kunkin yksittäisen sanan hilpeyden, ja koko laulun tunnelma saatiin sitten laulun sanojen keskiarvona. Yksittäisten sanojen positiivisuus tai negatiivisuus haettiin käyttämällä aineistona joukkoa IMDB-leffa-arvioita ja twiittejä.
Hieman yllättäen tuon analyysin mukaan Pohjoismaista hilpeimmät joululaulut löytyivätkin Suomesta.
Kulunut vuosi on tuonut mukanaan GPT-kielimallit, joiden pitäisi osata aiempia tekoälymalleja paremmin ymmärtää kieltä kokonaisuutena. Niinpä oli luonteva ajatus toistaa tämä joululaulujen analyysi kielimallien avulla.
Analyysin työkaluna käytin Azuren ChatGPT 3.5 -mallia, jolle esitin yksinkertaisen kehotteen: ”Arvioi oheisen joululaulun sanoituksen tunnelma (asteikolla nollasta yhteen)”. Aineistona käytin puolestaan samoja joululauluja kuin edellisessäkin harjoituksessa.
Tulokset vaihtelivat mallien välillä
Ensimmäiseksi vertasin yksittäisten joululaulujen tunnelmaa eri analyysimenetelmien välillä. Eri menetelmillä saadut arviot laulujen tunnelmasta osoittautuivat hyvin erilaisiksi, sillä korrelaatio vanhan ja uuden mallin tuottamien tulosten välillä oli vain 0,13. Hitusen verran siis mallit arvioivat laulujen tunnelmaa samaan suuntaan, mutta yksittäisen laulun kohdalla tulokset vaihtelivat suuresti.
Seuraavaksi tarkastelin joululaulujen keskimääräistä hilpeyttä eri pohjoismaiden välillä, eli laskin maakohtaiset keskiarvot laulujen saamista tuloksista. Edellisen tuloksen huomioiden oli hieman yllättävää, että myös ChatGPT-kielimallin mielestä suomalaiset joululaulut olivat hilpeimpiä. Tässä suhteessa kielimallilla laskettu tulos oli siis yhteneväinen kolmen vuoden takaisen analyysini kanssa.
Toisaalta on syytä muistaa, että yleisen käsityksen mukaan suomalaiset joululaulut ovat sieltä synkimmästä päästä:
- Vinkka: Ihanat kamalat joululaulut – Miksi suomalaiset joululaulut ovat niin synkkiä?
- MTV: Ruotsinsuomalaisilta tylyä ilkeilyä – kuusi syytä, miksi joulun vietto on Suomessa kaikkein masentavinta.
Kuvassa analyysin tulokset eri malleilla: Vaaleansininen – ChatGPT -kielimalli, Tummansininen – yksittäisten sanojen arvioihin perustuva malli (sanojen arviointiin käytetty Tweet-aineistoa), Oranssi – kuten edellä, mutta IMDB-aineiston perusteella tehty sanojen luokittelu). X-akselilla ryhmitelty eri pohjoismaat. (Huom! Menetelmien erilaisuudesta johtuen palkkien ”korkeuden” vertailu ei ole mielekästä. Oleellista on huomioida eri maiden järjestys kunkin mallin puitteissa.)
Yksittäisissä lauluanalyyseissä yllätyksiä
Lopuksi tarkastelin vielä yksittäisten laulujen saamia tuloksia, jotka osoittautuiva mielenkiintoisiksi.
ChatGPT-kielimallin luokittelun mukaan hilpeiden laulujen kärjestä löytyy odotettuja lauluja, kuten "Tonttu Torvinen", "Tonttujen joulu" ja "Joulu on taas”. Synkkien laulujen kärkeä pitää puolestaan tontun unettomuudesta kertova laulu.
Joukkoon mahtuu kuitenkin myös yllättäviä tuloksia. Kielimallin analyysi laulusta ”Varpunen jouluaamuna” kuuluu seuraavasti: "Sanoitusten perusteella on vaikea määrittää kappaleen tarkkaa sävyä. Joulun maininta ja loppua kohden oleva kiitollinen ja iloinen sävy viittaa kuitenkin siihen, että se saattaa olla enemmän iloisen puolen puolella. Arvosanaksi antaisin noin 0,7 asteikolla synkästä iloiseen."
Sylvian joululaulun kielimalli arvioi näin: ”Sanoitusten perusteella on vaikea määrittää kappaleen tunnelmaa. Jotkut rivit viittaavat iloiseen ja juhlavaan tunnelmaan, kun taas toiset vihjaavat melankolisempaan sävyyn. Siksi antaisin tälle joululaululle arvosanaksi 0,5 asteikolla synkästä iloiseen.” No, onhan se sentään puolivälissä asteikolla.
Juice Leskisen jouluklassikosta "Sika" malli päättelee seuraavaa: "Synkän ja väkivaltaisen sanoituksen perusteella antaisin tälle joululaululle tuloksen nolla asteikolla synkästä iloiseen." Kielimalli ei selvästikään ymmärrä savolaista huumoria.
Kielimallit eivät ymmärrä tekstien kokonaismerkitystä – ainakaan vielä
Esimerkkilaulujen analyysit kuvaavat oikeastaan aika hyvin sitä, mistä kielimalleissa perimmiltään on kysymys: ne tarttuvat lopulta pääosin yksittäisiin sanoihin ja enintään lauseisiin mutta eivät siltikään "ymmärrä" sitä tekstien kokonaismerkitystä, jota sanoilla ja lauseilla halutaan välittää.
Toisaalta kielimallien läpilyönti yleiseen käyttöön tapahtui vasta reilu vuosi sitten, joten ne kehittyvät edelleen hurjalla nopeudella. Ensi jouluna niiden tuottamat analyysit voivat olla huomattavasti nykyistä parempia.
Ja kuka tietää – ehkäpä tulevaisuudessa mallit osaavat arvioida myös melodian hilpeyden tahi melankolian osana analyysiään?
Lisätietoja
Tagit
Liiketoimintaprosessi
BI ja raportointi |
Erikoisosaaminen
Tekoäly (AI) ja koneoppiminen |
Teknologia
Microsoft |
Omat tagit
Innofactor - Asiantuntijat ja yhteyshenkilöt
Innofactor - Muita referenssejä
Innofactor - Muita bloggauksia
It- ja ohjelmistoalan työpaikat
- Laura - Tietoturva-asiantuntija
- Nordea - Senior Full Stack Developer with IAM knowledge
- Tecinspire Oy - Dev Team Lead - Kehityksen tiimipäällikkö
- Laura - IT Manager
- Laura - Network Specialist
- Laura - Tiedonhallinnan erityisasiantuntija
- Laura - Junior Cyber Security Specialist
Premium-asiakkaiden viimeisimmät referenssit
- Ampersand Design Oy - Asiantuntijuuden vahvistaminen referenssitarinoilla
- Verkkovaraani Oy - Lentorata.fi-sivuston saavutettavuusauditointi
- Innofactor Oyj - Apotek 1 tarjoaa innovatiivisia palveluja Azure Kubernetes -ratkaisun avulla
- Innofactor Oyj - Business Centralin lisäarvoratkaisut tehostavat Domicetin liiketoimintaa
- Efima Oyj - Case Martela: Luottamus ERP-kumppaniin rakentui tehtaan lattialla
- Valve - Korsisaari uudistunut verkkopalvelu
- Valve - Musiikkituottajat – IFPI Finland ry verkkopalvelun uudistus
Tapahtumat & webinaarit
- 21.05.2024 - The path to productization
- 21.05.2024 - Ilmainen ERP-webinaari: NAV:stä Business Centraliin | Business Centralin mahdollisuudet versionvaihdon jälkeen
- 23.05.2024 - Ilmainen BI ja ERP-webinaari: Paradigman muutos
- 28.05.2024 - SprintIT webinaari ti 28.5. klo 10: Odoo Raportointi - Sitä saat mitä mittaat!
- 29.05.2024 - Efistream-webinaari: Näin rakennat modernin taloushallinnon, joka tukee tiedolla johtamista
- 29.05.2024 - Ilmainen ERP-webinaari: Forbesin maailman parhaaksi valitseman liiketoimintaohjelmiston, Business Centralin, esittely ja demo
- 30.05.2024 - Palvelumuotoilu osana DevOpsia
Premium-asiakkaiden viimeisimmät bloggaukset
- Ready Solutions Oy - Tietomallit osana informaatioarkkitehtuuria
- Timeless Technology - Milesight UR32L Lite Series teollisuusreititin hintaan 115,00€!
- Innofactor Oyj - Dynasty Asiointipalvelun 3 tärkeintä hyötyä
- Efima Oyj - Microsoft Fabric -sanakirja: esittelyssä Fabricin analytiikkatyökalut
- Staria Oyj - Citycon ulkoistaa pohjoismaiseen talous- ja vuokrahallintoon liittyvät toiminnot Starialle
- Timeless Technology - Perlen 4G ja 5G reitittimet: Virtaviivaista verkonhallintaasi Docker OCI-säilöillä.
- Ready Solutions Oy - Lakehouse – alusta vai tietovarasto moderniin analytiikkakehitykseen?
Digitalisaatio & innovaatiot blogimediaBlogimediamme käsittelee tulevaisuuden liiketoimintaa, digitaalisia innovaatioita ja internet-ajan ilmiöitä |