Älykkäämpää musiikkia – mitä jäi käteen Slush Musicista?

Joni Kling vieraili startup-tapahtuma Slushista irtautuneessa Slush Musicissa.

Slush Music
30.11.2016
Kaapelitehdas, Helsinki

Startup-yrittäjille suunnattu Slush-tapahtuma haarautui tänä vuonna ensimmäistä kertaa kahdeksi rinnakkaistapahtumaksi. Kaapelitehtaalla järjestetyssä Slush Musicissa pohdittiin musiikkiteollisuuden murrosta, tarjolla olevia käytännön sovelluksia ja niiden tarjoamia tulevaisuudennäkymiä.

Sillä tulevaisuudessahan me elämme. Koska Googlen AI päihitti Go-pelin euroopanmestari Fan Huin viidesti putkeen, vaikkei sen pitänyt tapahtua vielä kymmeneen vuoteen. Koska kuvantunnistukseen koulutetut syväoppimisalgoritmit tekevät nyt työtä, jonka piti olla niille kokonaan mahdotonta. Koska marraskuussa Helsingissä sataa kuin Blade Runnerissa ja androidit ovat arkipäivää. Myös musiikille ja medialle älyteknologian pitäisi taata loputtomat mahdollisuudet. Slushin puheenvuorojen optimismia rajoittaa ainoastaan kello, joka on asetettu tikittämään viidentoista minuutin slotteihin.

Teknologia- ja markkinointi-innovaattoreille ratkaisumallien tarjonta on kirjavaa, mutta alalla työskentelevät tuntuvat tunnistavan niiden juurella olevan yhteisen ongelman. Se on jotain, mikä syntyi musiikkitarjonnan digitalisaation sivutuotteena kaksi vuosikymmentä sitten, ensin Napsterin ja Pirate Bayn, sittemmin laillisten verkkokauppojen ja suoratoistopalveluiden rasitteeksi muodostuen: tarjonnasta ei ole enää pulaa – sitä on loputtomasti.

Monien mielestä suoratoiston kannattavuuskysymys onkin jo ratkaistu. Kynnyksenä ei ole ansaintarakenne, vaan tarjonnan optimointi saavutettavuuteen, jolloin avainkysymykseksi muodostuu parempien työkalujen kehittäminen datan hallitsemiseksi. Digitaalisen jakeluketjun viimeinen haaste onkin sen hitain komponentti: ihminen. Tuhansilla nimikkeillä kuukausittain karttuvat musiikkikirjastot ovat hyödyttömiä niin kauan kuin loppukäyttäjän on edelleen kuunneltava kappaleet reaaliajassa – ellei joku sitten kerro hänelle, mihin kannattaa tarttua.

”Emme ole korvaamassa inhimillisyyttä. Olemme ratkaisemassa ongelmaa, joka on saavuttanut epäinhimilliset mittasuhteet”, kertoo Slushissa workshopia vetävä Musimap-startupin toimitusjohtaja Vincent Favrat. Hänenkin mielestään valinnanvapauden ylitarjonta on johtanut tilanteeseen, jossa digitalisaation lupaukset ovat toteutuneet vain puolittain. Käyttäjä ja kappale eivät kohtaa toisiaan. Suoratoistomusiikin valtavasta tarjonnasta suuri osuus jää kulutuksen ulkopuolelle saatavilla olevan datan vaikean navigoitavuuden ja käyttäjäsegmenttien moninaisuuden vuoksi.

Osumatarkkuuden ja -relevanssin parantamiseksi Musimap on kehittänyt ohjelmointirajapintoja käyttäen hyväksi musiikki- ja kielitieteellistä lähestymistapaa signaalianalyysiin ja neuroverkkoihin yhdistettynä. Esimerkiksi sen Pingtrax-hakukonemoottori käyttää lähtökohtanaan viiden miljoonan kappaleen korpusta johon on kartoitettu kaksi miljardia datapistettä. Sen tietokannassa on tägättynä tuhansia avainsanoja, genrejä, kuuntelukonteksteja sekä lisäksi 400 kompleksia tunnelmakuvausta.

Ohjelma, joka pystyisi suosittelemaan kappaleita vaikkapa määreillä ”hiphopahtava house”, ”Liverpool” ja ”purkan pureskelu kadunkulmalla” kuulostaa paperilla lopulta paljon näkemyksellisemmältä kuin tuttava, joka suosittaa kappaletta vain kuvailemalla sen olevan ”groovy”. Parhaimmillaan tällaiset älykkäät musiikkiassistentit tuntisivat kuulijan maun lopulta parasta ystävää paremmin, kun niitä vain koulutettaisiin tarpeeksi.

Osa medioista luottaa silti informaatioprosessoinnissaan yhä kaveriverkostojen ja sosiaalisen aspektin voimaan. On helppoa kerätä tietoa kuulijoista ja suositella sen jälkeen musiikkia vedoten tämän edustamaan viiteryhmään. Datalouhinnan konkreettisimmaksi hyödyntämistavaksi ovat muodostuneet kohdennettujen soittolistojen tyyppiset asiakassovellukset. Muun muassa Spotify käyttää listojensa julkaisemisessa apunaan analytiikkaa ja algoritmeja, toisaalta se julkaisee perinteisesti ”käsin” kuratoituja soittolistoja, jotka on kohdennettu vaikkapa kasarihevifaneiksi tunnustautuville. Mutta digitaalisten mediakirjastojen käytettävyyden kehitettämiseen on tarjolla muitakin metodeja.

”Suosituksia voidaan tuottaa kahdella tavalla. Yksi lähestymistapa on, että katsotaan, mistä muut samanlaiset käyttäjät ovat tykänneet eli kollaborativiinen suosittelu. Periaate on yksinkertaisesti katsoa ketkä ovat pitäneet jokseenkin samoista kappaleista kuin sinä, ja sitten suositella kappaleita joista he pitävät”, kertoo tietojenkäsittelytieteen professori Hannu Toivonen Helsingin yliopistosta.

Toivosella ei ole yhteyttä Slush Music -tapahtumaan, sen sijaan musiikkisovelluksissakin hyödyntämiskelpoista laskennallista luovuutta on hänen ohjaamassaan Discovery-työryhmässä tutkittu kansainvälisellä tasolla. Laskennallisen luovuuden tutkimusalan tavoitteena on koneiden kehittäminen luovaan toimintaan ja ihmisluovuuden tukemiseen. Sovelluksena on syntynyt muun muassa runoja generoivia ja musiikkia säveltäviä tietokoneohjelmia.

”Toinen lähestymistapa on se, että katsotaan suositeltavan asian sisältöä. Silloin on mahdollista tehdä monimutkaisempia asioita. Katsotaan, millaisia piirteitä musiikki sisältää ja suositellaan vastaavia piirteitä sisältävää musiikkia. Luova suosittelija pystyisi äärimmillään suosittelemaan jotain, mikä on sisällöllisesti erilaista kuin mihin käyttäjä on tottunut, mutta silti perustellusti järjestelmä pystyisi arvelemaan sen kiinnostavaksi”, Toivonen sanoo.

Automaattisesti generoitujen sisältöjen ja niitä tuottavien koneiden itsenäisyydestä Toivonen ei vielä vedä yhtäläisyyksiä science fictionilta kuulostaviin tulevaisuuskuviin. Jos algoritmin avulla voidaankin säveltää uusia Beatles-kappaleita, ei ole yksiselitteistä, miten tämä korreloi luovuuden kanssa. Toivonen mainitsee oman tutkimusryhmänsä tuottamat, unidatan pohjalta generoidut sävellykset esimerkkinä siitä, kuinka annettujen parametrien puitteissa koneilla on lähtötasolla varsin vähän valinnanvaraa toiminnassaan.

Koneoppiminen tekee aiheen kuitenkin mielenkiintoiseksi, sillä kone voi itse muodostaa omia säännöstöjään annetuista aineistoista. Tällöin ohjelmoija toimii korkeammalla abstraktiotasolla ja ohjelma tulee itsenäisemmäksi. Laskennallisessa luovuudessa tutkitaan, miten abstraktiotasoa voidaan edelleen nostaa ja millaisissa asioissa.

”Entä jos kone voisi muuttaa annettuja tavoitteita ja vaihtaa tavoitetta johonkin, joka näyttää lupaavammalta”, pohtii Toivonen. Tästä päästään ongelmaan inhimillisen ja algoritmiin perustuvan mieltymyksen eroista: yksi vaikeasti mallinnettava piirre on Toivosen mukaan yllätyksellisyys, koska yllätyksen mielenkiintoisuutta on vaikea ennustaa. Lisäksi vaikkapa ulkomusiikilliset tekijät sanelevat lopulta valintoja siinä missä opittu samankaltaisuuskin.

”Ihmiselle musiikki on hyvin sosiaalista. Siihen sisältyy paljon tiedostamattomia asioita, jotka liittyvät kappaleisiin. Jos pidän tietystä bändistä, ei ole ollenkaan hyvä suositus, jos tarjotaan jotain hyvin samanlaista”, Toivonen sanoo.

Tiedustelen Musimapin Vincent Favrat’lta, pystytäänkö yhtiön tarjoamiin sovelluksiin tuomaan jonkinlaista tahdollista varianssia, ihmisenkaltaisuutta. Favrat toteaa sen olevan lopulta käyttäjän omassa hallinnassa.

”Serendipiteettiä – kuulija pystyy lisäämään sitä itse liukuvalla säädöllä sen mukaan, kuinka paljon on itse valmis tutkimaan”, Favrat kertoo. Hänenkään mielestään algoritmi, joka yrittäisi suositella Rolling Stones -fanille Mick Jaggerin levyä, ei olisi kovin onnistunut.

Mutta Slushissa kyse on tulevaisuudesta. Siitä, mikä voisi vielä olla mahdollista. Vaikka tuntuu, että mekanistisen 1900-luvun jäänteet on haudattu näkyvistä, näkyy se kuitenkin yllättävän vähän keskustelukulttuurissa. Ikivanhasta kiistasta nativismin ja empirismin välillä ei ole siirrytty vielä moderniin debattiin informaationprosessoinnin ja neuroverkon välillä. Puheenvuoroissa ei spekuloida vielä sillä, kuinka ylivertaisin mahdollinen ohjelma ihmismaun rinnalle kehitettäisiin. Kuka tai mikä säveltäisi tulevaisuuden suurteoksia?

Pragmaattisuudessaan keskustelukulttuuri keskittyykin työnjakoon. Päällimmäisenä Slushin keynote-puheenvuoroista jää mieleen teknologia-startupien pyrkimys neuvotteluun kahdella perusimplementaatiotasolla. Toisaalta kiinnostaa se, missä ”ajatteleva” malli toteutetaan: tekeekö työn loppupeleissä kone vai ihminen? Mutta sovellukset ovat aina ihmislähtöisiä. Tekniikka on tarkoitettu tukemaan luovaa inhimillistä työtä.

Jos yksi tämän vuoden trendeistä oli soittolistojen koneellinen optimointi, ehkä kiinnostavimpana vastapuolena esiin nousi toistuva ajatus myyntiin ja kulutukseen perustuvien listojen roolista. Koneoptimoinnin aikana ne eivät ole enää relevantteja, koska aiemmin marginaalisiksi jääneet hännänhuiput voidaan täsmämarkkinoida tehokkaammin, jolloin listakärjen merkitys kapenee.

Yhden harvoista vastaäänistä esitti Dj Orkideanakin tunnettu Tapio Hakanen, joka aloitti elokuussa 2016 YleX:n musiikkipäällikkönä. Slush Musicin päättäneessä paneelissa Hakanen korosti, että digitalisaatio ja data ovat työkaluja, jotka hyvin käytettynä tukevat perinteisiä sisältöjä, mutta mainitsi myös myyntilistakärkien jumiutumisen pitkään asemansa pitäviin superhitteihin, jolloin älykäs suosittelukaan ei toimi, kuten sen pitäisi, vaan muuttuu eräänlaiseksi itseään syöttäväksi koneeksi.

Hakasen sanoista herää kuitenkin kysymys: ovatko itseorganisoituvat algoritmit oikeasti rikki – vaiko ehkä niitä työllistävät suoramyyntikäytännöt. Oli kyse musiikin tekemisestä tai sitä levittävistä teknologioista, kun jotain orgaanisesti kasvanutta monetisoidaan, markkinoilta vaaditaan muuntojoustavuutta. Koneet oppivat, oppiiko raha?