De förädlar framtidens musiktjänster
Trött på att få vilseledande tips i musiktjänster som Spotify eller Grooveshark? Snart kan det problemet vara löst. Forskare på KTH har nämligen tagit fram ett nytt sätt att beskriva och kategorisera musik som kan ligga till grund för hur framtidens musiktjänster ger låttips till lyssnarna.
Anders Friberg och Anders Elowsson, forskare vid KTH. Foto: Peter Larsson
Visst finns det ett knippe musikteoretiska termer som vi kan använda oss av när det kommer till att beskriva och diskutera musik. Det stora flertalet människor har emellertid inte studerat musikteori vilket gör att notskrift, harmoni- och gehörslära samt termer som andantino och dissonans tillhör ett obegripligt språk för de flesta.
Samma princip gäller förstås även för datorer. För att de ska kunna tipsa dig om musik som du förhoppningsvis gillar måste de också kunna analysera vad du lyssnar på enligt en tydlig uppsättning parametrar. Parametrar som beskriver musik på samma sätt oavsett vilken grupp, låt eller musikgenre det handlar om.
Det är här KTH-forskarnas arbete kommer in i bilden. De har tagit fram något de valt att kalla för perceptuella särdrag som ett sätt att beskriva all musik enligt samma, tydliga parametrar.
– Musiklyssnande är ett sätt för människor att försöka förstå sin omgivning, och det har vi utgått från, säger Anders Friberg, forskare vid KTH. Man vill förstå musikern bakom musiken. Vad har musikern för intentioner? Hur ledsen eller arg är hon eller han? Hur mycket energi har personen lagt ner på att framföra musiken? Det är samma grundläggande mekanismer som överallt annars. Att förstå andra människors känslor kan vara livsviktigt.
Forskarna har således i ett första steg tagit fram följande 9 perceptuella särdrag som musik kan beskrivas med, och som bygger på just dessa mänskliga sidor snarare än ren faktaspäckad musikteori:
Hastighet: I stället för att tala om tempo, den term man brukar prata om vanligtvis, så använder vi hastighet. Detta då tempo till exempel inte tar hänsyn till hur många toner som spelas under en viss tid.
Rytmisk komplexitet: Stor variation av olika taktarter i ett och samma musikstycke.
Rytmisk klarhet: Detta berättar hur tydligt pulsen anges. Pulsen det är tempot eller ska vi säga "beatet". Det du stampar takten till i techno. Är tydligt i dansmusik, mer flytande i avancerad jazz eller klassisk musik.
Artikulation: Om musiken innehåller korta eller bundna/långa toner.
Dynamik: Om musiken uppfattas starkt eller svagt, till exempel löst eller hårt spelande på trummor eller fingrarnas anslag på pianots tangenter.
Modalitet: Om musiken går i dur eller moll.
Harmonisk komplexitet: Berör om harmoniken ändras mycket, det vill säga ackord med många dissonanser. Mer förenklat: massor av toner på en och samma gång.
Tonhöjd: Hög eller låg.
Klangfärg: Ljus eller mörk.
I ett andra steg har dessa 9 perceptuella särdrag testats på människor
– Vi har låtit försökspersoner – 20 till antalet – bedöma dessa särdrag genom att de applicerats på musik. Totalt cirka 210 exempel från pop och filmmusik har personerna lyssnat på. Det vi kan se är att de perceptuella särdragen fungerar, och att till exempel egna referenser och kulturella skillnader inte spelar någon roll. Vi skulle kunna ta 20 nya försökspersoner och resultatet skulle bli det samma, säger Anders Friberg.
Han fortsätter med att berätta att de särdrag som funkat allra bäst är hastighet, modalitet, dynamik och harmonisk komplexitet.
– Dynamik är ju det som ger musiken energi, harmonisk komplexitet bidrar med själva känslouttrycket. Det här gör att det går att bestämma eller karakterisera musikgenrer, både från ett mänskligt och tekniskt perspektiv. Det som vi nu jobbar med är att ta forskningen vidare och utveckla datormodeller som gör att musiken kan analyseras automatiskt av och i till exempel musiktjänster.
Blir musikrecensenterna överflödiga och därmed arbetslösa nu?
– Haha. Näe. Vårt sätt säger ingenting om musiken är bra eller dålig. Just den estetiska bedömningen är bland det svåraste man kan ägna sig åt, och det musikrecensenter jobbar med. Det är ju den sociala och kulturella kontexten som bestämmer recensentens uppfattning. Men visst, den biten kan väl forskare också försöka sig på att bedöma med hjälp av datorer, men då blir det riktigt avancerat.
Ämnesområdet som sådant är hett just nu.
– Precis som att Google analyserar både text och bilder så jobbar de, Spotify, Apple och andra företag intensivt med musikanalyser just nu.
Anders Friberg tillägger att han och några andra KTH-forskare redan haft ett förutsättningslöst möte med Spotify, även om de ännu inte kommit fram till något speciellt.
KTH-forskarnas arbete är så pass framgångsrikt att de precis fått en vetenskaplig artikel publicerad i den prestigefulla tidskriften Journal of the Acoustical Society of America.
Förutom Anders Friberg har även KTH-doktoranden Anders Elowsson varit involverad i forskningsarbetet.
Filed under: SvenskTeknik