Entries from April 2023 ↓

Frågan är inte om maskin kan göra en låt. Frågan är vad vi ska göra av hundra tusen låtar. (Om AI, skval och musik.)

AI-musik? Vad som menas med detta är inte självklart. Dels för att begreppet “AI” i sig är en notoriskt vag metafor. Dels för att “musik” är ett sorts paraplybegrepp för en rad olika praktiker, vilka var för sig i någon mån kan överlåtas till mjukvara. Här har onekligen vissa genombrott skett med de senaste årens utveckling av generativ AI, det vill säga stora språkmodeller (jag står fast vid att “syntetisk media” är en bättre benämning).

Betyder detta att vi är på väg mot att få vad man kallar för fullständigt AI-genererad musik? Nej. Här måste vi åter fundera på vad fullständig automatisering ens skulle betyda i sammanhanget. Vilket såklart tvingar oss åter till frågan om vad musik är.

På ett sätt blir det en fråga om att inte se skogen för alla träd. Fast tvärtom: att inte höra träden för all skog.
På ett annat sätt blir det som den gamla frågan: om ett träd faller i skogen men ingen hör det, gör det då något ljud? Fast nu är det inte ett träd som faller, utan miljoner och åter miljoner, inte i en skog utan i en streamingtjänst.

Min grundhållning är att det egentligen inte finns någon stor vattendelare i “AI-musik”. Vi måste se saken som mer av en gradfråga och som en pågående omförhandling. Jag tänker mig en skala där varken 0 eller 100 är särskilt intressanta, rent musikaliskt.

Så länge musik är digitalt förmedlad får vi räkna med att den har ett inslag av så kallad AI. Även om det inte skulle användas i låtskrivandet, i de elektroniska instrumenten eller i framförandet så är det sedan flera år legio att använda så kallad AI vid mastringen av en inspelning. När inspelningen laddas upp till en streamingtjänst så kommer den genast att komprimeras och de olika nivåerna att åter modifieras – med hjälp av så kallad AI. Vilket kan ske ännu en gång när musiken spelas upp på ett ljudsystem eller i ett par brusreducerande hörlurar.

Vi har heller inte närmat oss något som skulle kunna kallas för en 100 procent AI-genererad musik. Tvärtom återstår fortfarande en massa inslag av mänsklig handpåläggning. Detta blir desto tydligare om vi lyckas bortse från den förvillande metaforen “intelligens” och i stället ser till vilken data som går in respektive kommer ut.
När en “generativ AI” kan spotta ur sig musik är det för att den har tränat sig på att efterlikna befintlig musik. Redan i urvalet av träningsdata har människor styrt utfallet.

Ingen ska inbilla sig att dessa språkmodeller har tränat sig på “all musik”, som i all musik från alla kulturer och alla tider. (Detta vore förvisso en intressant övning som kanske skulle resultera i den första musik någonsin som verkligen gjorde skäl för namnet “världsmusik”. Bortsett då från att det mesta av “all musik någonsin” aldrig spelats in. Och att det inte är givet hur olika epoker och kulturer skulle viktas mot varandra. Min övertygelse är för övrigt att denna hypotetiskt universella världsmusik skulle bli fullständigt intetsägande och kanske inte ens kunna kallas för musik.)

Alla försöken att skapa “AI-musik” har varit kulturellt partikulära. Träningsdatan tenderar att ha en kraftig slagsida mot västerländsk topplistepop (eller mot typ Mozart). Någon har valt ut en viss typ av musik mot vilken språkmodellen svarar som en stokastisk papegoja. Även i valet av och hanteringen av parametrar i modellerna sker såklart massor av mänsklig handpåläggning som gör att vi inte kommer i närheten av en “fullständigt automatisk” musik.

Och detta gäller bara vad som går in. Ännu mer intressant är att tänka på vad som kommer ut och hur det över huvud taget når fram till ett öra.

Mänsklig musik hotar att drunkna i AI-skval” står idag som rubrik för en artikel på DN Kultur där även jag är intervjuad. Jag går med på att en s.k. AI skulle kunna skapa en poplåt – inom mänskligt satta ramar för vad en “poplåt” ska vara – från grunden, men:

– Så snart den kan göra en habil poplåt så innebär det att den kan bli lika bra på att göra hundratusen habila poplåtar. Och det är steget mellan en och hundratusen som blir problematiskt eftersom den automatiska överproduktionen av musik kommer att svämma över marknaden med produkter som ingen egentligen har efterfrågat, säger Fleischer:

– Den logiska följden blir ju hyperinflation, att musiken tappar i värde.

Utifrån min tidigare Aftonbladetartikel om syntetisk media tar jag upp tanken på en ny sorts framväxande uppdelning mellan högkultur och lågkultur, grundad i det simpla kriteriet på om det finns en mänsklig avsändare. Jag tror nämligen just att avsändaren är en rätt avgörande sak här, viktigare än i vilken mån som datorhjälpmedel har använts i själva produktionen.

Han beskriver det som ett A- och B-lag som utgörs av konnässörsmusik och funktionsmusik.

– Många människor kommer säkert nöja sig med att musik bara är en vagt välbekant ljudmatta som ligger och skvalpar i bakgrunden, medan andra inte kommer att göra det, säger han.

Så hur ska man som lyssnare kunna orientera sig i det enorma utbud som AI kan leda till? Rasmus Fleischer tror att vi kommer att få fler varianter av strömningssajter, där vissa håller vidöppna slussar medan andra erbjuder ett slimmat premiumutbud med mänskligt innehåll.

– I slutändan kommer vi att fortsätta efterfråga musik av en mänsklig avsändare, i form av en artist eller åtminstone en curator. Det är avsändaren som blir det viktiga, snarare än hur musiken har gjorts, säger han:

– Det här kan ironiskt nog leda till att skivbolagen får en viktigare roll, som garanter för något kvalitetsstämplat. Har någon fattat ett mänskligt beslut om att musiken är värd att ge ut, då är vi mer benägna att lyssna.

Vilka kriterier som växer fram är en fråga för den begynnande omförhandling av musiklandskapet som sker och som inbegriper såväl estetiska som ekonomiska intressen. Snarare än att uppställa ett kriterium för “riktig musik” tror jag att det vore mer intressant med en flerfald av olika musikkulturer, så som musik alltid har funkat – trots det ekonomiska intresset att homogenisera allt i ett enda gränssnitt.
Här finns historiska paralleller till tidigare omförhandlingar om musikens sociala status, exempelvis när bruket av högtalarmusik slog igenom under mellankrigstiden och man för första gången började värdesätta “levande musik” som en grej. Eller diskoteken. (Jag skrev min avhandling om sånt där.)
Personligen tänker jag att detta i hög grad är en fråga om hur intetsägande skval vi står ut med. Men frågan förtjänar också att vändas på: i vilken mån orkar vi utmana våra öron? Frågan om musikens framtid är i slutändan bara en fråga om hur vi ska leva tillsammans. Helt avgörande är vilka möjligheter vi får att uppleva musik tillsammans med andra, i de fysiska rum där det aldrig kan rymmas 100000 låtar åt gången utan bara 1. Detta var väl ganska exakt själva budskapet i min första bok från 2009: lösningen på det digitala överflödets problem kan bara vara kollektiv.

Om det politiska valet av plattform för kommunikation (apropå ett meningsutbyte med Radio åt alla)

Jag lyssnar ofta på de utmärkta poddarna under paraplyet Radio åt alla (RåA), exempelvis Eld och rörelse (där jag även har medverkat). Att jag härom veckan valde ut RåA som måltavla för lite kamratlig kritik var alltså mest för att sprida ytterligare kännedom om dessa poddar – och för att jag räknade med att få konstruktiva svar. Så blev det också!

Frågan gällde plattformspolitik. Likt många andra organisationer och poddar har även RåA valt att använda Twitter som primär plattform för att interagera med lyssnare. Sist i varje avsnitt hänvisas till radiovärdarnas Twitterkonto – och inga andra kontaktuppgifter, inte ens e-post. Är inte detta att begränsa sina kontaktytor i onödan?
Därtill kommer att just Twitter under Elon Musk befinner sig i en kombination av sönderfall och uppifrånstyrd högervridning. Aktiviteten minskar, liksom synligheten minskar för de som inte köper sig en en blå plupp. Insikten om att Twitter är allt annat än neutral sfär har redan fått många organisationer, medier och individer att dra därifrån. Men det är inte okomplicerat, som jag skrev i en första ETC-kolumn:

Uppmärksamhetsekonomin sätter ett högt pris på att lämna rummet alltför tidigt. Särskilt för journalister har Twitter blivit till ett arbetsredskap lika svårt att tänka bort som det hade varit att tänka bort faxen från en gammaldags tidningsredaktion. ”Det är bekvämt i den svenska bubblan, än så länge”, noterar Michael Kazarnowicz på Mastodon. Man klamrar sig fast vid sin invanda plattform och ”använder självironiserande skämt som försvarsmekanism”.
Men förr eller senare kommer den gräns att passeras där offentligheten hastigt vänder ryggen till Twitter, för precis som ingen vill lämna först, vill ingen vara sist kvar.

Valet av plattform är politiskt, eftersom den som stannar kvar och är aktiv på en viss plattform även bidrar till dess fortlevnad. Detta bör inte dras till en enögd moralism där man anklagar varandra för att “legitimera” det ena eller andra för att man är en aktiv användare av Twitter, Tiktok, Flashback, Spotify eller vad det nu må vara. Det väcker minnen av en moralistisk konsumtionspolitik som var betydligt mer utbredd i slutet av 1900-talet, när identiteten som “vänster” för många kom med en lång lista på företag att bojkotta. (Mudi-Mums, någon?)

Men att välja kommunikationsplattform är ändå något mer än att välja snabbmatsrestaurang. För på en plattform som Twitter är vi inte bara konsumenter, utan även producenter. Frågan som bör ställas är i vilken mån vi kan agera kollektivt i denna producentroll. Svaret kan ofta luta mot ett nej. Men frågan måste ändå ställas gång på gång, för läget kan snabbt ändra sig. Nya tillfällen kan uppstå för oss att lämna rummet tillsammans och bidra till att bygga något nytt.

Därför är valet av plattform politiskt även i en taktisk mening. Som jag skrev i en uppföljande ETC-kolumn:

Oavsett om vi talar om Twitter eller Tiktok eller någon annan stor plattform, finns det vanligen lika många skäl till att lämna som till att stanna. Om man är någon form av offentlig aktör – en podd, ett band, en politisk kampanj – tvingas man att väga skälen mot varandra.
Den enklaste vägen brukar vara att stanna i värmen, där det känns som att alla redan är. Det näst enklaste är att storma ut ur rummet (eller bara sluta logga in). Svårast är att förhålla sig till plattformarna på ett taktiskt sätt – att kanske vara aktiv i flera sammanhang parallellt, med sikte på att underlätta en kollektiv migration, bort från de platser som inte är gjorda för oss, bort från de platser som gör oss till något vi inte vill vara.

Jag uppfattar att RåA och jag har samma syn på den medietaktiska frågan. Sen kan det alltid finnas skillnader i hur de olika för- och nackdelarna värderas, vilket måste göras från fall till fall, beroende på vem man är och vad man vill uppnå.

Efter min första kolumn svarade RåA (på Twitter) att de vill följa en dubbel taktik. Å ena sidan att på längre sikt sträva bort från plattformarna och vilja bygga egna digitala forum. Å andra sidan ”att vi rent pragmatiskt alltid vill befinna oss där människor finns”.
Rimligt! Men är Twitter denna plats? Kanske. Men de allra, allra flesta – inklusive de flesta som är potentiellt intresserade av RåA – finns inte på Twitter. Vi bör också komma ihåg att Twitter sedan hösten 2021 är en mer inlåst plats än förr, som kräver att man är inloggad även om man bara vill passivt läsa trådar, exempelvis de högintressanta trådar som ofta skrivs av de medverkande i RåA.

Nu hörde jag just att jag har fått ännu ett svar från RåA-håll, närmare bestämt i teoripodden Rekreation #12: Samverkan. För övrigt ett riktigt toppenavsnitt som på rakt och lättgreppat sätt tar upp något av det mest relevant som kommit ur de postoperatistiska Marxläsningarna, med gästen Guldfiske var podd Apans anatomi ni knappast kan ha missat. (Missa i synnerhet inte dess senaste avsnitt där Mathias snackar Tiqqun ihop med Liv Strömqvist.)

Nåväl, en bit in i i nämna avsnitt av (44:20) svarar värdarna på min kritik av RåA:s kommunikationsstrategi. I sammandrag:

vår kommunikationsstrategi vad gäller allt förutom vår poddkanal är ju att vi bara befinner oss på Twitter i stort sett. Han tycker det är weak för att det skapar svaga sätt för vår publik att interagera med oss. Och då vill jag ju påstå att vår publik är fullt kapabel att skapa sina egna communities. Absolut, vi har nån typ av skyldighet att skapa plattformar för folk att interagera med oss. Men jag tror verkligen att folk idag har en extrem färdighet i att producera egna communities, egen samverkan, att länka ihop med andra. Det är inte ett hinder att det inte finns något sådant färdigt rum. … Så jag tror inte att det är ett så stort problem. Om det skulle behövas ett rum så skulle det skapas. För människor är supersuperbra på just det.

Fair point! Vi får inte stirra oss så blinda på plattformspolitiken att vi missar det myller av verkliga sammanhang för samtal som uppstår hela tiden. Jag har själv ofta diskuterat innehållet i RåA-poddar både på studiecirkelträffar, på hemmafest, på 44:an och i olika små chattgrupper man har.
Grejen är bara att inget av dessa sammanhang involverar de som gör poddarna. För utbytet med dem hänvisas vi fortfarande till Twitter. Det är väl inte hela världen, men vi är nog överens om att villkoren kunde vara bättre – och RåA uppger ju också att man har en långsiktig strategi för att skapa sådana sammanhang.

Jag är nöjd med att ha bidragit till att sätta lite ny fart på denna diskussion. Mission complete! Eller förresten, jag vill envist stå fast vid ett enda minimalt “krav”. Ha en fucking mejladress. Nämn den i slutet av varje poddavsnitt och på poddens hemsida. Det är inte svårt, det finns inget att förlora men kanske något att vinna. För det kan ju trots allt hända att det i något av de informella rum vi hela tiden skapar först ett samtal som utmynnar i någon form av respons till vad som sagts i en RåA-podd. Då vore det väl bra att kunna mejla de som driver podden? E-post som komplement till Twitter kan med fördel även användas åt andra hållet, för nyhetsbrev som påminner om nya avsnitt för de lyssnare som inte nås av sådana uppdateringar via Twitter eller nån poddapp.

E-post är det där busenkla mediet som ofta glöms när vi är alltför besatta av att säga ja eller nej till olika plattformar.

Lite relaterat till detta är förresten även min allra senaste ETC-kolumn som handlar om Substack. Under coronaåren skedde ju ett slags återfödelse av det sena nollnolltalets bloggkultur i form av nyhetsbrev, där utvalda delar ofta reserverades för betalande läsare. Vad plattformen Substack gjorde var alltså att lansera ett enkelt sätt att ta betalt för sin blogg.

Frånvaron av reklam har bidragit till intrycket av att Substack representerar ett sundare internet än reklamfinansierade plattformar som Twitter eller Youtube. Samtidigt är de delar av samma tyckonomi. För att nå framgång på Substack bör man redan vara en etablerad medieperson. Annars måste man jobba hårt på självmarknadsföring i varje tillgänglig kanal, särskilt på Twitter.

Ett tag levde alltså Twitter och Substack i någon form av symbios, samtidigt som båda företagen fortsatt att drivas med förlust. Men i ett ändrat ekonomiskt klimat tvingas de att jaga hårdare efter intäkter och har därmed vänts mot varandra.

Twitter försöker komma bort från reklamberoendet genom att ta betalt för blåa pluppar. De som köper en sådan ska även få skriva längre texter. Samtidigt lanserar Substack funktionen ”Notes” för kortare inlägg.
Elon Musk måste ha blivit skräckslagen, för han svarade genast med att blockera all möjlighet till interaktion med tweets som innehåller en länk till Substack.
Substacks vd Chris Best har å sin sida förklarat att hans nya Twitterklon ska vara en plats för maximal yttrandefrihet, även för öppen rasism. Det lär bli fortsatt stökigt. Låt oss stå vid sidan om med popcorn medan plattformarna drar ner varandra i gyttjan.

Det där sista kan om man vill läsas som en hänvisning till Cory Doctorows teori om “enshittification” eller som en svensk översättning lyder, “sugifiering“. Om detta pratas det i avsnitt #50 av Gigwatchpodden. Detta spelades nyligen in live inför publik på Kafé 44 och jag fick äran att gästa just denna del av samtalet, som blev riktigt fartfyllt.

Ett av ämnena: ”Varför suger internet?” Linnea, Jacob och jag fick bland annat återvända till Doctorows text. Han delar in plattformens livscykel i tre faser. Den första fasen är trevlig eftersom plattformen bara vill samla användare och kan drivas på riskkapital. Som i den forntid då Google var en minimalistisk sökmotor, eller när Facebook var fritt från reklam. I andra fasen stöps allt om till förmån för säljare och annonsörer. Till slut ska vinster pressas även ur dessa, medan våra flöden fylls av oönskad skit. Till slut dör plattformen, menar Doctorow.
Likt honom kan jag vilja bejaka detta, att köra skiten i botten. Och sedan börjar allt om? Här tror jag ändå att vi bör akta oss för drömmar om riskkapitalets eviga återkomst.

Här känner jag mig alltså lite ambivalent. Spontant gillar jag den lätt accelerationistiska tanken på att köra plattformen i botten för att något nytt ska uppstå. Men som Doctorow formulerar saken kan det bli lite väl mycket av “skapande förstörelse” (Schumpeter) i evig återkomst. Ingenting säger att den cykel han identifierar har samma förutsättningar att börja på nytt i dagens historiska situation, som den hade kring finanskrisen 2008 som ju i efterhand kan framstå som själva startskottet för den plattformsepok som nu åtminstone delvis krackelerar.

När vi diskuterar den politiska aspekten är det förresten viktigt att komma ihåg att de “säljare och annonsörer” som plattformarna premierar i sin andra fas (för att därefter suga ut) inte bara syftar på kommersiella företag. Även en aktivistgrupp eller kulturaktör som vill bjuda in folk till grejer är ju ur plattformens perspektiv en annonsör. Hur ska vi göra för att bygga alternativ till Facebooks eventfunktion? Där har vi en angelägen fråga att på något vis lösa kollektivt.

Vi gör nog bäst i att fortsätta vara både ambivalenta och pragmatiska. Men för den skull får vi inte förneka att våra egna (kollektiva) val av medieplattformar är politiska val.

Själv valde jag förresten just att sparka lite ny fart i den här bloggen. För den som vill följa den finns ett RSS-flöde om man varken följer mig på Twitter (som jag nu har slutat använda aktivt utöver att posta simpla länkuppdateringar) eller på Mastodon.
Jag är himla nöjd över att aldrig ha hoppat på Substacktåget och även över att inte ha någon statistik över hur många som besöker den här bloggen. För det känns nånstans viktigare om en person återvänder till ett inlägg flera år senare och får ut nåt av det, än om hundra samtidigt klickar på en länk som serverats dem i nåt flöde.
Tyvärr är Copyriots kommentarsfält fortsatt trasigt. Men är det något så nås jag via e-post, se högerspalten.