Fyra gånger om året utkommer kvalitetsblaskan The Economist med bilagan Technology Quarterly. Ofta finns där betydligt mer att hämta än i teknikområdets olika specialiserade veckotidningar och nyhetssajter, just eftersom fokus ligger på att urskilja större utvecklingslinjer, sammanföra relaterade fenomen under större begrepp och sålla ut det relevanta från sådant som stressade IT-journalister köpt rakt av från skickliga PR-avdelningar.
Kvartalets upplaga tar upp allt från “haptik” (elektronisk simulering av känselsinnet) och olika alternativ till LCD-skärmar, till återupptagna science fiction-skimrande experiment inom urban persontransport. Två ämnesområden kan sägas dominera: Å ena sidan energifrågor och klimatförändring, å andra sidan informationsteknologi relaterad till data mining. (Finns det förresten inget svenskt begrepp? Infogruvdrift torde vara korrekt men kan ändå snabbt avfärdas…)
“Myndigheters bruk av data mining behöver inte vara olycksbådande”, hävdar Economist artikel under den småprovokativa rubriken “Big Brother just wants to help”.
En gedigen text som tar upp en lång rad exempel från olika länder, men ändå lämnar fler frågor än den ger svar. Bland annat berättas om hur brittiska myndigheters bruk av klassificeringar och komplexa algoritmer som ett led i ansträngningarna att få in fler utan socialt priviligierad bakgrund på universiteten. (Oklart exakt hur.) Skattemyndigheter och försäkringsbolag världen över använder rutinmässigt data mining för att sålla ut fall att granska närmare och därigenom komma åt fler bedrägerier. Variablerna och kategoriseringarna som används är vanligen omöjliga för utomstående att ifrågasätta.
USA:s automatiserade system för att riskprofilera envar som vill in i landet ger ingen möjlighet för den som blivit stämplad som högrisk att få veta varför eller få saken prövad. Avslutningsvis släpper Economist in en kritiker:
Dr Paul Henman from the University of Queensland, who has written extensively on the subject, raises a rather more philosophical objection to government data-mining: that the technology starts to transform the nature of government itself, so that the population is seens as a collection of sub-populations with different risk profiles – based on factors such as education, health, ethnic origin, gender and so on – rather than a single social body. He worries that this undermines social cohesion. “A key principle in liberal democracies is that we are all peers and equal before the law”, he says.
Inte helt orelaterat kan Economist berätta att det råder verkliga sötebrödsdagar för de mjukvaruföretag som utvecklar program för namnmatchning – som en följd av den globala expansionen för olika former av spärrlistor, som inte bara hanteras av myndigheter utan också outsourcas till exempelvis flyg- och finansföretag.
Eftersom globala personnummer ju saknas, kan de som vill glida igenom sådana nät ibland utnyttja alfabetiska skillnader för att transkribera ett och samma namn på olika sätt. Som exempel tas en viss pakistansk terrorist som enligt FBI hade stavat sitt efternamn (ursprungligen på urdu) både Kansi, Kanci, Kasi, Qazi och Khan. Över 200 lika korrekta sätt att översätta namnet “Mohammed” till språk som använder det latinska alfabetet uppges finnas.
Intressantast i Technology Quarterly är artikeln om hur platsdata från mobilnät kan användas för realtidsövervakning av urbana människoflöden. En forskargrupp vid MIT arbetar med anonymiserad data från Telecom Italia och Mobilkom Austria, som omsätts i färgglatt pulserande diagram. Informationen om massornas mobilitet har flera tänkbara användningsområden. Stadsplanering är en (“it can provide solid statistical backing for politically unpopular planning decisions“, uppges det, en aning kryptiskt). Fastighetsmäklare kan hänvisa till antalet passerade när de prissätter affärslokaler; detsamma gäller offentlig reklam.
And tourism authorities might change their promotional campaigns abroad after noting which nationalities (identified by their home networks) spend most time in town and which prefer to lie on the beach.
Economist tar inte upp frågan om närmare specificering än den relativt okontroversiella variabeln om abbonemangets nationalitet. Däremot konstateras att försäljning av statistisk information om rörelsemönster kan bli en väldigt lukrativ affär för telekomföretagen framöver.
Kanske går det att föreställa sig en situation där mobiltelefoni – kanske också mobiltelefoner – blir helt gratis för dem som går med på att bli råvara för mer avancerad data mining – precis som Google gör e-post och hårddiskutrymme gratis, mot rätten att skörda de statistiska frukterna. Kanske blir det en vacker dag också Google som tar steget att börja erbjuda svåremotståndlig gratistelefoni, självklart mot att telefonen kopplas till ett Googlekonto, så att platsdatan kan samköras med ens onlinebeteenden. Kanske…
Economist spekulerar inte vidare i den riktningen, men täcker aktualiteter inom området “crowdsourcing” i en annan av bilagans korta artiklar.
Förra sommarens utgåva, som Copyriot reflekterade över här och här kröntes med en intervju med Vinton Cerf. Denna är det en annan av nätets supervisionärer som får sista ordet.
Tim Berners-Lee som i någon mening uppfann www luftar sin bekanta skepticism gentemot etiketten “Web 2.0” (han har påpekat att nätet ända från början ju byggde på deltagande), men går igång på det ofta oklara begreppet “semantic web“.
Och stakar ut nya forskningsriktningar:
Sir Tim last year helped to establish the Web Science Research Initiative (WSRI), a collaboration between MIT and the University of Southampton. “Web science looks at the web as a large system which depends on the laws of behaviour between people, like copyright law, as well as the protocols that govern how computers communicate with each other”, he says. Such laws and protocols are drawn up in the hope of producing a large-scale effect, such as creating the blogosphere or faciliating scientific publishing. The point of web science is “to understand how these large-scale effects depend on the underlying laws and protocols”.
Semantiska webben, ja. Det handlar i hög grad om standardiserad metadata, som gör det möjligt att i högre grad indexera “the deep web” (exempelvis sådant som går att söka efter i olika slags databaser, men inte användas systematiskt), och i förlängningen utforma helt nya typer av webbläsarmjukvara. Steg på vägen är simpla trebokstavskombinationer som XML, RDF och OWL.
When pressed for examples of applications of the semantic web that common mortals might appreciate, Sir Tim enthuses about “friend-of-a-friend” networks, where individuals in online communities provide data in the form of links between themselves and their colleagues and friends. The semantic web could help to visualise such complex networks and organise them to allow a deeper understanding of the community’s structure.
Två fullt begripliga invändningar ploppar upp. Ett: Varför? Två: Hjälp!
Å ena sidan kan man alltså ifrågasätta nyttan och nöjet i glassiga visualiseringar av kompiskretsar, å andra sidan förskräckt fråga sig vilken nytta som inte diverse Big Brother-aspiranter kan ha av motsvarande sociala kartor.
Kanske kan man säga att klassisk hackeretik innebär att de två invändningarna tar ut varandra.
Visst är det så att standardisering kan underlätta övervakning, men det är i så fall bra att sådant kan praktiseras av envar med tillräckliga kunskaper. Då möjliggörs både en kritisk diskussion och oförutsedda bieffekter. Alternativet, att inte engagera sig i utvecklandet av dessa potentialer, innebär nämligen bara att det överlåts till ett fåtal extremt resursstarka myndigheter och företag, vars tillgång till processorkraft i någon mån kan kompensera för bristen på gemensamma standards.
Finns det ett behov av att dra upp en linje, som markerar gränsen mot självövervakning och självexploatering? Flera av de utvecklingar som tas upp i Economist Technology Quarterly sammanfattar bådar för att frågor av det slaget kommer att göra sig gällande allt mera.

12 kommentarer ↓
Clay Shirkys diss av semantiska webben och metadata står sig fortfarande rätt bra:
http://www.shirky.com/writings/semantic_syllogism.html
“…data mining. (Finns det förresten inget svenskt begrepp? Infogruvdrift torde vara korrekt men kan ändå snabbt avfärdas…)”
“Informationsvaskning” ?
Bara ett spontant förslag. :)
Nytta med semantiska webben?
Ja jag skulle personligen bli glad om jag kunde be webben att leta rätt på ett par hyfsat billiga grönaktiga shorts som passar mig och är ganska tunna men inte sådär prassliga, sans hundratals små snören och dragkedjor som sticker ut. Jag hoppas att de finns men mina små IRL-undersökningar de senaste senvår+somrarna har varit fruktlösa, webben kanske har dom?
Jag har själv implementerat logiskt reducerande över begrepp definierade med OWL så jag har en aning om dimensioner och omfattning på de bakomliggande ontologierna som behövs för att ens närma sig en vettig maskinell hantering av ovanstående spörsmål. Jag kan även misstänka att medföljande krav på beräkningskapacitet inte är oansenliga.
Pratar man om en sådan semantisk webb som inte är runt knuten i form av webb 2.1 eller ens webb 3.0 är det klart att en sån som Shirky kan raljera (med befog) över dagens envangelister och teknikoptimister.
Jag hoppar dock över slika praktiska invändningar och måste säga att detta inlägg väckte en del intressanta tankar kring hur big brother-övervakningen skulle fungera givet allestädes närvarande maskinellt tolkbar semantik. Inte så att jag har något vettigt att säga just nu men ändå…
Annat förslag till översättning av “data mining”: informationsförädling
Kort och koncist, eller hur? :-)
Samkörning av dataregister är en gammal fras som dyker upp i mitt huvud.
Informationsutvinning har jag hört användas.
Johan: Clay Shirkys text var bra! Fast den kan väl knappast kallas för en “diss av metadata” (vilket, i mina öron, låter nästan lika absurt som “en diss av språket” el.dyl.), snarare en diss av dels hajpen kring semantiska webben, dels av naiva idéer om centralplanerade universalontologier. Där håller jag helt med honom.
DATABRYTNING är ett ord som används för data mining också, här t.ex.: http://www.hakank.org/webblogg/archives/001191.html
Enligt Svenska datatermgruppen är “datautvinning” lämplig översättning av data mining.
Kanske borde man fråga det något officiellare Språkrådet också?
[...] över ett område, vilka bildar ett trådlöst nätverk och registrerar minsta vibration. Platsdata av alla de slag kan inhämtas på tidigare oanade sätt. One of the most important consequences of [...]
[...] Post a Comment Name: *Required Email: *Required (Never published) Website: Message: Möjligtvis liknande inlägg:: Om värdet av mobilnätens positionsdata, med mera [...]
[...] också vara avancerade algoritmer som väger in allt från språkliga figurer till mobiltelefoners position och [...]
Kommentera