den 26 mars anordnades det ett seminarium om offentliga data som plattform för innovation på Stockholms Handelskammare (talade gjorde bland andra Mats Odell och Joakim Jardenberg, kika här). Jag hade det stora nöjet att bli framröstad av de 295 inbjudna gästerna för att hålla en femminuterspresentation och ikläda mig rollen som djävulens advokat. Eftersom fem minuter är lämnar försvinnande lite utrymme över för argumentation har jag sammanfattat mina argument utifrån de fem frågor jag utgick från i presentationen här. Kommentarer mottages tacksamt och ger god karma!
Jag är i grunden väldigt positiv till att ge öppen tillgång till offentliga datamängder, och detta bör inte läsas som argument mot öppen information. Däremot är de frågor som rör själva tillgängliggörandet fortfarande förvånansvärt perifera, vilket oroar. Symptomatiskt för debatten är att lyfta fram goda exempel från andra länder (exempelvis en iPhone-applikation för cyklister i London) och hävda att vi bör göra det här för det kan bara gå bra. Problemet är att den här typen av reform är att den saknar konkretion. Argumenten bygger på övertygelse eller princip. Övertygelse om att innovation kommer att frodas om offentliga data bara blir tillgängliga för alla och envar, eller principer som grundar sig i att tillgång till skattefinansierade datamängder är en demokratisk rättighet. Vad som saknas är de faktiska policyfrågorna. Hur går vi från luftslott till realisering? Låt oss titta närmare på fem grundläggande frågor som jag tror att vi behöver kunna svara på.
1. Öppen information från vem?
Inledningsvis är detta en enkel fråga, informationen kommer från det offentliga förstås. Från allt skattefinansierat, möjligtvis med reservation för allt för personliga data som utgör ett hot mot medborgarnas personliga integritet.
Men riktigt så enkelt är det inte.Till att börja med handlar det om att veta vem som kan tillhandahålla datamängder, något som Mats Odell belyste i sitt anförande på seminariet men som är långt ifrån löst. Det behövs en gemensam plattform där man kan samla offentliga datamängder så att vem som helst enkelt kan få en översikt av vad som ät tillgängligt och i vilken form. Det kan låta som en enkel åtgärd – vi behöver en hemsida – men betänk då att alla myndigheter ska kunna interagera med denna plattform för att tillgängliggöra data och vem som helst ska enkelt kunna överblicka den tillgängliga informationen.
Vidare är detta en kompetensfråga. Kan vi garantera att man på alla berörda myndigheter har kompetensen att identifiera och kategorisera sin egen information? Om man skulle ringa till en myndighet och be dem berätta vilka data de har tillgång till, vad skulle man då få för svar? Det kommer att krävas kompetens inom varje myndighet för att lista, sammanställa och presentera den information man har tillgänglig. Med största sannolikhet betyder det i sin tur att många myndigheter kommer behöva nyanställa för att täcka kompetensbehovet. Detta kan läsas som en expansion av myndigheterna, eller som början på en transformation. Varje myndighet bör i ljuset av en sådan här reform fråga sig vad deras grundläggande syfte är och vilket kompetensbehov de har för att uppfylla detta syfte. Lägg till detta diffusa förhållningsorder om att “säkra och värna kvaliteten på de data som offentliggörs” och det blir uppenbart att vi har en bit kvar till att förverkliga detta.
För att möjliggöra och främja en kultur av tillgängliggörande av offentliga datamängder inom myndigheter måste vi slutligen fundera kring hur vi formulerar förfrågningen. Låt oss jämföra Sverige med USA, som ofta pekas ut som ett föredöme vad gäller offentliga data:
- I Sverige pratar vi om att alla myndigheter ska inkomma med en lista på “alla sina data”.
- I USA gav Obama varje myndighet i uppgift att producera ett visst antal relevanta datamängder att bidra med till projektet att offentliggöra data.
Den svenska ansatsen saknar ett tydligt mål, vad är egentligen ett önskvärt resultat från respektive myndighet? Vidare är förfrågningen formulerad på ett sätt som antyder att verksamheten ska genomlysas i sitt befintliga skick i jakten på relevanta data. Den amerikanska frågan skiljer sig avsevärt från den svenska. Obamas förfrågan till berörda myndigheter implicerar en förändring. Presidenten ber varje myndighet att utifrån sin befintliga verksamhet producera ett visst antal relevanta datamängder, och därefter ytterligare några till. Förfrågan har ett konkret mål, och den grundar sig i att myndigheterna ska införliva tillgängliggörandet av data i sin verksamhet snarare än applicera det utifrån så som den svenska förfrågan antyder. Djävulen finns i detaljerna.
2. Öppen information till vem?
När det talas om att öppna dataarkiven så finns det alltid en tilltänkt målgrupp: entreprenörerna, de som ska skapa innovation av alltihopa.
Vad ingen tycks ha frågat sig är hur vi försäkrar oss om att tillräckligt många entreprenörer engagerar sig i att slå mynt av alla dessa data. Det räcker inte att lita på någon abstrakt förståelse av “marknaden” i bestämd form här. Marknaden skapas utifrån de ramverk som sätts upp för tillgängliggörandet av information och de incitament som finns för att ta tillvara på informationen, och denna process ägnas i bästa fall bristfällig uppmärksamhet. Hur garanteras exempelvis mångfald på marknaden? När Adam Smith talar om arbetsdelning och Friedrich Hayek talar om fria marknader så gör de det utifrån antagandet att ramverket inom vilket marknaden existerar spelar roll.
Frågan om vem den öppna informationen riktar sig till väcker också frågan om ansvar. Vem har ansvar för informationen, både för dess innehåll och för att den kommer medborgarna till del? Förskjuter staten ansvaret gentemot medborgarna till entreprenörerna? Eller ska staten styra den innovation som sker med offentliga data som plattform för att uppfylla demokratiska bivillkor? Joakim Jardenberg belyste under sin presentation hur offentliga datamängder behöver fylla en roll som demokratisk plattform i takt med att traditionella medier inte längre kan bära detta ansvar. Men vem är det som till syvende og sidst ska ansvara för informationen och med den kanske även granskningen av samhället och makten? Problemet med att tillgängliggöra offentliga data belyses redan 97 i boken Borders in Cyberspace, och redan då problematiseras behovet av en balans mellan det offentliga, det privata och det ideella. Detta problem, och denna balans är inte mindre komplex idag, den är däremot mer relevant än någonsin.
3. Öppen information för vem?
Det är uppenbart att tillgängliggörandet av offentliga data ritar sig till entreprenörer, men lika tydligt är det att de bara är en mellanhand. Den öppna informationen är när allt kommer omkring till för medborgarna. Det har sagts många gånger och på olika vis, nu senast på seminariet i fredags: Det är vår information, staten får bara låna den. Långt tidigare än så konstaterade Thomas Jefferson att “information is the currency of democracy”. Men hur står det till med relationen mellan medborgare och information egentligen?
Till att börja med skulle de flesta medborgare inte vilja eller orka skaffa sig de nödvändiga kunskaperna för att ta till sig de stora datamängder som offentliga data omfattar. Redan här gör sig genomsnittsmedborgaren beroende av någon form av mellanhand. Utöver att många inte har har direkt tillgång till informationen innebär detta även att de som har kunskapen och förståelsen för att ta till sig och behandla stora datamängder får ett mycket konkret informationsövertag gentemot dem som saknar den möjligheten (detta ska förstås ställas mot dagens situation då alla saknar information, vilket naturligtvis inte heller är hållbart).
I den mån vi uppnår en tillräcklig mångfald som tar tillvara på och tillgängliggör information för en bredare allmänhet kan vi glömma allt vad objektivitet heter. Vi har länge levt under en tillräckligt riktig föreställning om att information kan presenteras objektivt för oss, bland annat har detta varit ett viktigt och återkommande argument från journalistkåren. Den föreställningen är inte längre tillräckligt riktig, sprickorna blir för stora och det som inte täcks in av den för viktigt för att ignorera.
Enbart om antalet mellanhänder som behandlar informationen går mot oändligheten och varje medborgare tar sig tid att ta till sig informationen från alla dem som erbjuder sin tolkning av den kan vi ens i teorin prata om objektivitet. Sanningen är att incitamenten är som störst för olika särintressen och politiskt engagerade grupper att få tillgång till och presentera offentliga data fritt tillgänglig för medborgarna (nu bortser jag från eventuella cyklistapplikationer). Det betyder att vi kommer att bli allt mer subjektiva i vårt urval baserat på en allt större mängd tillgänglig information. Detta är egentligen ingen ny trend (många läser bloggar just för att läsa vad en viss person tycker och tänker snarare än för att få objektiv information) men den kommer att få en bredare spridning och en större relevans för grundläggande demokratiska värden och för samhällsdebatten.
Nu landar vi oundvikligen åter i ansvarsfrågan: Vilket ansvar har staten för att individen ska kunna tillgodogöra sig offentliga data? Vad betyder det om en majoritet vänder sig till kommunikationsplattformar och verktyg som är kommersiella och kostar pengar? Traditionellt har mediebolag som producerar tidningar och TV-sändningar också tagit betalt, men gäller det även om information och i ännu högre grad förmågan att gallra och behandla information nu i allt större utsträckning blir vitalt för grundläggande demokratiska värden? Vad betyder öppna data för public service, eller snarare: vilken är public service roll i tillgängliggörandet av offentliga data?
Detta är också en fråga om utbildning och utbildningsväsendets grundläggande syfte i en liberal demokrati. Friedrich Hayek menar att en grundskola är en nödvändig del av den gemensamma staten, eftersom varje individ måste ges möjlighet att förstå sina egna och andras fri- och rättigheter. Om vi utgår från detta mycket grundläggande syfte – eller för all del söker syftet med dagens utbildningssystem – hur bör då utbildningsväsendet anpassa sig för att uppfylla sitt syfte i ett samhälle som går från information som bristvara till informationsöverflöd? Denna fråga sträcker sig bortom tillgängliggörandet av offentliga data, men den är allt annat än orelaterad.
4. Öppen information om vem?
Tillgängliggörandet av offentliga data väcker förr eller senare frågan om informationens faktiskt innehåll. Det råder någon sorts luftigt konsensus om att man naturligtvis inte ska släppa på personrelaterade data, åtminstone inte utan att anonymisera dem. Men är det så enkelt?
Så fort man börjar tala om innehållet i informationsmängder har man en helt ny utmaning. Det räcker inte att sortera bort data som innehåller namn och/eller personnummer. Här kan vi lära oss en läxa från George Bush. George W Bush var inte det öppna samhällets bästa kompis, långt därifrån. Inte nog med att han bromsade upp avklassificeringen av offentliga data, han lyckades till och med hemligstämpla information som avklassificerats under Clintons mandatperiod. Men riktigt anmärkningsvärt blev det när han hemligstämplade aggregat av ickekonfidentiella data. Bush var en av de första beslutsfattarna att ställas inför det faktum att det gömmer sig information i informationen. När olika datamängder ställs mot varandra kan de säga mer än vad de ursprungligen gjorde var och en för sig (mer om detta i Sandra Baramans Change of State).
Ytterligare ett exempel på hur lite vi vet om vilken information vi kan få ut ur datamängder hittar vi hos filmuthyrningsföretaget Netflix. Netflix släppte enorma mängder anonymiserade data till allmänheten och anordnade en tävling för att förbättra sitt eget rekommendationssystem. Vad de inte hade räknat med var att deras egna datamängder kunde användas tillsammans med andra datamängder. Detta resulterade i att en i hemlighet lesbisk mor stämde Netflix för att ha exponerat hennes sexuella läggning (eller möjliggjort att två innovativa studenter från Texas universitet kunde göra det). Det är alltså inte så enkelt att avgöra vad man kan eller inte kan få ut av en datamängd, och det beror inte bara på datamängden själv utan även vilka andra informationskällor den ställs mot.
Detta är till syvende of sidst en fråga om vad som är offentligt och personligt, eller snarare publikt och privat. Vi kan inte tala om klumpiga begrepp som personlig integritet och datakvalitet längre, vi måste gå till botten med hur vi skiljer på vad som är privat – information som jag som individ ska ha fullständig kontroll över – och vad som är publikt – information som andra kan sammanställa om mig.
5. Öppen information till vad?
Till sist måste vi fråga oss vad det långsiktiga syftet med tillgängliggörandet av offentliga data är. Bortom tillväxt, häftiga applikationer till mobiltelefonen och granskning av makten finns en djupare samhällsförändrande effekt här. Det handlar inte om att mata ut information till medborgarna som man genom åren gjort via pressmeddelanden och utredningsrapporter längre.
Det stora misstaget i att studera positiva effekter från andra länder som tillgängliggjort offentliga datamängder ligger inte i jämförelsen i sig utan i tidsglappet. Det är lätt att använda effekterna av en reform i ett annat land för att motivera samma reform på hemmaplan, och det är en vedertagen metod för att bygga evidensbaserad policy. Problemet är att effekterna varken var explicit önskade eller ens formulerade när reformen genomfördes. Den här typen av öppenhetsreform kräver att vi förlikar oss med att inte ha kontroll på effekterna, och där är vi inte än.
Till att börja med handlar det om vad data används till. När särintressen använder datamängder för att i största möjliga mån förespråka sin egen sak, vilket ansvar har då staten för att försvara eller ta ansvar från innehållet i sina egna datamängder? Det talas om att säkerställa “kvaliteten” på datamängder, och detta tycks implicera att inga datamängder ska kunna missbrukas eller leda till missförstånd. Den här typen av kvalitetsformuleringsmonopol kommer att glida staten ur händerna helt i ett samhälle med större mängder öppen information. Det objektiva blir klumpigt och osant och det subjektiva tillåter ingen universaldefinition av datakvalitet.
Vidare handlar det om vad ett brett tillgängliggörande av offentlig information och ett marginaliserande av statens informationsövertag leder till på lång sikt. Naturligtvis kommer staten – åtminstone tills vidare – att ha ett informationsövertag i form av hemligstämplade och säkerhetspolitiska data. Utöver detta kommer dock statens roll att i allt högre grad kunna ifrågasättas, och bilden av såväl stat som individ (medborgare) kommer att kompliceras. Ju mer vi vet om varandra, desto mer kommer enkla stereotyper och föreställningar om hur tillvaron ska se ut att bli för grovkorniga. Kanske är vi på väg mot David Brins Transparent Society, kanske inte. En sak är säker, för att få ut mesta möjliga av framtiden räcker det inte att vilja dit, vi måste vilja förstå också.