Usosial fordeling av data

Artikkel – Anders W. Letnes

Kunstig intelligens, GDPR og usosial fordeling av data. Må vi velge mellom personvern eller teknologiske fremskritt? Eller kan de forenes?

For noen uker siden slapp Verdibørsen på NRK en podkastserie om kunstig intelligens på Spotify. Med seg i studio hadde de Dag Hareide, sosiolog og idéhistoriker, og Einar Duenger Bøhn, filosof og ekspert på kunstig intelligens ved Universitetet i Agder. Blant annet snakket de om den ujevne fordelingene av data vi ser i dag. Kunstig intelligens blir nemlig til gjennom maskinlæring, hvor systemene blir matet med store mengder data. Et fåtall selskaper samler inn og sitter på disse dataene. Med andre ord er disse usosialt fordelt.

– Det er en håndfull som sitter på datamengdene som du trenger for å trene opp gode intelligente systemer, ifølge Bøhn.

De fleste av disse befinner seg i Silicon Valley: Google, Apple, Facebook, Amazon og Microsoft. Hakk i hæl kommer kinesiske Alibaba og Tencent. Kun disse selskapene kan samle inn nok data, enten det er via sosiale medier eller andre tjenester. En grunn til dette er størrelsen: alle er blant de 10 mest verdifulle selskapene i verden. En annen grunn er hva de driver med: alle er teknologiselskaper. En av årsakene til at de er blitt så store er nettopp mengden data de besitter. Dataene gjør det mulig å skreddersy tjenester for brukerne på en helt ny måte. Kunnskapen om brukerne fører også med seg inntekter, som med Facebook og reklame.

I tillegg brukes altså dataene til å utvikle kunstig intelligens. Hvorfor er dette viktig? Jo, fordi kunstig intelligens i stor grad kommer til å endre samfunnet vi lever i. Kunstig intelligens vil kunne brukes til å ta avgjørelser, gi medisinske diagnoser eller kjøre biler. Allerede ser vi hvordan algoritmer styrer mye av driften i Google og Facebook, som hva slags innhold du får se.

Usosial maktfordeling

Få selskaper sitter altså på mye data. Fordelingen kan kalles usosial, ujevn og udemokratisk. Både fordi det er få istedenfor mange, og fordi det kan skape skjeve maktfordelinger i samfunnet.

– Nå tror jeg Telsa vet mer om Bærum enn kommunen der, sier Hareide.

Han kaller dem for ”kjørende spioner”.

– Data er den nye oljen vi skal leve av, følger Bøhn opp med.

Hvis private selskaper eier alle trafikkdataene, så må staten hente ut disse når de skal ta viktige politiske avgjørelser, f. eks. i forbindelse med trafikkmønstre. Altså må de kjøpe ut dataene de trenger om sin egen kommune. Bøhn mener at slike data bør nasjonaliseres, slik som oljen ble i sin tid, men som ikke laksen ble.

Dataene Bøhn snakker om er såkalte nasjonsdata. I en kronikk på Kommunikasjonsforeningens sider, forklarer han at dette er ”helsedata, utdanningsdata, trafikkdata, vær- og kraftdata, data fra NAV, data om borgernes økonomi, mange typer historiske data, samt annen data som er eller kan bli av nasjonal interesse.” Han vil ikke nasjonalisere persondata eller næringsdata (ansettelsesforhold, handlevaner).

Kan man stoppe utviklingen?

Altså fører den usosiale fordelingen av data til skjeve maktforhold mellom det offentlige og private.

- Hvis ikke en kritisk mengde av samfunnsinteresserte mennesker deltar i denne debatten, så vil selve demokratiet svikte i sin forståelse, advarer Hareide.

Som eksempel bruker han det amerikanske valget 2016. Hareide mener det viser at politikere må kjøpe tjenester av Facebook og Google for å vinne. Eksempelvis ble en reklame kjørt på Facebook med bilder av Facebook-vennene dine, med teksten ”disse har stemt”. Målinger viser at dette fikk 340 000 flere til å stemme. Hareide minner oss om at Trump vant med 100 000 stemmer.

På en eller annen måte må de (store teknologiselskapene, red.anm.) settes på plass, sier Hareide. Bøhn er enig, og mener man må bryte opp monopolene. Dette vil skape sunn konkurranse, noe han mener er bedre enn å gå tilbake i tid, slutte å samle inn data eller å ”avdigitalisere” oss. Resten av verden kommer nemlig ikke til å stoppe.

- GDPR kan være et skritt i riktig retning, sier Bøhn, men legger til ”litt sånn motstrømsretning”.

Han er ikke utelukkende positiv til personvernforordningen som trådde i kraft i fjor. EU har mye strengere personvern enn USA og Kina. GDPR blir sett på som en seier for individet, demokratiet og friheten generelt, noe det også er. Spesielt i Kina mangler det personvern, og vestlige medier er raske med å fordømme kinesisk overvåking og innsamling av data. Samtidig har personvern-medaljen en bakside. Europa er nemlig ikke i stand til å utvikle konkurrerende intelligente systemer, fordi vi ikke samler inn nok data til å utvikle dem.

Dermed faller vi av det globale spillet, ifølge Bøhn. Han peker på at Europa i fremtiden kanskje må kjøpe kunstig intelligens eller data fra Kina.

– Hvor mye skal vi holde igjen? Hvis du legger føringer på noe i Norge, så kan ikke vi laste ned digital teknologi fra utlandet, hevder han.

En grunn til at han sier dette kan være fordi noe sånt ville vært hyklersk. Skal vi kjøpe teknologi som er bygget på manglende personvern, mens vi selv opphøyer personvernet?

Data og innovasjon

Verken denne artikkelen eller Bøhn i Verdibørsen, argumenterer for at personvern er dårlig. Eller at personvernet burde ofres på den teknologiske utviklingens alter. Derimot kan det finnes andre løsninger for innsamling og personvern. Bøhn mener nemlig at vi heller først bør samle inn data ”uhemmet”, og deretter nasjonalisere og anonymisere dataene, eksempelvis med kryptoteknologi. Dette kan være nok til å utvikle ny teknologi.

– Så det er måter å samle inn data på som bevarer det personvernet som Kina ikke bryr seg så mye om, sier han.

I en kronikk på digi.no har Nina Chung Mathisen, ved Den norske dataforening, diskutert GDPR og innovasjon. For ifølge Mathisen var visjonen å fremme innovasjon. GDPR skulle ”styrke den europeiske dataøkonomien. Det handlet om å promotere fri flyt av data også over landegrenser.” Hun skriver at dataportabilitet, muligheten for å flytte personopplysninger mellom selskaper, er en viktig del av GDPR. Det står om dette i lovverket, men finnes ikke noen god infrastruktur for det enda. Mathisen skriver at ”uten en fungerende dataportabilitet som eksisterer utenfor forslag til lovgivning vil vi ikke se innovasjon.”

Hadde man derimot hatt et slikt system kunne man ”kombinere data på helt nye måter og skapt et datagrunnlag for IoT som andre verdensdeler bare kunne drømt om. Imidlertid ble en rekke personvernsskandaler utslagsgivende for at fokuset falt nærmest utelukkende på personvern.” IoT (”Internet of Things”) handler om hvordan ting kan ”snakke” med hverandre via nettet. Dette kan være alt fra elektronikk du har i hjemmet til kjøretøy.

Mathisen trekker frem at flere selskaper forsøker seg på dataportabilitet, blant annet Solid-prosjektet til Tim Berners-Lee, mannen som skapte World Wide Web. Solid ønsker å gi personer eierrett på sine data. Man kan lagre alt på et sted, heller en ulike servere i Silicon Valley. Får å få til dette vil de skille data og apper fra hverandre. Altså beholder man dataene man produserer når man bruker en app. Man kan flytte disse, samt velge hva slags data man vil gjøre tilgjengelig, og hvem man gjør det tilgjengelig for. Ifølge Solid vil dette gjøre det enkelt for utviklere, som ikke lenger trenger å samle data, men kan utnytte seg av data som allerede eksisterer.

Kanskje er det en slik løsning Mathisen ser for seg. På personvernfronten ser GDPR ut til å fungere. Datatilsynet hadde i fjor et rekordår, skrev E24.no tirsdag. Antall avviksmeldinger steg fra 349 i 2017 til 1276 i 2018.

– Det er en stor bevissthet rundt innholdet i regelverket. Virksomheter tar mer ansvar, og enkeltpersoner er mer bevisste, sier Dahl i Datatilsynet til E24.no.

Dessuten har det franske datatilsynet gitt Google en bot på 50 millioner euro.

Så samtidig som GDPR gjør det vanskeligere å utvikle kunstig intelligens i Europa, så hemmer det også utenlandsk innsamling av data. Slikt kan gjøre de store selskapene mindre mektige, og til en viss grad påvirke den usosiale fordelingen av data. Sånn sett verner GDPR både om rettigheter, og blir et slags vern mot monopolene. Både lovgivning på monopolfronten, og innovasjon innen enten anonymisering av data eller dataportabilitet, vil ha mye å si fremover. Samtidig kan amerikanske og kinesiske selskaper allerede være så langt foran at det blir vanskelig å utjevne den usosiale fordelingen av data.

Usosiale medierAnders W. Letnes22. februar 2019kunstig intelligens, GDPR, data, personvern, AI, Einar Duenger Bøhn, Dag Hareide, Facebook, Google, USA, Kina, EUKommentar