Navigatiemenu

Big Data

Laatst bijgewerkt op 692 dagen geleden door Hadewych Reacties (6)

De WRR presenteerde zijn rapport over Big Data (het verschijnsel dat er grote hoeveelheden data worden gegenereerd die geanalyseerd worden om patronen te herkennen en kans- of risicoprofielen te maken zodat er selectief beleid kan worden gevoerd, doorgaans gekarakteriseerd met volume, variety, velocity, veracity en value) en de bestrijding van criminaliteit (m.n. terrorisme en fraude).

De vrijheidsrechten van burgers (privacy, vrijheid van meningsuiting, non-discriminatie, onschuldpresumptie e.d.) worden in het bestaande recht beschermd door beperkingen te stellen aan informatieverzameling: het minimalisatieprincipe en het doelbindingsprincipe zijn de belangrijkste instrumenten. Door technologische ontwikkelingen wordt het steeds onhoudbaarder om dataverzameling te beperken. De WRR stelt daarom voor de bescherming te verschuiven naar beter toezicht op dataverwerking en dus ook grotere transparantie, betere verantwoording en meer effectevaluatie over de processen van dataverwerking, de herkomst en validering van gebruikte algoritmen en de resultaten van datagestuurde keuzen.

Dat toezicht zou gebaseerd moeten zijn op een wettelijk omschreven zorgplicht, met algemene vereisten voor de kwaliteit van de data en van de deugdelijkheid van de gehanteerde analysemethoden.

Ook zouden grote dataverwerkingsprojecten binnen de overheid (onder meer door inspecties) een horizon van drie tot vijf jaar moeten krijgen.

Vanuit de zaal wordt gesuggereerd om ‘normware’ te ontwikkelen om zo ook de rechtsstatelijke kaders automatisch te beschermen. Een andere oproep is om burgers/ondertoezichtstaanden/betrokkenen al bij de dataverzameling, ontwikkeling van algoritmen en inrichting van analyse- en toepassingsprocessen te betrekken. In aansluiting daarop vragen verschillende aanwezigen om openheid en transparantie als default: hou alleen geheim wat in het belang van de opsporing of privacy echt geheim moet blijven.

Om de kansen van Big Data te kunnen benutten en tegelijk burgerrechten te blijven respecteren is er een enorme slag nodig in opleiding en training van personeel. Het gaat niet alleen om ict-ers, analisten en dergelijke maar ook om personeel dat uitkomsten van data-analyses gebruikt.

__________

In een presentatie n.a.v. een ICTU-jubileum zette Dennis Broeders het fenomeen Big Data neer (zie ook het WRR-rapport): er is geen definitie of beschrijving, maar met de term Big Data refereer je tegelijk aan ontwikkelingen in data (de drie v’s: de hoeveelheid, verwerkingssnelheid en variëteit zijn gigantisch toegenomen); in analysemethode (veelal gericht op de toekomst, kansberekeningen); en in toepassingen (het gaat om actionable knowledge).

Van groot belang is dat analyses niet gericht zijn op causaliteit maar op correlaties.

Er worden dus nauwelijks hypothesen getoetst, en theorieën worden gemaakt nadat een correlatie is gevonden. Daarmee worden uiteraard wel biases en waarnemingsversmalling in de analyse ingebouwd.

Big Data is een fenomeen uit de commerciële wereld, waar de foutentolerantie vele malen groter is dan in de staat. Als er tien procent méér van een bepaald product wordt gekocht dankzij gerichte marketing, dan maakt het niet uit dat enige tienduizenden klanten niet gereageerd hebben op een advertentie omdat die toch niet echt passend was. Als de overheid werkt met foutmarges van tientallen procenten hebben we wel een probleem.

Bij de overheid gaat het er niet om mensen te bewegen meer te consumeren, maar om dienstverlening (wie is rechthebbend, wie heeft ergens behoefte aan), om toezicht en handhaving (wie leeft de regels na, wie gedraagt zich conform de norm) en om beheersing (waar zitten risico’s, wanneer moeten dwang of geweld worden toegepast).

De transparantieparadox die zich voordoet is dat de samenleving voor de overheid steeds kenbaarder wordt, dankzij sensing (IoT), digitalisering en analyse, terwijl het voor burgers steeds onmogelijker wordt om te begrijpen of zelfs maar te zien wat de overheid weet en hoe beslissingen tot stand komen. Data worden ongemerkt verzameld, ongezien gedeeld, en onnavolgbaar geanalyseerd en naarmate er meer deep learning/AI wordt toegepast wordt democratische controle steeds moeilijker. Dat wordt versterkt naarmate menselijke beslissers (ambtenaren) minder ruimte hebben om af te wijken van een oordeel dat door een algoritme is gegenereerd. Het risico op discriminatie en op onrechtmatige besluiten neemt toe, en de mogelijkheden van burgers om zich daartegen te weren nemen af.

Als afschrikwekkend voorbeeld wordt het Chinese sociale creditsysteem aangehaald. Consumenten krijgen een aantal kredietpunten (een gemiddelde brave, kredietwaardige klant heeft er bijvoorbeeld vijfhonderd) en aan de hand van zijn betalings- en politieke gedrag, of dat van zijn vrienden, verliest of verdient hij kredietpunten. Het aantal punten dat een burger heeft bepaalt vervolgens zijn (politieke en burger-)rechten en bonussen, zoals een reispermit. De ACLU waarschuwde in de VS dat een dergelijk systeem weliswaar in democratische rechtsstaten niet wordt toegepast, maar dat de volledige infrastructuur er wel voor klaar ligt.

Om de nadelen en risico’s van Big Data te mitigeren zou een aantal uitgangspunten gerespecteerd moeten worden:

  • Geef openheid over alle stappen van datagebruik (opslag, voorbereiding, analyse, interpretatie, toepassing). Dat betekent dat er veel meer interne stukken openbaar moeten worden gemaakt: open overheid.
  • Geen (semi-)automatische besluitvorming, altijd menselijke bemoeienis en motivering
  • Organiseer externe vormen van toezicht
  • Bied ruime klacht- en correctiemogelijkheden aan degenen op wie data betrekking hebben
  • Weiger dataverwerkings- of analysepakketten zonder zeggenschap over openbaarheid e.d.
  • Betrek ondertoezichtstaanden en burgers, hun belangen en wensen, bij het inrichten van dataverwerkings- en analysesystemen. Richt systemen niet alleen maar in met het oog op efficiency.

Hier het officiële verslag inclusief een video-opname van de presentatie van Dennis Broeders.

Reacties

Volgorde van reacties: Aantal: Automatisch laden:
    • Hadewych
      Hadewych 692 dagen geleden

      Datagebruik vraagt om databeleid. Om databeleid vast te stellen, moet een organisatie volgens Vis en Van der Meer kijken naar een vijftal technische data-aspecten en een viertal organisatorische aspecten. Aan de datakant moet men bijvoorbeeld bepalen welke data er eigenlijk waardevol zijn omdat ze bijdragen aan het realiseren van de doelstellingen (data assets). Vis ziet een ander data-aspect als ‘quick win’. “Wat je moet doen is wel afhankelijk van de ambitie en de doelstellingen, maar je zou allereerst eens kunnen kijken naar de levenscyclus van de data waarover je beschikt. Is het nou nodig om die eeuwig te bewaren? Moet er niet periodiek worden gekeken naar de kwaliteit; is er onderhoud nodig? Ruim op wat je niet nodig hebt, want het vraagt aandacht en het heeft risico’s in zich als je met slecht onderhouden data aan de slag gaat.”

      • Hadewych
        Hadewych 692 dagen geleden

        Zie ook dit artikel over de Chief Technology Officer van Amsterdam.

        • Hadewych
          Hadewych 692 dagen geleden

          Dennis Broeders: ‘Dat enorme techno-optimisme, waarbij voor ieder probleem een database moet worden opgericht en informatie moet worden uitgewisseld, is nog steeds alive and kicking. Ict zit bij de meeste politici gewoon nog in de instrumentendoos. We hebben pennen, potloden, paperclips én ict.’

          Juist in Big Data-sets zitten bijvoorbeeld veel vuile en incomplete data - ‘ruis’. Daar kun je voor compenseren als je iets wilt zeggen over groepen mensen, maar die conclusies zijn niet zomaar door te trekken naar individuen.

          Er kan veel goeds uit Big Data-analyses komen, mits je rekening houdt met de beperkingen. Een terrorist opsporen met datamining? Nee dus. ‘Er zijn te weinig data om een betrouwbaar profiel te maken, een terrorist is een té grote uitzondering. Maar die kennis hindert een hele hoop mensen niet.’

          Hier artikel in De Correspondent.

          • Hadewych
            Hadewych 692 dagen geleden

            Artikel over toezicht op basis van risicoprofielen die met big data zijn gegenereerd.

            Zie ook de checklist voor verantwoord gebruik van big data van het Rathenau instituut.

            Zie ook dit artikel uit De Correspondent over online A/B-tests waarmee de effectiviteit van gedragsinterventies kan worden getest.

            Zie ook de PBL-lecture van Kitchin over smart cities.

          Reageren is alleen mogelijk voor aangemelde gebruikers