• Nem Talált Eredményt

Anonim módon adott meg adatokat? Akkor is azonosítható! megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Anonim módon adott meg adatokat? Akkor is azonosítható! megtekintése"

Copied!
2
0
0

Teljes szövegt

(1)

470

Anonim módon adott meg

adatokat? Akkor is azonosítható!

Azt hitte, hogy ha anonimizálják az adatait, máris biztonságban van? Egy kutatócsapat bebizonyítot- ta: ennél nagyobbat nem is tévedhetett volna.

Hiába anonimizálják az orvosi vagy népszámlálási adatokat, az egyéb jellemzők alapján közel száz- százalékos pontossággal visszaállítható, hogy melyik adat név szerint kihez tartozik. Ez igencsak feladja a leckét a GDPR-felelősöknek.

Az európai általános adatvédelmi rendelet előírja, hogy az anonimizálást úgy kell elvégezni, hogy a tárolt adatok alapján a kapcsolat ne legyen többé helyreállítható egy természetes személy és a rá vonatkozó adat között. Már a rendelet hatályba lépésekor is sokan felhívták arra a figyelmet, hogy ezt nem is olyan egyszerű biztosítani. És mint ki- derült, bizonyos esetekben ez szinte lehetetlen is az adatkészlet használhatatlanná tétele nélkül.

Az anonimizált adatokra a GDPR sem vonatkozik

A The New York Times számol be egy kutatásról, amely bizonyította: az Amerikai Népszámlálási Hivatal (U.S. Census Bureau) egyébként anonimizált adataiból simán vissza lehet állítani, hogy melyik amerikai polgár mit nyilatkozott a nép- számlálást végző kérdezőbiztosoknál. A Nature Communicationsben publikált módszer, amit a londoni Imperial College és a Leuveni Katolikus

Egyetem fiatal kutatói dolgoztak ki, szinte minden hasonló anonimizált adathalmazra (egészségügyi adatok, közvélemény-kutatási felmérések stb.) alkalmazható. Ez komoly visszaélésekre ad lehe- tőséget, hiszen például egészségügyi biztosítók, cégek, pártok vagy akár állami szervek juthatnak olyan információkhoz a polgárokról, amiket egyéb- ként nem lenne joguk elkérni és tárolni.

A legtöbb országban az anonimizált adatokra nem vonatkoznak az adatvédelmi előírások. A GDPR is így rendelkezik, ezért például nem kell alkalmazni statisztikai vagy kutatási célú adatkezelésnél. Az ilyen adatokra nagy a kereslet, használják közvéleménykutatók, politikusok, vállalatok egy- aránt, hogy megismerjék politikai, vallási, szexuá- lis, vásárlási stb. preferenciáinkat – természetesen szigorúan statisztikai alapon.

Néhány jellemzőből megmondom, ki vagy Csakhogy ezek a hatalmas adatkészletek jellem- zően tartalmaznak minden benne szereplő, egyéb- ként anonimizált személyről különböző egyedi jellemzőket, attribútumokat. A kutatók felhozzák példának az egyik amerikai adatbróker céget, amely olyan, egyébként anonimizált adatkészletet árult ügyfeleinek, amely 120 millió amerikairól tar- talmazott háztartásonként 248 jellemzőt. Vagy a Cambrige-i Egyetem kutatói egy olyan – szintén anonimizált – adatkészletet osztottak meg, amely hárommillió személy Facebook-adatait tartalmazta, melyeket a MyPersonality appon keresztül gyűjtöt- tek be. Az adatkészlet tartalmazta az emberek életkorát, nemét, lokációját, állapotfrissítéseit, va- lamint egy személyiségjegyeket vizsgáló kérdőív eredményeit. (Az már csak hab a tortán, hogy egy banális hiba miatt lényegében a MyPersonalityvel gyűjtött összes adat kiszivároghatott, és emiatt a Facebook ki is tiltotta az appot.)

A kutatócsapat a modell alapján készített egy algo- ritmust is, amellyel a nyilvánosan elérhető adatok alapján és mindössze 15 attribútum felhasználásá- val az amerikai polgárok közel száz százalékát (99,89 százalék) képesek voltak beazonosítani.

(2)

TMT 66. évf. 2019. 7–8. sz.

471 Magyarán módszerükkel pontosan vissza lehetett

fejteni például, hogy melyik amerikai állampolgár milyen válaszokat adott a népszámláláskor.

A kutatók létrehoztak egy oldalt is, ahol a mód- szerben kétkedők böngészőben kipróbálhatják egy korlátozott adathalmazon a szoftvert. Meg kell adni különböző adatokat (életkor, nem stb.), és a szoft- ver megmondja, hogy hány százalékos valószínű- séggel azonosítható be az illető. A részletek csak az alapteszt kitöltése után válnak láthatóvá. (A Nature Communicationsben még az szerepel a cikk végén, hogy a kísérletek reprodukálásához szükséges forráskód is elérhető a dokumentáció- val, a tesztekkel és a példákkal együtt, de ennek már nincs nyoma az oldalon.)

Megoldás: majdhogynem nincs

A magánélet védelmének bevett módszere például az attribútumok eltávolítása vagy a hamis értékre cserélése, esetleg hogy egy adatkészletnek mindig csak egy töredékét teszik elérhetővé. A kutatók szerint azonban ezek sem elégséges módszerek a személyes adatok védelmére.

A másik véglet az ilyen adatkészletek teljes anonimizálása lenne, csakhogy akkor lényegében egy olyan – elemezhetetlen – adathalmot kapunk, aminek semmi értéke sincs a kutatók számára. Így például egy egészségügyi adatkészletnél lehetet-

len lenne reprodukálni egy kutatócsapat eredmé- nyeit.

Megoldás jelenthet a hozzáférés szigorítása. Pél- dául érzékeny orvosi adatokhoz csak biztonságos és zárt körülmények között lehetne hozzáférni, ahol a másolásra sem lenne lehetőség. Erre már vannak kísérletek, például a franciák létrehoztak egy központot, amely interfészként kapcsolja ösz- sze az adatok előállítóit és felhasználóit. A CASD (Secure Data Access Centre) központ például azt ígéri, hogy ellenőrzött körülmények között és felté- telekkel és csak célzottan lehet hozzáférni az ada- tokhoz. A központban nagyságrendileg 66 millió személy különböző adatait (az egészségügyitől a népszámlálási adatokig) tárolják. Ezekkel az ada- tokkal csak speciális hozzáférési pontokon lehet dolgozni.

Az elemzésnél megoldás lehet, hogy a nyers ada- tokat ún. multi-party titkosítással rejtik el (a kripto- gráfiai módszerről itt: https://bitport.hu/kis-magyar- ceg-indul-a-hsm-piac-meghoditasara írtunk). Ez elméletileg akár működhetne is, de például a tu- dományos kutatásnál ez sem feltétlenül járható.

Mivel a kutató magukat a nyers adatokat nem látja, így fel sem ismerheti, ha hibázott valahol.

Forrás: https://bitport.hu/ez-az-algoritmus-feladja-a- lecket-a-gdpr-felelosoknek-senki-sem-maradhat- nevtelen

Válogatta: Fonyó Istvánné

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Infografikán tanulmányozhatja bárki, hogy meny- nyivel lett melegebb lakóhelyén azóta, hogy meg- született: a New York Times felületén elég megadni a várost és a születési

A The New York Times cikkét készítő Kashmir Hill megkérte azokat a rendőröket, akik a ClearView rendszerével dolgoznak, hogy futtassák át a fotóját az adatbázisukon

Ezért az Adobe, a Twitter és a The New York Times a következő hetekben további partnereket akarnak megnyerni a kezdeményezés számára, hogy az új rendszert a

A lépésr ő l beszámoló The New York Times példaként említette, hogy El Greco Szent János látomása cím ű festményét is nagy felbontásban lehet letölteni

Azok, akik The Times cikkekhez internetes kere- sés, blog és közösségi oldalakon keresztül jutnak, akkor is elérhetik ezeket a cikkeket, ha már elérték a limitjüket,

attól függ, hogy az el ő fizet ő hány könyvet bocsát a Google-projekt rendelkezésére, a The New York Times becslése szerint a University of Michigan 25 évig nem fog

A New York Times 1999 óta, a Wall Street Journal 1986 óta megjelent számai online adatbázisként már korábban is megvoltak a ProQuestnél, ASCII formátumú teljes szövegként..

The growth of metropolitan districts in the United States, HBO—1940 (311'. Bureau of the census...