• Nem Talált Eredményt

Zayatz, L.: Az anonimitás felfedésének elkerülése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Zayatz, L.: Az anonimitás felfedésének elkerülése"

Copied!
3
0
0

Teljes szövegt

(1)

Szakirodalom

Statisztikai Szemle, 87. évfolyam 6. szám 660

nálás csökkentése révén, ez azonban itt is maga- sabb földgázfogyasztással járt együtt.

Meglepő eredményre vezetett a vizsgálat azzal a közkeletű feltételezéssel kapcsolatban, hogy a különösen energiaigényes gyártási fo- lyamatokat a Német Szövetségi Köztársaság- ból más országokba telepítik át. A vizsgált tíz- éves időszakban ilyen érdemi változások nem voltak kimutathatók. Ellenkezőleg, 1995 és 2004 között a német exportszállítások többlete lényegesen növekedett olyan különösen ener- giaigényes termékekből, mint a vegyipari alapanyagok, műanyag-, illetve finomkerámia- termékek, melegen hengerelt acélárúk, gép- járművek. Más kifejezetten energiaigényes te- rületeken viszont, mint a nyersacél-, illetve alumíniumtermékek gyártása, enyhe import- többletet lehetett érzékelni. A német alap- anyag-előállítás terén főleg a hatékonyabb energiafelhasználás járult hozzá eredményesen a versenyképesség megőrzéséhez.

A tanulmány részletes táblázatokban mu- tatja be az 1995 és 2004 közötti időszakra vo- natkozóan az összes energiafelhasználás, illet- ve szén-dioxid-kibocsátás adatait, egyrészt a keletkezési területek, másrészt a főbb végter- mék-kategóriák szerint. Ezt az időszakot fel- ölelő input-output számítások eredeti adatai és a kapcsolódó információk letölthetők a www.destatis.de honlapról.

A szerző véleménye szerint az exportter- mékek előállításával kapcsolatban 2004. után a környezet kedvezőbb hasznosítására lehet számítani. A német export 2005-ben, de főleg 2006-ban intenzíven nőtt, s ez várhatóan javu- lással fog párosulni mind az energiafelhaszná- lás, mind a szén-dioxid-kibocsátás terén. Az erre vonatkozó adatok a környezetökonómiai számítások 2008. évre előirányzott aktualizá- lása után fognak rendelkezésre állni.

Tûû Lászlóné,

a Központi Statisztikai Hivatal ny. osztályvezetője

Zayatz, L.:

Az anonimitás felfedésének elkerülése

(Disclosure Avoidance Practices and Research at the U.S. Census Bureau: An Update.) – Journal of Official Statistics. 2007. évi 2. sz. 253–265. old.

A tanulmány letölthető: http://www.jos.nu/

Articles/abstract.asp?article=232253

Az Egyesült Államok Népszámlálási Hivata- lának (US Census Bureau – továbbiakban Hiva- tal) vizsgálataihoz és a cenzusokhoz szükséges alapadatokat az US Code 13. cikkelye alapján és az azt kiegészítő 2002. évi (A bizalmas informá- ciók védelme és a statisztikai hatékonyság) jog- szabály előírásai szerint gyűjtik. Az utóbbi előír- ja, hogy az adatgyűjtés kizárólag statisztikai cél- ból lehetséges és az adatgyűjtőnek kötelezettsé- get kell vállalni az adatkezelés titkosságának biz- tosítására. A Hivatal célja a minél magasabb mi- nőségű adatszolgáltatás, miközben nem sérül az adatszolgáltatók anonimitása. A tanulmány ösz- szefoglalja, ismerteti a névtelenség felfedésének (a továbbiakban felfedés) biztosítására szolgáló gyakorlatot, az alkalmazott technikai megoldá- sokat.

A Hivatal által kibocsátott minden nyilvá- nos adat valamennyi külső felhasználó számá- ra hozzáférhető; nem megengedett, hogy meg- határozott adatokat csak adott külső felhaszná- lók kapjanak meg. A legismertebb adatközlési formák a következők.

– Mikroadatok (például a válaszolók élet- kora, nemzetisége, neme, jövedelme, foglalko- zása), amelyeket a különböző demográfiai fel- vételekből, illetve a tízévenkénti népszámlá- lásokból nyernek. 2010-től változás lesz, miu- tán a tízévenkénti népszámlálások „hosszú”

kérdőíve helyett évente gyűjtenek adatokat az ún. Amerikai Közösségi Felvételből (AKF – American Community Survey)1. A vállalkozói

1 A magyarországi háztartásstatisztikai összeírás megfelelője.

(2)

Szakirodalom

Statisztikai Szemle, 87. évfolyam 6. szám

661

felvételeket és cenzusokat illetően – a köny- nyebb beazonosíthatóság veszélye miatt – nem közölnek mikroadatokat.

– Gyakorisági adatok (például egy adott földrajzi területen élő népesség családi állapo- tának és életkorának kombinációja), amelyeket a népszámlálások és az AKF adataiból nyer- nek. Más felvételek nem teszik lehetővé a te- rületek népességét jellemző megfelelő minő- ségű adatok publikálását.

– Összevont mennyiségi adatok (például a feldolgozóipar ágazatonkénti értékesítése egy adott államban, megyénként), amelyeket jel- lemzően a gazdaságstatisztikai publikációkban használják.

Az anonimitás biztosítására a Hivatal hat évre választott, kilenctagú (ebből hat személy a Hivatal igazgatóságait, illetve kutatóintézeteit képviseli), ún. Felfedést Figyelő Testületet (FFT – Disclosure Review Board) működtet. A testü- let a felfedés elkerülésének szem előtt tartásával a kiadást megelőzően minden kiadványt meg- vizsgál, engedélyezi, módosíttatja vagy megtilt- ja az adatközlést. Kedvezőtlen döntés esetén a publikáció adatgazdái az adatgazdálkodást fel- ügyelő bizottságnál fellebbezéssel élhetnek.

Az adatok meghatározott köre (például a gazdaságstatisztika mikroadatai) – az anonimi- tás biztosítása érdekében – nem hozhatók nyil- vánosságra. Ugyanakkor a létező felhasználói érdeklődés miatt korlátozott megoldásokat alakítottak ki.

– Az érdeklődő kutatók, felhasználók a Hi- vatal Adatkutató Központjaihoz (AKK – Research Data Centers) fordulhatnak. Részletes programjuk bemutatását és értékelését, majd egy külön eskütételt követően hozzáférhetnek az AKK által kezelt mikroadatokhoz is. A progra- mok elbírálásánál fontos szempont, hogy a vég- rehajtás a Hivatal számára is hasznos legyen (például szolgálja az adatminőség javítását, se- gítse az adatgyűjtés módszereinek tökéletesítését, a kutatás, a cenzus táblaanyagainak felépítését).

– Tökéletesített keresőrendszer teszi lehe- tővé, hogy a felhasználók a 2000. évi cenzus adataiból elektronikus úton, a saját igényeik- nek megfelelő táblázatokat állítsanak elő. E megoldásnál az igény egy tűzfalon át jut el a Hivatal szerverére, ahol a felhasználó egy elő- zetesen korrigált, átkódolt és továbbkódolt ál- lományból állíthatja elő az igény szerinti ada- tokat, amelyekhez a felhasználó csak akkor juthat hozzá, ha egy végellenőrzés nem állapít meg semmilyen felfedésre utaló jelet.

A szerző a továbbiakban felsorolja a felfe- dés elkerülését szolgáló jelenlegi gyakorlatot.

A mikroadatokat illetően természetes, hogy minden közvetlen azonosító adatot (név, lakcím stb.) el kell távolítani. Ezen túlmenően a 2000. évi cenzus adatait tekintve a követke- ző eljárásokat alkalmazzák:

– a területi küszöbérték, vagyis a mikroadatokat minimálisan 100 ezer lakosra vonatkoztatva kell meghatározni;

– a kerekítés (a hagyományos módszer szerint történik a cenzus jövedelmi adatainál);

– a 10 és több személyből álló háztartá- soknál alkalmazott megoldás az adattorzítás (noise addition), amikor a személyek eredeti életkorát egy másik csoporthoz tartozó szemé- lyek adataihoz igazítják. Egyes népességi cso- portoknál gyakorlat az életkoron kívüli más ismérv(ek) ily módon történő elfedése is;

– a népességcsoportonkénti küszöbérték, azaz egy-egy népességi kategóriába legalább 10 ezer személynek kell lennie;

– a felülkódolás, ami a kirívó esetek (pél- dául az 5 millió dollár feletti jövedelemmel rendelkező személyek) felfedésének elkerülé- sére szolgál. A felülkódolás változónként fél százalék és 3 százalék között mozog;

– az adatcsere, ha a háztartás demográfiai jellemzői még magas aggregáltsági szinten is felfedést okozhatnak. Ilyen esetekben a háztar- tás adatait kicserélik egy más területi aggregációban levő háztartás adataival.

(3)

Szakirodalom

Statisztikai Szemle, 87. évfolyam 6. szám 662

A gyakorisági adatokat tekintve a 2000.

évi cenzusnál a legnagyobb arányban az adat- cseréket alkalmazták mind a rövid, mind a hosszú kérdőíveknél. Ez a gyakorlat az AKF- nél is. Mindkét felvételnél a háztartások egy kis részét kicserélik, és a táblázatokat és a mikroadatokat a csere lebonyolítása után hoz- zák nyilvánosságra. Ezen túlmenően sor kerül a publikálási küszöbértékek meghatározására (például az etnikumoknál), továbbá a kerekí- tésre is. A felfedés elkerülését segíti elő az is, hogy három- vagy négydimenziós táblázatnál részletesebb adatközlés nem történik. Külön felhasználói kérés esetében követelmény, hogy a területi aggregáció minimálisan 300 főt tar- talmazzon, de a terület ne legyen azonos a Hi- vatal területbeosztásával.

Az összevont mennyiségi adatok esetén al- kalmazzák

– a cellaösszevonásokat (suppression) ak- kor, ha a kérdéses adat lehetőséget ad a felfe- désre. Ilyen esetben az adatot nem közlik, de jelzik az összevonást. Az összevonást számí- tógépes program segítségével végzik, különö- sen a többdimenziós tábláknál kell pótössze- vonásokat végezni, itt a lineáris programozásra épülő szoftvert alkalmazzák;

– az adattorzítást (noise addition), amikor az érzékeny adatokat +/–10 százalékkal, a nem érzékeny adatokat csak kisebb mértékben térí- tik el az eredeti értéktől. A módszer előnye a cellaösszevonással szemben, hogy a közlési tábla minden cellájában szerepel érték.

A tökéletesített keresőrendszer nem bizto- sítja a mikroadatok korlátlan elérését. A cikk ismerteti mind a beérkező kéréseknél, mind a kimenő válaszoknál beiktatott szűrőrendszerek részletes szempontjait.

A továbbiakban a felfedés elkerülését szol- gáló legújabb kutatásokat ismerhetjük meg.

A mikroadatok vonatkozásában új helyzetet jelent, hogy egyre inkább több – online vagy más formájú – forrásból származó adat- összekapcsolásra kerül sor, s a végtermék több-

nyire ingyen, de jellemzően alacsony ráfordítás- sal bárki számára elérhető. Több belső ellenőrző eljárás segítségével vizsgálják, hogy az adat- összekapcsolások nem eredményeznek-e felfe- dési lehetőséget. Az esetleges veszélyek valószí- nű bekövetkezése esetén az előbbiekben ismerte- tett valamennyi módszert alkalmazzák.

A kutatások foglalkoznak a mesterséges mikroadatok generálásával is. A művelet jelent- het teljes, vagy részleges (néhány ismérvre kiter- jedő) generálást. A részleges generálásnál jel- lemzően a felfedésre érzékeny adatok impu- tálására kerül sor. Párhuzamosan több – az ere- deti adathalmaz jellemzőivel bíró – „szintetizált”

modell is kidolgozható, közzétehető.

A gyakorisági adatokat illetően a korábbiak- ban mind a cenzus, mind az AKF vonatkozásá- ban az adatcsere technikáját alkalmazták.

Ugyanakkor az AKF „szintetizált” modellezését, mint a felfedés megakadályozását szolgáló másik lehetőséget vizsgálják.

Az összevont mennyiségi adatokat érintően kidolgozás alatt vannak táblázási módszerek, amelyek a cellaösszevonások, az adattorzítás és a kerekítés legjobb módszereinek kombinálásával hivatottak biztosítani a felfedés elkerülését.

John Ede,

a KSH ny. vezető főtanácsosa E-mail: edejohn@t-online.hu

Kraus, J.:

A geostatisztika mint statisztikai jelenségek térmodellezése

(Geostatistika jako prostorové modelování statistickych jevu.) – Statistika. 2007. évi 6. sz. 490–

501. old.

A tanulmány letölthető: http://panda.hyperlink.cz/

cestapdf/pdf07c6/kraus.pdf

A geostatisztika elnevezést G. Matheron francia matematikus használta először 1962- ben, miután a földrajzi interpolációkban és

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A Hivatal mellett részben állami, részben nem állami szervek folytatnak statisztikai

Az azonos család- nevű egyéneknek a populációban mutatko- zó gyakoriságával az egyes népcsoportokon belüli vagy népcsoportok közötti rokonsági struktúrát lehet

2 Bár az olvasó számá- ra kétségkívül könnyebbséget jelent, hogy az adott nyelvű szócikk végén azonnal ott találja a meghatározások alapjául szolgáló

vezetett túra a koponya belső és külső ré- szén keresztül; vizsgáztatás, amelynek so- rán a felhasználó a koponya belsejében érzi magát, ahonnan körültekintve különféle

HEAD BODY KÜLSŐ FILE KÜLSŐ URL-EN LÉVŐ FILE KÜLSŐ MAPPÁBAN LÉVŐ FILE... KÜLSŐ URL-EN

Nem említettük még a cloud storage költségeit, mégpedig azért nem, mert ez a terület egyaránt szólhat az online backup mellett és ellen.. Nyilvá- nos

[7] Ennek alapján egyértelműen kiderül, hogy leg- több esetben a könyvtár vezetése határozott a mystery shopping projektről, és ehhez külső céget alkalmazott.

emlékezzünk arra, hogy közvetlenül az első világháború kitörése előtt szintén állandó emelkedésben volt a nők aránya, az