Hálózatok, mintázatok és dinamika: strukturális tudománymetria

4. A tudományfilozófia szociológiai fordulata

4.2 A tudományfilozófia kvantitatív szociológiai módszerei

4.2.3. Hálózatok, mintázatok és dinamika: strukturális tudománymetria

Amint az eddigiekből kiviláglik, az értékelő tudománymetria nem nélkülözheti a tudomány tényleges szerveződésének, működésének vizsgálatát. Ahhoz például, hogy figyelembe vehessük a szakterületek hatását az értékelésben, szükség van a szakterületek kvázi-objektív, adatalapú azonosíthatóságára és elhatárolására vagy éppen összefüggéseik meghatározására: meg kell tudni mondani, mi az a szakcikk-halmaz (referenciahalmaz), amelynek jellemzőihez képest egy cikket, szerzőt vagy intézményi portfóliót értékelhetünk. A tudomány empirikus vizsgálata természetesen nem csak az értékeléshez szolgáltat alapot: a tudományos trendek elemzése (tudománydinamika), a kutatási frontvonalak (azaz a kialakulóban lévő, élen járó irányok) meghatározása, a kutatási együttműködések hatásának feltérképezése, hogy csak néhányat említsünk, mind alapvető bemenetei az informált tudománypolitikának és stratégiának. Ezek az – értékelést is részben megalapozó és azzal szoros összefüggésben lévő – szakterületi irányok együttesen astrukturális tudománymetriaösszefoglaló néven tárgyalhatók.

A strukturális tudománymetria mind célkitűzéseit, mind pedig módszertani eszközeit illetően igen változatos terület.

Példaként két intenzíven fejlődő részterületét említjük meg: az informált kutatásértékelést támogató ún.

tudománytérképezést, valamint a tudománypolitikában alapvető tudományos együttműködések, hálózatok elemzését.

A tudománytérképezés egyik fő célkitűzése a dinamikusan változó nemzetközi tudomány mindenkori szak- és tudományterület-rendszerének felmérése, azonosítása. Erről részletesebben is lesz szó.

A hálózatelemzés több vonatkozásban is meghatározó elméleti kerete a korszerű tudománymetriának. (Láttuk, hogy a tudománymetria újjászületésében is szerepet játszott.) A modern tudománymetria elsődleges érdeklődése valójában éppen a publikációk kapcsolatrendszerének elemzése, az abból levonható következtetések feltárása lett, ezt pedig a hálózatok ragadják meg a legjobban. A legújabb hatásmérő indikátorok, például az Impakt Faktor fent említett vetélytársai (vagy sokkal inkább: kiegészítői) a folyóiratok teljes hivatkozási hálózatának szerkezetét elemzik a hatás kvantifikálásához, annak érdekében, hogy képesek legyenek súlyozni az idézőket a hálózat többi részéhez való (közvetett és közvetlen) kapcsolódásuk szerint.

A tudománymetriai hálózatelemzés legtermészetesebb módon a kutatási együttműködések vizsgálatában jelenik meg. Ezen a ponton a társadalmi kapcsolathálók tudománya [social network analysis, SNA] fed át a bibliometriával.

A szakcikkek és egyéb publikációk a legtöbb tudományterületen és legtöbb esetben sokszerzős művek, vagyis együttműködésben készülnek. A publikációs adatbázisok alapján a kutatóközösségben szerveződő együttműködési hálók (társszerzői hálózatok) könnyen rekonstruálhatók, és elemezhetővé válnak olyan kérdések, mint hogy mekkora kiterjedésű, milyen szerkezetű együttműködések jellemzik a területet, kik annak meghatározó, „központi”, vagy éppen mediátor szerepű résztvevői. Ehhez jól használhatóak a hálózatelmélet klasszikus „centralitás” fogalmai és ennek továbbfejlesztései. Ezek segítségével könnyen és hatékonyan vehetőek figyelembe olyan természetes szempontok, mint például az idéző művek és/vagy szerzők rangja (pl. saját idézettségük mértéke).

A tudománypolitika számára releváns kérdésfeltevés például, hogy a hálózati szerepek hogyan befolyásolják a produktivitást – ezen a ponton közgazdaságtudományi (ökonometriai) modelleknek adva teret, amelyek pl. a hálózati szerepek és a kibocsátás mérete között igyekeznek statisztikai összefüggést teremteni.

4.2.3.1 Tudománytérképezés

A tudománytérképezés (science mapping) a tudomány modellezésének talán legrohamosabban fejlődő területe, amely az információtudomány eszköztárát használja fel. A tudománytérképezésnek számos megközelítése és alkalmazott módszere jött létre a 60-as, 70-es évektől kezdődően, amelynek az adathozzáférés és -feldolgozás nagyságrendi változásai adtak igazi lendületet az utóbbi két évtizedben (egy látványos összefoglaló Börner 2010).

Mára – a hálózati módszerekkel kombinálva – rendkívül népszerűvé, a laikus ábrázolásokban is megjelenővé vált.

Az alábbiakban röviden áttekintjük e megközelítések taxonómiáját a következő szempontok szerint:

A modellalkotás célja: Globális tudástérkép vagy egy szegmens modellezése (emergens területek, kutatói közösségek).

Idődimenzió:Az idő dimenziójának kezelésmódját illetően e háromféle megközelítést célszerű megkülönböztetni:

1. Akeresztmetszeti elemzés egyetlen időablakban vizsgálja a tárgyát, ami jellemzően elég szűk ahhoz, hogy egyfajta pillanatképet adjon a tudomány szerveződéséről;

2. A longitudinális elemzés hosszabb időtávot képviselő bibliográfiai adathalmazt vizsgál, ugyanakkor a keresztmetszeti változathoz hasonlóan egyetlen összefüggő, bár jóval szélesebb időablakot rögzít;

3. Adinamikus elemzéstöbb, egymást követő időablakra bontja fel a vizsgált időszakot, és külön vizsgálja az egyes időszeleteket annak érdekében, hogy az időbeli változást az egyes időmetszetek között nyomon követhetővé tegye.

A fenti jellemzésből látható, hogy a keresztmetszeti és a longitudinális elemzés jelenlegi felfogása között mindössze fokozati különbség van, ami inkább gyakorlati, mint elvi megkülönböztetésként fogható fel. A minőségi distinkciót itt az újabb, dinamikus elemzés fogalma jelenti.

Indikátorok, megfigyelt változók.A tudománytérképezési gyakorlatok alapvető kézjegye, hogy mely indikátor(ok) felhasználásával modellezik a tudományszerveződést. “Indikátor” alatt ebben az esetben a már megbeszélt bibliometriai metaadatok valamely típusát értjük tág értelemben, vagyis a szerzők, cím, lelőhely, stb. adatbázis-változókon túl (amelyek a közlemények sztenderd bibliográfiai jellemzői) ide soroljuk például a szerzői vagy hozzárendelt (“indexer-based”) kulcsszavak körét, ill. az egyéb témaleíró–témajelölő változókat, valamint a közlemények besorolásait, különböző, főként szakterületi kategóriarendszerek mentén. (Megjegyzendő, hogy a tudománymetriában – így a korábbi oldalakon is – azindikátorkifejezés elsősorban mérőszámokra, nem pedig, mint ezen a helyen, a megfigyelési változókra vonatkozik.)

Módszerek. A tudománytérképezés gyakorlatában jól azonosítható az alapmódszerek egy csoportja, amelyek az elemzési cél függvényében változatos módon, illetve egymással kombinálva épülnek be az egyes megközelítésekbe.

Az alapmódszerek megkülönböztető ismérve az, hogy a dokumentumok közötti kapcsolatok melyik dimenzióját tekintik meghatározónak a tudományszerveződés feltárásakor. Ennek alapján beszélhetünk (1) hivatkozási– valamint idézési, (2) szerzőségi, illetve (3) fogalmi kapcsolatokra épülő alapmódszer-családról. Noha a szerzőségi, illetve a fogalmi kapcsolatok vizsgálata a megfelelő indikátorok (metaadat-típusok) felhasználásával zajlik – az előző esetben a közlemény szerzői, az utóbbinál pedig a közlemény témájára vonatkozó deskriptorok, pl. kulcsszavak révén –, mégsem célszerű a módszereket az alkalmazott indikátorok mentén megkülönböztetni. A szerzőket véve példaként könnyen belátható ugyanis, hogy a közlemények (forrásközlemények) egy halmaza, illetve azok hivatkozásai egyaránt elemezhetők a szerzőik szerint, míg azonban az első megközelítés a forrásközlemények szerzőalapú kapcsolatrendszerét tárja fel, a másik a hivatkozási kapcsolataikat célozza (vö. a további szakaszokkal).

4.2.3.1.1. Tudománytérképezési alapmodellek

A tudomány szerkezetére, lokális vagy globális szerveződésére, a tudományterületek kapcsolatrendszerére vonatkozó empirikus vizsgálatok leginkább elterjedt módszertana a közlemények hivatkozásaiból indul ki. Központi szerepe miatt az alapmodelleket részletező alfejezetben az idézési–hivatkozási struktúrákat hasznosító módszereket tárgyaljuk részletesen. A módszertan központi előfeltevése, hogy a hivatkozások együttesen a közlemény intellektuális előzményeit, hátterét, “tudásbázisát” képviselik. Ilyen módon egy olyan közleménycsoport (korpusz) aggregált hivatkozásainak elemzését kapjuk, amely egy szakterületet testesít meg, és alkalmas a terület kognitív szerkezetének, belső és külső (más területekkel létrejött) kapcsolatrendszerének feltárására. A vizsgálat egysége lehet

• az idézett közlemény (D),

• az idézett szerző(k) (A), illetve

• az idézett források, jellemzően a közlő folyóirat (S),

ezek mindegyike más-más aspektusát ragadja meg a tudományszerveződésnek. A D–S indikátorokat hasznosító módszerek két nagy kategóriában oszlanak meg:

A “kapcsolódó közlemények módszere” (bibliometric coupling, BC).A módszer a közlemények kognitív–tematikus hasonlóságának, ill. távolságának megállapítását célozza, amelynek alapvető mértékét a közös hivatkozások számában jelöli meg. A vizsgálati egység egyaránt lehet teljes közlemény, szerző (a közösen hivatkozott szerzők száma) vagy a lelőhely (pl. a közösen hivatkozott folyóiratok száma). A gyakorlatban először választunk egy, a közös referenciák számára épülő hasonlósági mérőszámot. Ezt követően ennek alapján (egy alkalmas klaszterezési

eljárással) meghatározzuk a forrásdokumentumok összetartozó csoportjait (klasztereit). Ezáltal feltérképezzük a dokumentumok referencia-alapú szerveződését.

Az együttidézés módszere (co-citation analysis, CC). Az előző módszer komplementere. A forrásdokumentumok közti kapcsolat erősségének mércéje itt az együttes idézés gyakorisága. Ez a módszer tehát a forrásközlemények hivatkozáslistája helyett annak a korpusznak a hivatkozáslistájából indul ki, amely a forrásközleményeket idézi (“citing side”). Az idéző közlemények referenciái közti együttes előfordulás – mint indikátor – ezúttal is számos hasonlósági mérőszámnak szolgáltat alapot, az elemzés menete a BC-hez hasonlóan egy hasonlósági/távolsági mátrix kalkulációját, valamint egy erre alapuló klaszterezést foglal magában.

A fenti két alaptechnika egymás ellentétének tekinthető: a BC a vizsgált közleményeket hivatkozásaik szerint, a CC pedig idézéseik szerint csoportosítja. Az alábbiakban a tudományszerveződés vizsgálatának jellegzetes példáit tekintjük át, amely ezt a módszercsaládot hasznosítja.

A kutatási területek kognitív–intellektuális szerkezete.A hivatkozási struktúrákat hasznosító módszerek klasszikus változata a szerzők együttidézésének vizsgálata (author co-citation analysis, ACA). Az ACA olyan exploratív, ill.

vizualizációs technika, amelynek célja a kutatási területek kognitív szerkezetének feltárása. A fent bevezetett taxonómia szerint a módszer indikátora, ill. vizsgálati egysége a szerző (A), eljárása pedig a (CC): az adott területen aktív szerzőket klaszterezi az együttidézés mértéke alapján. Tehát a gráf csúcsait a tudományterületen aktív szerzők alkotják. A közöttük lévő élek léte, illetve erőssége attól függ, hogy az adott szerzőket hányszor idézték (mások) egyazon cikkben. A módszer eredményeképp előálló szerzői klaszterek úgy értelmezhetők, mint olyan kutatóközösségek, amelyek egy adott kutatási témát reprezentálnak – a klaszterszerkezet ilyen módon a terület tematikus szerkezetét tükrözi.

ACA: http://www.implementationscience.com/content/figures/1748-5908-3-49-2.jpg

A kutatási területek kognitív–intellektuális szerkezete.

A tudomány diszciplináris szerveződése.A közlemények forrását (lelőhelyét) hasznosító együttidézési vizsgálatok különböző változataival találkozhatunk azokban a megközelítésekben, amelyek a tudomány nagyléptékű szerveződését igyekeznek feltérképezni, ún.globális tudománytérképekszerkesztése révén. Taxonómiánkban – az indikátort és a módszert tekintve – ez a csoport tehát lelőhely-alapú együttidézési elemzésként jellemezhető (source co-citation analysis, SCA). Ez az utóbbi években felélénkült modellezési irány, a globális tudománytérképezés, a módszer változatos variánsait sorakoztatja fel: Moya-Anegon és tsai. (2004) vizsgálatai a Web of Science adatbázisaiban alkalmazott tárgykategóriákat (Subject Category, SC) veszik alapul. A tárgykategóriák (pl. orvosi tudományok, fizika, stb.) az adatbázisban indexelt folyóiratok csoportjai (azok szakterületi kategorizációjára használatosak), ezért lelőhely-indikátorokként foghatók fel. Az említett szerzők az adatbázis-közlemények idézéseit tárgykategóriánként aggregálták, majd a tárgykategóriák együttes idézésének mértékét (a Web of Science egészét véve mintaként) kalkulálva megállapították azok kapcsolatának erősségét, kognitív távolságát. Az együttidézés vizsgálata ugyancsak a tárgykategóriák (mint vizsgálati egységek) szintjén zajlott. A gyakorlat végeredménye egy ún. hasonlósági hálózat, amelynek csúcspontjai a tárgykategóriák, (súlyozott) élei pedig a köztük fennálló kapcsolatokat (és azok erősségét) kódolják. A hálózat – lévén a legkiterjedtebb multidiszciplináris, nemzetközi citációs index egészét tükrözi – a tudomány mindenkori globális szerveződésének modelljeként értelmezhető.

A fenti módszer tehát a jelen taxonómia szerint az (S) és a (CC) kombinációja. Valamelyest eltérő módszert alkalmaz Leydesdorff és Rafols (2009), ahol ugyanezen tárgykategóriák (SC-k) kapcsolata nem idézéseik, hanem – aggregált – hivatkozásaik alapján került mérlegre. Közelebbről, a kapcsolat mértékét két tárgykategória között ezúttal annak a mértéke jelzi, hogy mennyire hasonlít egymáshoz a többi kategóriára vonatkozó hivatkozásaik

struktúrája, vagyis mennyiben hivatkozzák közösen a többi SC-t. Ebből következőleg, míg a Moya-Anegon és tsai. eljárása az együttidézési vizsgálatok osztályába utalható (CC), addig a Leydesdorff–Rafols-féle eljárás a hasonló közlemények módszerét (BC) példázza, vagyis az (S) és a (BC) kombinációja.

Együttidézési SC-térkép (www. Scimago.com)

BC-alapú SC-térkép, (http://www.leydesdorff.net/overlaytoolkit/overlaytoolkit.htm)

A szakterületi paradigmák globális térképe. A tudomány finomszerkezetének, részletes, nagyfelbontású struktúrájának ez idáig talán legsikeresebb feltárási kísérlete az ún. “paradigmatérképezési módszerben” jelölhető meg (Boyack et al. 2005, Boyack 2009). A paradigma ebben a kontextusban a legszűkebb koherens kutatási iránynak vagy témának feleltethető meg – így viszonylag laza rokonságot mutat a Kuhn-i paradigmafogalommal (vagy annak valamely változatával). Az eljárás célja, hogy a tudomány egészét ezen a leírási szinten ábrázolja. A legfőbb érv a felbontás növelése mellett, hogy a tudományszerveződés valódi mintázatait, a tudásterületek folyamatos interakciójából kibontakozó emergens területeket a – folyóiratokat és nem pl. közleményeket besoroló – szakterületi

kategóriák rendszerei jellemzően elfedik, legyenek bármilyen részletesek is. Ennek elkerülése céljából aparadigmát a szerzők úgy fordítják le a bibliometria számára, mint gyakorta együttidézett közlemények jól körülhatárolható csoportjait, amely csoportok egy-egy kutatási témát vagy specifikus irányt képviselnek. Az ún. globális paradigmatérképennek alapján az egyik nagyléptékű citációs adatbázis, aScopusközleményszintű feldolgozásával készült (Boyack et al. 2005). A térkép bázisa az egyes közlemények aggregált hivatkozáslistájának együttidézési elemzése (egy ésszerű bekerülési határérték felett, amely a hivatkozások előfordulásának számára vonatkozott).

A térkép az elemzésből származó klaszterekből épül fel, amelyeket tehát az egymással szoros tematikus kapcsolatban álló hivatkozott közlemények (referenciák) építenek fel. A térkép ennek megfelelően úgy fogható fel, mint a szakterületi paradigmák globális rendszere (adott időmetszetben), amely különösen nagy felbontású tudományrendszert eredményez. Mivel a módszer teljes közleményekkel (a hivatkozott dokumentumokkal) dolgozik, taxonómiánkba úgy sorolható be, mint a közleményalapú együttidézési modell egy alkalmazása (document co-citataion analysis, DCA), tehát ami a (D) és a (CC) elemeket kombinálja. Fontos megjegyezni, hogy a vizsgálat léptéke, a minta méretei miatt az ilyen eljárások csak a napjainkban rendelkezésre álló számítási kapacitások mellett váltak kivitelezhetővé.

Globális szakterületi paradimatérkép (Börner nyomán)

4.2.4. Esettanulmány: magyar intézmények kutatási

In document Bevezetés a tudományfilozófiába (Pldal 117-121)