4. A tudományfilozófia szociológiai fordulata
4.2 A tudományfilozófia kvantitatív szociológiai módszerei
4.2.3. Hálózatok, mintázatok és dinamika: strukturális tudománymetria
Amint az eddigiekből kiviláglik, az értékelő tudománymetria nem nélkülözheti a tudomány tényleges szerveződésének, működésének vizsgálatát. Ahhoz például, hogy figyelembe vehessük a szakterületek hatását az értékelésben, szükség van a szakterületek kvázi-objektív, adatalapú azonosíthatóságára és elhatárolására vagy éppen összefüggéseik meghatározására: meg kell tudni mondani, mi az a szakcikk-halmaz (referenciahalmaz), amelynek jellemzőihez képest egy cikket, szerzőt vagy intézményi portfóliót értékelhetünk. A tudomány empirikus vizsgálata természetesen nem csak az értékeléshez szolgáltat alapot: a tudományos trendek elemzése (tudománydinamika), a kutatási frontvonalak (azaz a kialakulóban lévő, élen járó irányok) meghatározása, a kutatási együttműködések hatásának feltérképezése, hogy csak néhányat említsünk, mind alapvető bemenetei az informált tudománypolitikának és stratégiának. Ezek az – értékelést is részben megalapozó és azzal szoros összefüggésben lévő – szakterületi irányok együttesen astrukturális tudománymetriaösszefoglaló néven tárgyalhatók.
A strukturális tudománymetria mind célkitűzéseit, mind pedig módszertani eszközeit illetően igen változatos terület.
Példaként két intenzíven fejlődő részterületét említjük meg: az informált kutatásértékelést támogató ún.
tudománytérképezést, valamint a tudománypolitikában alapvető tudományos együttműködések, hálózatok elemzését.
A tudománytérképezés egyik fő célkitűzése a dinamikusan változó nemzetközi tudomány mindenkori szak- és tudományterület-rendszerének felmérése, azonosítása. Erről részletesebben is lesz szó.
A hálózatelemzés több vonatkozásban is meghatározó elméleti kerete a korszerű tudománymetriának. (Láttuk, hogy a tudománymetria újjászületésében is szerepet játszott.) A modern tudománymetria elsődleges érdeklődése valójában éppen a publikációk kapcsolatrendszerének elemzése, az abból levonható következtetések feltárása lett, ezt pedig a hálózatok ragadják meg a legjobban. A legújabb hatásmérő indikátorok, például az Impakt Faktor fent említett vetélytársai (vagy sokkal inkább: kiegészítői) a folyóiratok teljes hivatkozási hálózatának szerkezetét elemzik a hatás kvantifikálásához, annak érdekében, hogy képesek legyenek súlyozni az idézőket a hálózat többi részéhez való (közvetett és közvetlen) kapcsolódásuk szerint.
A tudománymetriai hálózatelemzés legtermészetesebb módon a kutatási együttműködések vizsgálatában jelenik meg. Ezen a ponton a társadalmi kapcsolathálók tudománya [social network analysis, SNA] fed át a bibliometriával.
A szakcikkek és egyéb publikációk a legtöbb tudományterületen és legtöbb esetben sokszerzős művek, vagyis együttműködésben készülnek. A publikációs adatbázisok alapján a kutatóközösségben szerveződő együttműködési hálók (társszerzői hálózatok) könnyen rekonstruálhatók, és elemezhetővé válnak olyan kérdések, mint hogy mekkora kiterjedésű, milyen szerkezetű együttműködések jellemzik a területet, kik annak meghatározó, „központi”, vagy éppen mediátor szerepű résztvevői. Ehhez jól használhatóak a hálózatelmélet klasszikus „centralitás” fogalmai és ennek továbbfejlesztései. Ezek segítségével könnyen és hatékonyan vehetőek figyelembe olyan természetes szempontok, mint például az idéző művek és/vagy szerzők rangja (pl. saját idézettségük mértéke).
A tudománypolitika számára releváns kérdésfeltevés például, hogy a hálózati szerepek hogyan befolyásolják a produktivitást – ezen a ponton közgazdaságtudományi (ökonometriai) modelleknek adva teret, amelyek pl. a hálózati szerepek és a kibocsátás mérete között igyekeznek statisztikai összefüggést teremteni.
4.2.3.1 Tudománytérképezés
A tudománytérképezés (science mapping) a tudomány modellezésének talán legrohamosabban fejlődő területe, amely az információtudomány eszköztárát használja fel. A tudománytérképezésnek számos megközelítése és alkalmazott módszere jött létre a 60-as, 70-es évektől kezdődően, amelynek az adathozzáférés és -feldolgozás nagyságrendi változásai adtak igazi lendületet az utóbbi két évtizedben (egy látványos összefoglaló Börner 2010).
Mára – a hálózati módszerekkel kombinálva – rendkívül népszerűvé, a laikus ábrázolásokban is megjelenővé vált.
Az alábbiakban röviden áttekintjük e megközelítések taxonómiáját a következő szempontok szerint:
A modellalkotás célja: Globális tudástérkép vagy egy szegmens modellezése (emergens területek, kutatói közösségek).
Idődimenzió:Az idő dimenziójának kezelésmódját illetően e háromféle megközelítést célszerű megkülönböztetni:
1. Akeresztmetszeti elemzés egyetlen időablakban vizsgálja a tárgyát, ami jellemzően elég szűk ahhoz, hogy egyfajta pillanatképet adjon a tudomány szerveződéséről;
2. A longitudinális elemzés hosszabb időtávot képviselő bibliográfiai adathalmazt vizsgál, ugyanakkor a keresztmetszeti változathoz hasonlóan egyetlen összefüggő, bár jóval szélesebb időablakot rögzít;
3. Adinamikus elemzéstöbb, egymást követő időablakra bontja fel a vizsgált időszakot, és külön vizsgálja az egyes időszeleteket annak érdekében, hogy az időbeli változást az egyes időmetszetek között nyomon követhetővé tegye.
A fenti jellemzésből látható, hogy a keresztmetszeti és a longitudinális elemzés jelenlegi felfogása között mindössze fokozati különbség van, ami inkább gyakorlati, mint elvi megkülönböztetésként fogható fel. A minőségi distinkciót itt az újabb, dinamikus elemzés fogalma jelenti.
Indikátorok, megfigyelt változók.A tudománytérképezési gyakorlatok alapvető kézjegye, hogy mely indikátor(ok) felhasználásával modellezik a tudományszerveződést. “Indikátor” alatt ebben az esetben a már megbeszélt bibliometriai metaadatok valamely típusát értjük tág értelemben, vagyis a szerzők, cím, lelőhely, stb. adatbázis-változókon túl (amelyek a közlemények sztenderd bibliográfiai jellemzői) ide soroljuk például a szerzői vagy hozzárendelt (“indexer-based”) kulcsszavak körét, ill. az egyéb témaleíró–témajelölő változókat, valamint a közlemények besorolásait, különböző, főként szakterületi kategóriarendszerek mentén. (Megjegyzendő, hogy a tudománymetriában – így a korábbi oldalakon is – azindikátorkifejezés elsősorban mérőszámokra, nem pedig, mint ezen a helyen, a megfigyelési változókra vonatkozik.)
Módszerek. A tudománytérképezés gyakorlatában jól azonosítható az alapmódszerek egy csoportja, amelyek az elemzési cél függvényében változatos módon, illetve egymással kombinálva épülnek be az egyes megközelítésekbe.
Az alapmódszerek megkülönböztető ismérve az, hogy a dokumentumok közötti kapcsolatok melyik dimenzióját tekintik meghatározónak a tudományszerveződés feltárásakor. Ennek alapján beszélhetünk (1) hivatkozási– valamint idézési, (2) szerzőségi, illetve (3) fogalmi kapcsolatokra épülő alapmódszer-családról. Noha a szerzőségi, illetve a fogalmi kapcsolatok vizsgálata a megfelelő indikátorok (metaadat-típusok) felhasználásával zajlik – az előző esetben a közlemény szerzői, az utóbbinál pedig a közlemény témájára vonatkozó deskriptorok, pl. kulcsszavak révén –, mégsem célszerű a módszereket az alkalmazott indikátorok mentén megkülönböztetni. A szerzőket véve példaként könnyen belátható ugyanis, hogy a közlemények (forrásközlemények) egy halmaza, illetve azok hivatkozásai egyaránt elemezhetők a szerzőik szerint, míg azonban az első megközelítés a forrásközlemények szerzőalapú kapcsolatrendszerét tárja fel, a másik a hivatkozási kapcsolataikat célozza (vö. a további szakaszokkal).
4.2.3.1.1. Tudománytérképezési alapmodellek
A tudomány szerkezetére, lokális vagy globális szerveződésére, a tudományterületek kapcsolatrendszerére vonatkozó empirikus vizsgálatok leginkább elterjedt módszertana a közlemények hivatkozásaiból indul ki. Központi szerepe miatt az alapmodelleket részletező alfejezetben az idézési–hivatkozási struktúrákat hasznosító módszereket tárgyaljuk részletesen. A módszertan központi előfeltevése, hogy a hivatkozások együttesen a közlemény intellektuális előzményeit, hátterét, “tudásbázisát” képviselik. Ilyen módon egy olyan közleménycsoport (korpusz) aggregált hivatkozásainak elemzését kapjuk, amely egy szakterületet testesít meg, és alkalmas a terület kognitív szerkezetének, belső és külső (más területekkel létrejött) kapcsolatrendszerének feltárására. A vizsgálat egysége lehet
• az idézett közlemény (D),
• az idézett szerző(k) (A), illetve
• az idézett források, jellemzően a közlő folyóirat (S),
ezek mindegyike más-más aspektusát ragadja meg a tudományszerveződésnek. A D–S indikátorokat hasznosító módszerek két nagy kategóriában oszlanak meg:
A “kapcsolódó közlemények módszere” (bibliometric coupling, BC).A módszer a közlemények kognitív–tematikus hasonlóságának, ill. távolságának megállapítását célozza, amelynek alapvető mértékét a közös hivatkozások számában jelöli meg. A vizsgálati egység egyaránt lehet teljes közlemény, szerző (a közösen hivatkozott szerzők száma) vagy a lelőhely (pl. a közösen hivatkozott folyóiratok száma). A gyakorlatban először választunk egy, a közös referenciák számára épülő hasonlósági mérőszámot. Ezt követően ennek alapján (egy alkalmas klaszterezési
eljárással) meghatározzuk a forrásdokumentumok összetartozó csoportjait (klasztereit). Ezáltal feltérképezzük a dokumentumok referencia-alapú szerveződését.
Az együttidézés módszere (co-citation analysis, CC). Az előző módszer komplementere. A forrásdokumentumok közti kapcsolat erősségének mércéje itt az együttes idézés gyakorisága. Ez a módszer tehát a forrásközlemények hivatkozáslistája helyett annak a korpusznak a hivatkozáslistájából indul ki, amely a forrásközleményeket idézi (“citing side”). Az idéző közlemények referenciái közti együttes előfordulás – mint indikátor – ezúttal is számos hasonlósági mérőszámnak szolgáltat alapot, az elemzés menete a BC-hez hasonlóan egy hasonlósági/távolsági mátrix kalkulációját, valamint egy erre alapuló klaszterezést foglal magában.
A fenti két alaptechnika egymás ellentétének tekinthető: a BC a vizsgált közleményeket hivatkozásaik szerint, a CC pedig idézéseik szerint csoportosítja. Az alábbiakban a tudományszerveződés vizsgálatának jellegzetes példáit tekintjük át, amely ezt a módszercsaládot hasznosítja.
A kutatási területek kognitív–intellektuális szerkezete.A hivatkozási struktúrákat hasznosító módszerek klasszikus változata a szerzők együttidézésének vizsgálata (author co-citation analysis, ACA). Az ACA olyan exploratív, ill.
vizualizációs technika, amelynek célja a kutatási területek kognitív szerkezetének feltárása. A fent bevezetett taxonómia szerint a módszer indikátora, ill. vizsgálati egysége a szerző (A), eljárása pedig a (CC): az adott területen aktív szerzőket klaszterezi az együttidézés mértéke alapján. Tehát a gráf csúcsait a tudományterületen aktív szerzők alkotják. A közöttük lévő élek léte, illetve erőssége attól függ, hogy az adott szerzőket hányszor idézték (mások) egyazon cikkben. A módszer eredményeképp előálló szerzői klaszterek úgy értelmezhetők, mint olyan kutatóközösségek, amelyek egy adott kutatási témát reprezentálnak – a klaszterszerkezet ilyen módon a terület tematikus szerkezetét tükrözi.
ACA: http://www.implementationscience.com/content/figures/1748-5908-3-49-2.jpg
A kutatási területek kognitív–intellektuális szerkezete.
A tudomány diszciplináris szerveződése.A közlemények forrását (lelőhelyét) hasznosító együttidézési vizsgálatok különböző változataival találkozhatunk azokban a megközelítésekben, amelyek a tudomány nagyléptékű szerveződését igyekeznek feltérképezni, ún.globális tudománytérképekszerkesztése révén. Taxonómiánkban – az indikátort és a módszert tekintve – ez a csoport tehát lelőhely-alapú együttidézési elemzésként jellemezhető (source co-citation analysis, SCA). Ez az utóbbi években felélénkült modellezési irány, a globális tudománytérképezés, a módszer változatos variánsait sorakoztatja fel: Moya-Anegon és tsai. (2004) vizsgálatai a Web of Science adatbázisaiban alkalmazott tárgykategóriákat (Subject Category, SC) veszik alapul. A tárgykategóriák (pl. orvosi tudományok, fizika, stb.) az adatbázisban indexelt folyóiratok csoportjai (azok szakterületi kategorizációjára használatosak), ezért lelőhely-indikátorokként foghatók fel. Az említett szerzők az adatbázis-közlemények idézéseit tárgykategóriánként aggregálták, majd a tárgykategóriák együttes idézésének mértékét (a Web of Science egészét véve mintaként) kalkulálva megállapították azok kapcsolatának erősségét, kognitív távolságát. Az együttidézés vizsgálata ugyancsak a tárgykategóriák (mint vizsgálati egységek) szintjén zajlott. A gyakorlat végeredménye egy ún. hasonlósági hálózat, amelynek csúcspontjai a tárgykategóriák, (súlyozott) élei pedig a köztük fennálló kapcsolatokat (és azok erősségét) kódolják. A hálózat – lévén a legkiterjedtebb multidiszciplináris, nemzetközi citációs index egészét tükrözi – a tudomány mindenkori globális szerveződésének modelljeként értelmezhető.
A fenti módszer tehát a jelen taxonómia szerint az (S) és a (CC) kombinációja. Valamelyest eltérő módszert alkalmaz Leydesdorff és Rafols (2009), ahol ugyanezen tárgykategóriák (SC-k) kapcsolata nem idézéseik, hanem – aggregált – hivatkozásaik alapján került mérlegre. Közelebbről, a kapcsolat mértékét két tárgykategória között ezúttal annak a mértéke jelzi, hogy mennyire hasonlít egymáshoz a többi kategóriára vonatkozó hivatkozásaik
struktúrája, vagyis mennyiben hivatkozzák közösen a többi SC-t. Ebből következőleg, míg a Moya-Anegon és tsai. eljárása az együttidézési vizsgálatok osztályába utalható (CC), addig a Leydesdorff–Rafols-féle eljárás a hasonló közlemények módszerét (BC) példázza, vagyis az (S) és a (BC) kombinációja.
Együttidézési SC-térkép (www. Scimago.com)
BC-alapú SC-térkép, (http://www.leydesdorff.net/overlaytoolkit/overlaytoolkit.htm)
A szakterületi paradigmák globális térképe. A tudomány finomszerkezetének, részletes, nagyfelbontású struktúrájának ez idáig talán legsikeresebb feltárási kísérlete az ún. “paradigmatérképezési módszerben” jelölhető meg (Boyack et al. 2005, Boyack 2009). A paradigma ebben a kontextusban a legszűkebb koherens kutatási iránynak vagy témának feleltethető meg – így viszonylag laza rokonságot mutat a Kuhn-i paradigmafogalommal (vagy annak valamely változatával). Az eljárás célja, hogy a tudomány egészét ezen a leírási szinten ábrázolja. A legfőbb érv a felbontás növelése mellett, hogy a tudományszerveződés valódi mintázatait, a tudásterületek folyamatos interakciójából kibontakozó emergens területeket a – folyóiratokat és nem pl. közleményeket besoroló – szakterületi
kategóriák rendszerei jellemzően elfedik, legyenek bármilyen részletesek is. Ennek elkerülése céljából aparadigmát a szerzők úgy fordítják le a bibliometria számára, mint gyakorta együttidézett közlemények jól körülhatárolható csoportjait, amely csoportok egy-egy kutatási témát vagy specifikus irányt képviselnek. Az ún. globális paradigmatérképennek alapján az egyik nagyléptékű citációs adatbázis, aScopusközleményszintű feldolgozásával készült (Boyack et al. 2005). A térkép bázisa az egyes közlemények aggregált hivatkozáslistájának együttidézési elemzése (egy ésszerű bekerülési határérték felett, amely a hivatkozások előfordulásának számára vonatkozott).
A térkép az elemzésből származó klaszterekből épül fel, amelyeket tehát az egymással szoros tematikus kapcsolatban álló hivatkozott közlemények (referenciák) építenek fel. A térkép ennek megfelelően úgy fogható fel, mint a szakterületi paradigmák globális rendszere (adott időmetszetben), amely különösen nagy felbontású tudományrendszert eredményez. Mivel a módszer teljes közleményekkel (a hivatkozott dokumentumokkal) dolgozik, taxonómiánkba úgy sorolható be, mint a közleményalapú együttidézési modell egy alkalmazása (document co-citataion analysis, DCA), tehát ami a (D) és a (CC) elemeket kombinálja. Fontos megjegyezni, hogy a vizsgálat léptéke, a minta méretei miatt az ilyen eljárások csak a napjainkban rendelkezésre álló számítási kapacitások mellett váltak kivitelezhetővé.
Globális szakterületi paradimatérkép (Börner nyomán)