• Nem Talált Eredményt

T anulási a naliTika (l eArning A nAlytics , lA)

út Az önértékeléshez és önfejlesztéshez

4. következtetések, továbbgondolás

4.2 T anulási a naliTika (l eArning A nAlytics , lA)

Ferguson (2012) szerint a tanulási Analitika elsősorban az online tanulási környezet fej-leszthetőségének, a tanulási élmény és teljesítmény növelésének lehetőségeit kutatja. Az amerikai tanulás Analitikai társaság 2011-ben Albertában tartott első konferenciáján (lAk 2011) a résztvevők a következő meghatározást adták: „A tanulási Analitika a tanu-lóval és a tanulás kontextusával kapcsolatos adatok mérése, gyűjtése, elemzése és ezekből beszámolók készítése. cél a tanulás és környezetének megértése és optimalizálása.” Az 1. táblázat mutatja be az Akadémiai Analitika és a tanulási Analitika eltéréseit (1. táblázat,

long–siemens 2011).

Juhász levente zsolt

1. táblázat: Akadémiai Analitika és tanulási Analitika

Analitika Az analízis szintje vagy tárgya felhasználó, kedvezményezett Tanulási

Analitika

kurzusszint: szociális hálózat, konceptuális

fej-lesztés, diskurzusanalízis, „intelligens tanterv” tanulók, oktatók tanszéki: prediktív modellezés, a sikerek és

kudarcok mintázata tanulók, oktatók

Akadémiai Analitika

intézményi: tanulói profilok, oktatói/kutatói

teljesítmény, knowledge flow Adminisztráció, finanszí-rozók, marketing regionális (állam, tartomány): rendszerek

összehasonlítása Finanszírozók,

adminisztráció

Nemzeti és nemzetközi Nemzeti kormányzat,

oktatáspolitika

A tanulási analitikai vizsgálatokban gyakrabban alkalmazott módszerek: társas hálóza-tok elemzése, véleményelemzés (sentiment analysis), befolyáselemzés, diskurzusanalízis, tanulói sikeresség előrejelzése, konceptuális elemzés, értelmező modellezés (siemens–

Baker 2012). A  tanulási Analitikának van néhány tipikus felhasználási területe:

a)  teljesítménypredikció, valamely kurzusról való lemorzsolódási kockázat (valószínű-ség) előrejelzése; b) Perszonalizáció és adaptáció: egyénre szabott tanulási út és értékelési anyagok készítése; c) intervenciótervezés, információk szolgáltatása a tanárok számára a megfelelő segítségnyújtás megtervezéséhez; d) információvizualizációk készítése, lényegi információk kiemelése (összegzése), interaktív learning dashboard (irányítópult) felületek tervezése. A tanulási analitikai vizsgálatok legfontosabb adatforrásai a tanulásimenedzs-ment-rendszerek, az intelligens tutor rendszerek, az adaptív és intelligens hipermédia-rendszerek, és a tesztelő és feleltető rendszerek (romero–Ventura 2013). Néhányan ma az edukációs Adatbányászatot a tanulási Analitika kutatáscentrikus részterületének tekintik (edutech Wiki 2016).

4.3 edukációsadaTbányászaT (educAtionAl dAtA mining, edm)

Az International Educational Data Mining Society (www.educationaldatamining.org) meg-határozása szerint az eDM olyan, még alakulófélben lévő tudomány, amelynek feladata oktatási környezetből származó sajátos és nagyléptékű adathalmazok vizsgálata, ehhez megfelelő módszerek kifejlesztése. A cél a tanulók és környezetük jobb megértése ezekkel a módszerekkel. Az adatok származhatnak interaktív tanító környezetekből, számítógép-pel támogatott kollaboratív tanulásból, lehetnek adminisztratív adatok stb. A tanulási Analitikától, mellyel módszerekben, tematikában és személyi összetételében is nagy át-fedést mutat, bizonyos hangsúlykülönbségek mentén tér csak el (2. táblázat, siemens–

Baker 2012).

Akadémiai analitika, tanulási analitika és edukációs adatbányászat

2. táblázat: A tanulás Analitika (lA) és az edukációs Adatbányászat (eDM) összehasonlítása

lA edm

Felfedezés Az emberi megítélés használata a kulcs. Az automatizált felfedezés csak egy eszköz ezen cél eléréséhez.

Automatizált felfedezés a kulcs.

Az emberi megítélés csak egy eszköz ezen cél eléréséhez. komponen-sekre és a köztük lévő kapcsola-tokra fókuszál.

eredet szemantikus web, intelligens tanterv, kimenet predikció, és szisztematikus intervenciók.

Oktatószoftverek, tanulómo-dellezés, kurzuseredmények előrejelzése.

Adaptáció &

Perszonalizáció Oktatók és tanulók informálása,

ké-pességeinek növelése. Automatikus adaptáció (emberi beavatkozás nélkül).

technikák &

Módszerek

társas hálózatok elemzése, sentiment analysis (véleményelemzés),

Az eDM, mint neve is utal rá, intenzíven használja az adatbányászat feltáró és elemző eszközeit. Az adatbányászat interdiszciplináris számítógép-tudományi terület, adat- és tu-dásfeltárásnak (Knowledge Discovery, KD) is nevezik. Alapvetően a statisztikai eljárásokra és a mesterséges intelligencia eredményeire épít. Feladata a nyers adatok elemzése, hogy azokban a nem nyilvánvaló összefüggéseket feltárjuk. A teljes adatbányászat egy folya-mat, amelynek több fontos komponense van. Üzleti környezetben az egyik ismert modell (Cross Industry Standard Process for Data Mining, CRISP­DM) az alábbi lépéseket sorolja fel (shearer 2000):

1. Üzleti megértés. Az üzleti probléma átkonvertálása adatbányászati kérdéssé.

2. Az adatok megértése. Adatok gyűjtése, az adatok megismerése, intuitív hipotézisek megfogalmazása.

3. Adatelőkészítés. A feldolgozáshoz megfelelő adatformátum kialakítása. Adatredukció, a szükséges változók szelekciója, adattisztítás, különböző adattranszformációk, a hiányzó adatok kezelése.

4. Modellezés. A problémának megfelelő gépi tanulási, statisztikai eszközök használata.

A legtöbb az adatváltozók közötti mintázatokat modellező eljárás paramétereket beállító optimalizációs problémát old meg. A túltanulást – amikor az illesztett statisztikai modell nem általánosítható jól új esetekre, mert a modell túlságosan a tanító adathalmaz tulaj-donságaitól függ – általában keresztvalidációs módszerekkel igyekeznek kiküszöbölni.

Juhász levente zsolt

5. értékelés. A  statisztikai modelleket az üzleti probléma szempontjából értékelik.

szükség esetén változtathatnak a modelleken vagy újabb modelleket illesztenek.

6. Alkalmazás. Az eredmények beépítése az üzleti folyamatba.

Az adatbányászat legfontosabb feladatait ismerteti Fayyad (3. táblázat, Fayyad et al. 1996).

3. táblázat: Az adatbányászat feladatai feladatosztály

Anomália detektálása kiugró (outlier) értékek, változás, eltérés detektálása. Főleg hibás vagy szokatlan értékeket tartalmazó adatrekordok azonosítására, további vizsgálat céljára. Pl. szokatlan banki műveletek.

Asszociációsszabály-tanulás

Függőségi modellezés. Változók közötti kapcsolatok feltárására.

Pl. bevásárlókosár-analízis: milyen termékeket vásárlunk gyakran együtt.

klaszteranalízis Adatok csoportosítása valamilyen hasonlósági metrika segítségével.

Az adatelemek közötti kapcsolat általában előzetesen nem ismert.

Pl. galaxisok csoportosítása.

klasszifikáció Adatok osztályozása (címkézése) valamilyen előzetesen ismert struk-túra alapján. Pl. daganatok osztályozása rosszindulatú és jóindulatú séma alapján.

regresszió Függvény (statisztikai modell) illesztése az adatokra a lehető legki-sebb eltéréssel. A modell alapján új adatok esetén a célváltozókra előrejelzéseket tehetünk.

Összesítés Adathalmazok jellemzése kompakt módon. lényegkiemelés, össze-foglaló riportok, adatvizualizáció.

Az adatbányászat alapvető modellező módszerei a gépi tanulás (machine learning) algorit-musaira épülnek. A gépi tanulás alapvetően olyan alaptudományi kutatás, amelynek célja annak feltárása, hogy hogyan tehetjük képessé a számítógépeket előre be nem programo-zott tudás és viselkedés elsajátítására. A számítógépek tehát olyan szoftverek segítségével tanulnak, amelyek megfelelő gépi tanuló algoritmusok elve alapján működnek. A gépi tanulásban a tanulási problémáknak/feladatoknak, így az azok megoldására kifejlesztett algoritmusoknak három nagy csoportja van:

a) Felügyelt tanulás (tanulás tanítóval, supervised learning): a tanítás a bemeneti ada-tok (változók, vonások) és az elvárt kimeneti változó érték együttes adásával tör-ténik. Az algoritmus feladata a bemeneti változókat kimeneti változókra leképező általános szabályok felfedezése.

b) Nem felügyelt tanulás (tanulás tanító nélkül, unsupervised learning): a tanítás során nincs elvárt kimenet. A tanuló algoritmus feladata az adatváltozók közötti össze-függések feltárása, mintázatfelismerés.

Akadémiai analitika, tanulási analitika és edukációs adatbányászat c) Megerősítéses tanulás (reinforcement learning): a tanító itt sem a helyes példákat

mu-tatja, csak a tanuló viselkedését megerősítő információkat nyújt. A tanuló dinami-kus környezetben optimális stratégia kialakítására törekszik a megerősítő (jutalom és büntetés) jelek hatására valamilyen cél elérése érdekében.

Az adatbányászatban legfontosabb tanuló algoritmusokat Wu és kumar (2009) ismerteti (4. táblázat).

4. táblázat: A gépi tanulás legfontosabb algoritmusai (Wu–kumar 2009)

Algoritmus feladat működés

1. c4.5 Osztályozás,

regresszió Döntési fa építése. Új elempéldányok esetén a döntési fát bejárva tudunk osztályozni.

2. k-means klaszterezés k darab csoport képzése hasonlóság alapján.

3. support vector

machines Osztályozás A többdimenziós térben olyan hipersíkok (alacsonyabb dimenziójú alterek) keresése, amelyek szétválasztják a  különböző csoportokat.

4. Apriori Asszociációs

szabályok Az elemek együttes előfordulásának alapján.

5. eM Valószínűségi modellek

Pl. a klaszterezés általános elve többmenetes (iteratív) eljárások esetén. Minden iterációban a korábbi ada-tok, mentek (stb.) alapján előzetesen kialakított modell (expectation) paraméterei kerülnek frissítésre az adatok-hoz való illeszkedésük alapján (Maximalization).

6. Pagerank linkanalízis

Hálózatban összekapcsolt elemek szerepének, fontos-ságának megállapítása kapcsolataikat iteratívan elemző algoritmus segítségével. Pl. a honlapok Pagerank értéke (Google).

7. AdaBoost Metaalgoritmus Főleg osztályozó eljárások teljesítményének növelésére használják. A gyengén osztályozó modelleket kombinálja és súlyozza.

8. kNN Osztályozás Új elemek osztálya a legközelebbi k darab szomszédja többségi osztálya lesz.

9. Naive

Bayes Osztályozás

A tanulóhalmazban lévő elemek változóinak gyakori-ságát (illetve ezen változók összefüggéseit) használja az új elemek osztályának megállapítására a Bayes-tétel alkalmazásával.

10. cArt Osztályozás Osztályozó döntési fa.

Juhász levente zsolt

A 4. táblázatban nem szerepel még, de napjainkban egyre nagyobb szerepet kapnak az adatbányászati problémák megoldásában a  mesterséges neuronháló elvén működő al-goritmusok (konnekcionista rendszerek). ezek a rendszerek bizonyos vonatkozásban az idegrendszer elosztott működési elvét mesterséges neuronok hálózatában valósítják meg.

leggyakrabban osztályozási feladatokra használják ezeket. Összetett, több feldolgozó rétegből álló változatait ’Deep Learning’ rendszereknek nevezik, bizonyos kategorizációs feladatokban igen sikeresnek bizonyulnak. Pedagógiai kutatásokban való elterjedtebb fel-használásukat akadályozza, hogy az osztályozó rendszerek nem transzparens változataihoz tartoznak. Jól teljesítenek az előrejelző feladatokban, de a függő és a célváltozók kapcsola-tainak elemzésére nem alkalmasak, szemben például a döntésifa-modellekkel.

Pedagógiai kutatásokban az ismertetett általános adatbányászati eszközök mellett spe-ciálisan a területre jellemző eljárásokat is alkalmaznak. Baker (2010) öt csoportba sorolja a leggyakrabban alkalmazott eDM- és tanulási analitikai módszereket (5. táblázat).

5. táblázat: A tanulási Analitika és az edukációs Adatbányászat legfontosabb módszerei (Baker 2010) módszercsoport

A. Prediktív (előrejelző) módszerek

klasszifikáció (osztályozás) regresszió

sűrűségbecslés latens tudásbecslés

B. struktúrafeltárás

klaszteranalízis (csoportosítás) Faktoranalízis

Domain Structure Discovery Hálózatelemzés

c. kapcsolat/összefüggés bányászat

Asszociációs szabályok kinyerése korrelációs elemzés

szekvenciális mintázatok feltárása Okozati adatbányászat

D. Adatösszefoglalás és vizualizáció Adatvizualizáció, dashboard e. Modellalapú feltárások

A. prediktív (előrejelző) módszerek. ezek közül már néhány korábban is említésre ke-rült. Matematikai modelleket illesztünk (tanítunk) az adatainkra, majd ezek segítségével a célváltozó értékét akarjuk meghatározni a prediktor változók valamilyen kombinációja alapján. Felügyelt tanulásról van szó. Ha a célváltozónk folytonos, akkor regressziót, ha ka-tegorikus változó, akkor valamelyik klasszifikációs (döntési fák, logisztikus regresszió, sup­

port vector machine, neurális háló) eljárást alkalmazzuk. Valószínűségi változó eloszlásá-nak becslésére a sűrűségbecsléses módszerek (kernel függvények) alkalmasak. idesorolhatók

Akadémiai analitika, tanulási analitika és edukációs adatbányászat a latens tudás becslés modelljei (knowledge tracing): a tanulói ismeretek, készségek (latens változók) feltárása a teljesítmény alapján és reprezentálása Bayes-valószínűségi hálók se-gítségével. ez alapján lehetséges a tanulói teljesítmény előrejelzése (corbett–Anderson 1995; Yudelson et al. 2013).

Példák: Prediktív eszközöket alkalmazott például Baker munkatársaival (2008) tanu-lók tanulószoftverek használata közben mutatott viselkedésének osztályozására (a rendszer nem rendeltetésszerű használata, off­task viselkedés, véletlen hibázás). Az előrejelző mód-szerek használatára egy másik példa a tanulmányi eredmények (kimenetek) előrejelzése és megértése (Dekker et al. 2009).

B. struktúrafeltárás. Nem felügyelt tanuló algoritmusok tartoznak ide. ezek alkal-mazásának célja az adatban rejtőző kapcsolatok, viszonyok feltárása. tipikus tagja ennek a csoportnak a már említett klaszteranalízis, amellyel a valamilyen szempontból hasonló adatpontokat egy csoportba, a különböző adatokat különböző csoportokhoz rendelhetjük.

többféle változata használt a vizsgálatokban, a legismertebbek a hierarchikus (agglome-ratív, divizív) és nem hierarchikus (k-közép) klaszterezés. A faktoranalízis gyakorlatilag az eljárás kifejlesztése óta kedvelt eszköze a társadalomtudományi kutatásoknak. közvetlenül nem megfigyelhető (latens) változók kikövetkeztetésére használjuk a változók közötti kor-relációstruktúra alapján. Használják adatredukciós céllal is, a meglévő dimenziók (válto-zók) csökkentésére. A társas hálózat elemzése (social network analysis): entitások (fogalmak, személyek) közötti kapcsolatok elemzése hálózatelméleti eszközökkel. A tanulás analitikai vizsgálatokban inkább használt kutatási módszer. A domain structure discovery – tudás-területi struktúrafeltárás célja valamely tantárgyi tudás vagy feladat tartalmi elemei és a tanulók procedurális és deklaratív képességei közötti kapcsolatok kimutatása.

Példák: klaszteranalízist használt a tanulói viselkedésmintázatok feltárására Beal és munkatársai (2006) vagy Amershi és conati (2009). Dawson (2008) a hálózatelemzés segítségével az interakciós mintázatok és társas struktúra összefüggéseit vizsgálta kolla-boratív feladatmegoldás közben. A területi struktúrafeltárás módszerének alkalmazására példa Desmarais és munkatársai (2012) munkája. A diákok feladatokban elért eredmé-nyeit tartalmazó adatmátrixot (M) mátrixfaktorizáció segítségével két tényező mátrixszor-zatára bontották (M = Q * s). A Q mátrix a mért készségek és az egyes feladatok közötti összetartozást, az s mátrix pedig az egyes diákoknak a feladatmegoldás során mutatott készségszintjét reprezentálják.

c. kapcsolat/összefüggés-bányászat. Az ebbe a csoportba tartozó eljárások a válto-zók közötti kapcsolatok kimutatására alkalmazhatók. Az asszociációs szabályok kinyerése (pl. az idézett Apriori algoritmussal), mellyel a változók értékei közötti rejtett kapcsolatok vagy halmazelemek előfordulásainak függőségei tárható fel „ha, akkor” típusú szabályok formájában. A szekvenciális mintázatokat feltáró módszerekkel az adatsorokban előfordu-ló gyakori mintázatok, idői függőségek mutathatók ki. A korrelációs elemzés módszere a standard statisztikai vizsgálatok eszköztárának fontos eszköze a változók közötti pozitív vagy negatív együttjárások feltárására. Az oki kapcsolatok bányászata továbblép ennél: az asszociatív/korrelációs kapcsolatokon túl az események és változók közötti ok/okozati vi-szonyok megállapítására törekszik.

Juhász levente zsolt

Példák: Ben-Naim és munkatársai (2009) az asszociációs szabályok feltárása segítségé-vel a sikeres hallgató viselkedésére jellemző mintázatokat azonosítottak. Perera és munka-társai (2009) szekvenciális mintázatok elemzésével a sikeres projektmunkát eredményező kollaborációs viselkedéssorozatokat vizsgálták. Fancsali (2012) pedig az oki kapcsolatok feltárásával azokat a tényezőket azonosította, amelyek a kognitív tutor rendszert használó hallgatók teljesítményét meghatározták.

D. Adatösszefoglalás és vizualizáció. Az eDM célja a felhasználók számára könnyen használható (user friendly) interaktív interfészek (dashboard) tervezése, könnyen emészt-hető adatábrázolási formák, összefoglaló riportok kialakítása, az adattengerből a lényeges összefüggések áttekinthető kiemelése.

Példa: Hershkovitz és Nachmias (2008) általuk learnogramnak nevezett vizualizációs módszert fejlesztettek ki az e-learning rendszerrel való tanulás változóinak időbeli alaku-lásának ábrázolására és elemzésére.

e. modellalapú vizsgálatok. korábban validált modellek és az általuk prediktált vál-tozók használatát jelenti további eDM-modellek kialakításában.

Példa: Baker és Gowda (2010) városi, külvárosi és falusi iskolába járó diákokat okta-tóprogrammal való tanulás közben mutatott viselkedését hasonlították össze: mennyire használják rendeltetésszerűen a rendszert. A vizsgálatban felhasználták Baker és munka-társai (2008) által kialakított off­task viselkedést leíró modelljük előrejelzéseit is.

A legfontosabb eDM-alkalmazásokat foglalja össze a 6. táblázat (Paviotti et al. 2012).

6. táblázat: Az eDM/lA technikák alkalmazásai és a leggyakoribb kapcsolódó pedagógiai felhasználások edm-technika

A döntéshozatalt segítő hasznos informá-ciók kiemelése: a hallgatók kurzusakti-vitásának és felhasználói viselkedésének vizsgálata. Általános kép a hallgató tanulásáról.

A célcsoportot képessé kell tenni a meg-felelő proaktív és/vagy javító cselekvések megvalósítására.

c Ajánlások hallgatóknak Hallgatók

Direkt ajánlások megfogalmazása a ta-nuló számára: perszonalizált (egyénre szabott) aktivitások, meglátogatandó linkek, elvégzendő feladatok.

D Hallgatói

teljesítmény-elő-rejelzése tanárok, tutorok A hallgatói teljesítményt leíró ismeretlen változók (osztályzat, pont, vizsga sikeres letétele, tudás) megbecslése.

Akadémiai analitika, tanulási analitika és edukációs adatbányászat

e Hallgatók

modellezése tanárok, tutorok, oktatók

A felhasználó/hallgató kognitív modell-jének kialakítása (készségeiről, deklaratív tudásáról)

Problémás és szokatlan viselkedést mutató hallgatók kiszűrése: helytelen cselekvés, alacsony motiváció, nem megengedett segédeszközök használata, lemorzsolódás, rossz iskolai előmenetel stb.

G Hallgatók csoportosítása Oktatók, nevelők A hallgatók csoportosítása egyéni jellem-zőik, személyes tulajdonságaik alapján.

i társas hálózatok

elemzése Hallgatók, tanárok,

tutorok Az egyének közötti kapcsolatok vizsgálata

J Fogalmi

térké-pek kialakítása Oktatók, nevelők tanárok és oktatók segítése fogalmi tér-képek fejlesztésének és konstrukciójának automatizálásával.

k kurzusanyagok

fejlesztése Oktatók, fejlesztők kurzus- és tananyagok automatikus létrehozása. A meglévő források újrahasz-nosításának és terjesztésének elősegítése.

l tervezés és

ütemezés tanárok, tutorok, hallgatók

A hagyományos tanulási/tanítási folya-mat támogatása: jövőbeli kurzusok ter-vezése, a hallgatók kurzusütemezésének segítése, forráselosztástervezés, a felvételi folyamat és a tanulási tanácsadás segítése, tanterv (kurrikulum) tervezése.