• Nem Talált Eredményt

Sikeres alkalmaz´asok

In document Magyar nyelv˝ u irodalom (Pldal 22-25)

1. Bevezet´ es 6

1.4. Sikeres alkalmaz´asok

Az ”adat b´any´aszata” eredetileg statisztikusok ´altal haszn´alt kifejez´es, az adatok nem kell˝ok´eppen megalapozott felhaszn´al´as´ara, amely sor´an valaki helytelen k¨ovetkeztet´est von le.

Igaz ugyanis, hogy tetsz˝oleges adathalmazban felfedezhet¨unk valamilyen strukt´ur´at, ha el´eg sok´aig n´ezz¨uk az adatot. Ism´et utalunk a lehets´eges k¨ovetkeztet´esek nagy sz´am´ab´ol ered˝o vesz´elyre. A helytelen k¨ovetkeztet´esre az egyik legh´ıresebb p´elda az al´abbi: Az 50-es ´evekben

5A d¨ont´esi fa ´ep´ıt´esekor ´altal´aban nem k¨ovetelm´eny, hogy egy lev´elbeli ¨osszes rekord ugyanazon oszt´alyba tartozzon, el´eg, ha

nagy r´esz¨uk” azonos oszt´alyba tartozik. Ebben a konkr´et p´eld´aban az ¨osszes fogamz´asg´atl´ot szed˝o hallgat´o n˝o volt.

David Rhine parapszichol´ogus di´akokat vizsg´alt meg azzal a c´ellal, hogy parapszichol´ogiai k´epess´eggel rendelkez˝oket tal´aljon. Minden egyes di´aknak 10 lefedett k´artya sz´ın´et kellett meg-tippelne (piros vagy fekete). A k´ıs´erlet eredm´enyek´ent bejelentette, hogy a di´akok 0,1%-a pa-rapszichol´ogiai k´epess´eggel rendelkezik (a teljesen v´eletlenszer˝uen tippel˝ok k¨oz¨ott a helyesen tippel˝ok v´arhat´o sz´ama statisztikailag nagyj´ab´ol ennyi, hiszen annak val´osz´ın˝us´ege, hogy vala-ki mind a t´ız k´arty´at eltal´alja 2110 = 10241 ). Ezekkel a di´akokkal ´ujra elv´egezte a k´ıs´erletet, ´am ez´uttal a di´akok eredm´enye teljesen ´atlagos volt. Rhine k¨ovetkeztet´ese szerint az, aki parapszi-chol´ogiai k´epess´eggel rendelkezik ´es err˝ol nem tud, elveszti eme k´epess´eg´et, miut´an tudom´ast szerez r´ola.

A fenti p´elda ellen´ere m´ara az adatb´any´aszat sz´o elvesztette jelent´es´enek negat´ıv tartalm´at, a sz´amos sikeres alkalmaz´asnak k¨osz¨onhet˝oen. A teljess´eg ig´enye n´elk¨ul felsorolunk bel˝ol¨uk n´eh´anyat.

– A bankok egyre gyakrabban alkalmaznak olyan automatikusan el˝o´all´ıtott d¨ont´esi f´akat, amelyek alapj´an egy program javaslatot tesz egy hitel meg´ıt´el´es´er˝ol. Ezt a k´erelmez˝ok szem´elyes, tov´abb´a el˝ozetes hitelfelv´eteli ´es t¨orleszt´esi adatai alapj´an teszi (oszt´alyoz´as) [132]. Tesztek p´eld´aul igazolt´ak, hogy a hitelb´ır´alat min˝os´ege javult az USA-ban, amikor a bankok ´att´ertek a k¨otelez˝oen alkalmazott, ´ır´asban r¨ogz´ıtett szab´alyok alkalmaz´as´ara [132]. Ezeket a szab´alyokat pedig az adatb´any´aszat seg´ıts´eg´evel ´all´ıtott´ak ¨ossze.

– A v´as´arl´oi szok´asok felder´ıt´ese szupermarketekben, illetve nagy vev˝ok¨orrel rendelkez˝o

´aruh´azakban hasznos lehet az ´aruh´az term´ekt´erk´ep´enek kialak´ıt´as´an´al, akci´ok, elad´ashelyi rekl´amok (Point of Sales, Point of Purchase), le´araz´asok szervez´es´en´el. . . (asszoci´aci´os szab´alyok).

– Az ember genot´ıpus´anak elemz´es´ehez a g´enek nagy sz´ama miatt szint´en adatb´any´aszati algoritmusok sz¨uks´egesek. Az eddigi sikeres k´ıs´erletek c´elja olyan g´encsoportok felt´ar´asa volt, amelyek a cukorbetegs´eg bizonyos v´altozatai´ert felel˝osek. A teljes emberi g´enrendszer felt´ar´as´aval ez a ter¨ulet egyre fontosabb lesz.

– Az on-line ´aruh´azak a j¨ov˝oben egyre elfogadottabbak ´es elterjedtebbek lesznek. Mivel az on-line kereskedelemben nem haszn´alhat´oak a megszokott szem´elyes marketing eszk¨oz¨ok a forgalom (´es a profit) szem´elyre szabott v´as´arl´asi aj´anlatokkal n¨ovelhet˝o. Az aj´anlatokat az eddigi v´as´arl´asi adatok ´es a rendelkez´esre ´all´o demogr´afiai adatok elemz´ese alapj´an tehetj¨uk meg (epiz´odkutat´as, asszoci´aci´os szab´alyok).

– A csillag´aszatban az ´egitestek ´ori´asi sz´ama miatt a hagyom´anyos klaszterez˝o algoritmusok m´eg a mai sz´am´ıt´asi kapacit´asok mellett sem k´epesek racion´alis id˝on bel¨ul k¨ul¨onbs´eget tenni galaxisok, k¨ozeli csillagok ´es m´as ´egi objektumok k¨oz¨ott. Az ´ujabb, kifinomultabb algoritmusok fut´asi ideje j´oval kevesebb, ami lehet˝ov´e teszi a klaszterez´est (klaszterez´es).

– Utaz´as szervez´essel kapcsolatos mint´ak kinyer´es´evel hat´ekonyabban (´es ennek k¨ovet-kezt´eben nagyobb nyeres´eggel) megszervezhet˝ok a nagy k¨olts´egfaktor´u t´enyez˝ok, pl.

sz´allodai szob´ak, rep¨ul˝ojegyek le´araz´asa, vagy ´aremel´ese (epiz´odkutat´as, gyakori minta).

– Kifinomult gy´art´asi folyamatok sor´an gyakran a be´all´ıt´asi param´eterek finomhangol´as´ara van sz¨uks´eg. A k˝oolaj ´es a f¨oldg´az sz´etv´alaszt´asa az olajfinom´ıt´as sz¨uks´eges el˝ofelt´etele, de az elv´alaszt´asi folyamat kontroll´al´asa nem k¨onny˝u feladat. A British Petroleum

olajv´allalat a g´epi tanul´as technik´aj´at haszn´alta a param´eter-be´all´ıt´as szab´alyainak meg-alkot´as´ara. Most ez t´ız percet vesz ig´enybe, m´ıg kor´abban szak´ert˝ok t¨obb, mint egy napi munk´aj´at vette ig´enybe.

– A Westinghouse c´eg nukle´aris t¨uzel˝oanyag-cell´ak gy´art´asa sor´an ¨utk¨oz¨ott probl´em´akba, ´es szint´en a g´epi tanul´as seg´ıts´eg´evel hoztak l´etre folyamatkontroll´al´asi szab´alyokat. Ezzel 10 milli´o USD-t siker¨ult megsp´orolniuk az 1984-es ´evben. A Tenessee ´allambeli R.R. Donelly nyomdaipari c´eg ugyanezt az ¨otletet alkalmazta a retograv´ur nyomdag´epek ir´any´ıt´as´ara,

´ıgy cs¨okkentve a hib´as param´eter-be´all´ıt´asok k¨ovetkezt´eben keletkez˝o selejtes nyomatok sz´am´at ´evi 500-r´ol 30-ra.

– A v´ırus¨ol˝o programok az ismert v´ırusokat lenyomataik alapj´an detekt´alj´ak, az ismeretle-neket pedig t¨obbnyire valamilyen heurisztikus m´odon pr´ob´alj´ak kisz˝urni. Oszt´alyoz´o al-goritmusok felhaszn´al´as´aval az ismert v´ırusok tulajdons´agai alapj´an olyan modellt lehet fel´all´ıtani, ami j´ol le´ırja a v´ırusok tulajdons´agait [120, 121]. A modellt sikeresen alkal-mazt´ak ´uj ismeretlen v´ırusok kisz˝ur´es´ere (oszt´alyoz´as).

Tov´abbi esettanulm´anyokr´ol a 13.3.2 r´eszben olvashatunk.

A fentiekben a sikeres alkalmaz´asokat ismertett¨uk. A k¨ovetkez˝oben tov´abbi alkalmaz´asokat mutatunk be. C´elunk, hogy szeml´eltess¨uk a diszcipl´ına kiterjedts´eg´et ´es aktu´alis ´all´as´at.

– Az emberi mesters´eges megterm´ekeny´ıt´es sor´an petesejtek sokas´ag´at gy˝ujtik ¨ossze a n˝oi petef´eszekb˝ol. Ezeket a partner, vagy donor sperm´aival megterm´ekeny´ıtve sz´amos embri´o fejl˝odik ki. K¨oz¨ul¨uk n´eh´anyat kiv´alasztanak, ´es az anyam´ehbe ¨ultetnek. A probl´em´at a legink´abb ´eletk´epes, legjobb t´ul´el´esi es´elyekkel rendelkez˝o embri´ok kiv´alaszt´asa jelenti.

A kiv´alaszt´as az embri´ok k¨or¨ulbel¨ul hatvan r¨ogz´ıtett jellegzetess´eg´en – a magzat mor-fol´ogi´aj´an, oocita-, t¨usz˝osejt- ´es spermamint´akon – alapszik. A jellemz˝ok sz´amoss´aga elegend˝oen nagy ahhoz, hogy t´ul bonyolult legyen az embriol´ogusoknak valamennyit p´arhuzamosan megbecs¨ulni ´es ¨osszef¨ugg´est tal´alni a m´ultb´eli esetek kezdeti jellemz˝oi ´es azok kimenetele k¨oz¨ott, azaz, hogy az embri´ob´ol v´eg¨ul ´eletk´epes csecsem˝o sz¨uletett-e vagy sem. Egy angol kutat´asi projekt arra ir´anyul´o kutat´ast folytat, hogy hogyan lehet a kiv´alaszt´ast g´epi tanul´assal – az embri´ok r¨ogz´ıtett adatait tan´ıt´ohalmazk´ent haszn´alva – megval´os´ıtani.

– Az ´uj-z´elandi tejgazdas´agoknak minden ´evben kem´eny ¨uzleti d¨ont´est kell meghozniuk:

ki kell v´alasztani, hogy a szarvasmarha ´allom´any mely egyedeit tartj´ak meg, ´es melyeket

´ert´ekes´ıtik v´ag´ohidaknak. Tipikusan minden gazdas´ag ¨ot¨odik egyede ker¨ul m´esz´arsz´ekre a fej´esi id´eny v´eg´en, ahogy az ´elelmez´esi tartal´ekok kiapadnak. A d¨ont´est az egyes p´eld´anyok teny´eszadatai ´es m´ultb´eli tejtermel´ekenys´egi mutat´oja befoly´asolja. Tov´abbi kritikus fak-torok az egyed kora (egy p´eld´any kb. 8 ´evesen ´eri el produkt´ıv korszak´anak v´eg´et), k´ort¨ort´enete, sz¨ul´esi komplik´aci´ok, nemk´ıv´anatos jellemvon´asok (agresszivit´as, ker´ıt´es

´atugr´asa), illetve az, hogy a k¨ovetkez˝o szezonban vemhes-e. T¨obb milli´o szarvasmar-ha egyedenk´ent t¨obb mint 700 tulajdons´ag´at r¨ogz´ıtett´ek az ´evek sor´an. A kutat´ok azt vizsg´alj´ak, hogyan haszn´alhat´o fel a g´epi tanul´as annak meg´allap´ıt´as´ara, hogy a sikeres farmerek mely faktorokat veszik sz´am´ıt´asba a szelekt´al´asn´al. Ezzel nem a d¨ont´esi folyamat g´epes´ıt´ese a c´eljuk, hanem a sikerstrat´egia kitanul´asa, ´es annak k¨ozkinccs´e t´etele.

In document Magyar nyelv˝ u irodalom (Pldal 22-25)