• Nem Talált Eredményt

BME VIK Számítástudományi és Információelméleti Tanszék Diplomamunka, önálló labor és TDK témajavaslat

N/A
N/A
Protected

Academic year: 2022

Ossza meg "BME VIK Számítástudományi és Információelméleti Tanszék Diplomamunka, önálló labor és TDK témajavaslat"

Copied!
1
0
0

Teljes szövegt

(1)

BME VIK Számítástudományi és Információelméleti Tanszék Diplomamunka, önálló labor és TDK témajavaslat

Témakiíró: Dr. Csáji Balázs Csanád Beosztás: tudományos főmunkatárs Munkahely: MTA SZTAKI

Email: balazs.csaji@sztaki.mta.hu

Cím: Valószínűleg közelítőleg helyes (PAC) tanulás Leírás:

A valószínűleg közelítőleg helyes (PAC: Probably Approximately Correct) egy gépi tanulási keretrendszer, amely alapvetően felügyelt tanulási problémákra lett bevezetve. Az alapkoncepció szerint egy véges (zajos) megfigyeléseket tartalmazó minta alapján szeretnénk egy olyan (regressziós) modellt tanulni, amely megadott konfidencia valószínűséggel az általánosítási hibát egy szintén adott korlát alatt tartja. A keretrendszer kiterjeszthető sztochasztikus optimalizálási problémákra, és egy kérdés, például, hogy milyen feladatosztályokra tudunk hatékony PAC algoritmusokat adni, vagy egy a feladatosztályon értelmezett konkrét algoritmus milyen PAC típusú korlátokhoz vezet.

A PAC módszer eredményeit és PAC típusú korlátokat sok helyen alkalmaznak, például, a robusztus optimalizálásnak is egy sztochasztikus relaxációját jelentik és a PAC módszertan szoros kapcsolatban áll a Monte Carlo típusú szimulációs megközelítésekkel is.

Egy lehetséges irány PAC eredmények alkalmazása szekvenciális tanulási és optimalizálási problémákra. Ilyen problémák tipikusak például a modell prediktív kontroll (MPC) és a megerősítéses tanulás (RL) területén, valamint egy leegyszerűsített feladatosztályt jelentenek a többkarú-rabló problémák (például, véges, lineáris, konvex, kontextuális). Ez utóbbi feladatok előnye, hogy egy egyszerű formális modellben lehet néhány máskülönben nagyon összetett sztochasztikus problémát vizsgálni. Az így kapott algoritmusok és elméleti eredmények fontos útmutatóul szolgálnak bonyolultabb rendszerek esetén is.

Irodalom:

- Valiant, Leslie. Probably Approximately Correct. Basic Books. 2013

- Haussler, David. Probably Approximately Correct Learning. Technical Report.

University of California, Santa Cruz. Computer Research Laboratory. 1990.

- Szepesvári, Csaba. Algorithms for Reinforcement Learning. Morgan & Claypool. 2010.

- Campi, Marco; Garatti, Simone; Prandini, Maria. The Scenario Approach for Systems and Control Design. Annual Reviews in Control. 33:149-157. 2009.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Egy új kutatási irányt jelentenek a nemparametrikus statisztikai módszereken alapuló, eloszlás-független, nem-aszimptotikus becslési megközelítések, amelyek

A kutatás célja a véletlenített adaptív algoritmusok elméleti (például konvergencia) vagy gyakorlati (például szimulációs) vizsgálata, különös tekintettel a

A megerősítéses tanulás alapmodellje, hogy egy ágens (döntéshozó) egy bizonytalan (sztochasztikus) környezetben tevékenykedik, és a rendszertől kapott (állapot és

Számítástudományi és Információelméleti Tanszék Budapesti M ˝uszaki és Gazdaságtudományi

Számítástudományi és Információelméleti Tanszék Budapesti M ˝uszaki és Gazdaságtudományi Egyetem. Katona

AP2_OKTIG_2_Tanulási eredmény alapú szemlélet megismerése és bevezetése az SZTE-n Tanulási Eredmény Alapú Képzésfejlesztő Műhely a Szegedi Tudományegyetemen.. A

A  tanulási egység ugyanis – a kalendarisztikus terv értelmében – sajátos kompetenciaként nem emel be a  tantervből egyetlen, a(z) (helyes)írási készség

A Moodle keretrendszer használatával kialakított TMPK Virtuális Tanulási Környezet –TMPK VTK – kiváló lehetőséget ad arra, hogy a szükséges háttéranyagok, a