Tanulás részlegesen címkézett adatokból

Description of video

Date: 3/22/23
Speaker :Zombori Zsolt

Tanulás részlegesen címkézett adatokból

A felügyelt gépi osztályozás feltételez egy olyan tanító adathalmazt, melyben bementi pontokhoz hozzá vannak rendelve elvárt kimeneti cimkék, és a tanulás során ezen bemenet-kimenet párokhoz igyekszünk függvényt illeszteni. A gyakorlatban azonban sok fontos feladatnál nem áll rendelkezésre ilyen erős tanító adat: mind a bemenet, mint a kimenet lehet zajos, hiányos. A részlegesen címkézett adat (Partial Label Learning - PLL) ennek speciális esete, melynél a tanító pontokhoz nem ismert a pontos címke, csak egy címke halmaz és feltételezzük, hogy ezek közül pontosan egy a valódi elvárt kimenet. Ilyen adathalmazok sok klasszikus problémánál előállhatnak, például látens változók, emberi hibák vagy automatikus címkézés eredményeképp.


Az előadás során bemutatjuk a részlegesen címkézett adatokból tanulás sajátosságait és megmutatjuk, hogy a klasszikus felügyelt osztályozásnál használt módszerek naív adaptációja milyen anomáliához vezethet. Ezután áttekintjük az irodalomban előkerült főbb megoldási stratégiákat.

Downloads