Az aggregálás jelentése és alkalmazása

Az aggregálás - más néven: dimenziócsökkentés, adatredukció- két vagy több objektum egy objektummá való egyesítését jelenti.Ez egy olyan folyamat, amelynek során olyan közös mértékegységet alkotunk, amellyel mindkét minta esetében az egyes változók - az adott vizsgálat szempontjából - kifejezhetőek. Ez követően a különböző változók összehasonlíthatóvá válnak. Az aggregált sokaságok általában diszkrétek és folytonosak.

Az aggregálás eredményét aggregátumnak nevezzük, avagy összesített értékadatnak, amely gyakran önkényesen létrehozott, elvont statisztikai egység. A főkomponens- és a faktorelemzés is olyan adatredukciós eljárások, amelyek sok mért változóból kevés aggregált változót hoznak létre.

Példa: Egyes attribútumokat elhagyhatunk, vagy egy konkrét attribútum értékeinek számát csökkentjük, például a lehetséges dátumértékeket 365 napról 12 hónapra.

Mikor használjuk az aggregálás módszerét?

Amikor nagy az adatállomány és szeretnénk, hogy kevesebb memóriát és feldolgozási időt vegyen igénybe az elemzés folyamata.
Amikor alacsonyabb szintű, skálájú adatokat magasabb szintre akarunk emelni.
Amikor bizonyos sokaságok nem hasonlíthatók össze egymással, illetve nincs olyan közös ismérvük, mely mindegyik minta esetében azonos módon jelenik meg. Vagyis amikor különböző minőségű, eltérő mértékegységű változók együttes vizsgálatára van szükség.

Az aggregálás hátránya

Az aggregálás egyik hátránya annak a veszélye, hogy fontos részleteket veszítünk el. Például a dátumértékek napról hónapra való aggregálása során elvész az az információ, hogy az év melyik napjára mi a jellemző.

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük