Věda

Co je dolování dat? »Jeho definice a význam

Anonim

Dolování dat nebo dolování dat je proces klasifikace přes velké datové sady k identifikaci vzorců a navázání vztahů k řešení problémů pomocí analýzy dat. Nástroje pro dolování dat umožňují společnostem předvídat budoucí trendy.

V dolování dat jsou pravidla přidružení vytvářena analýzou dat pro časté vzory pomocí kritérií podpory a spolehlivosti k vyhledání nejdůležitějších vztahů v datech. Podpora je frekvence, s jakou se položky objevují v databázi, zatímco spolehlivost je počet přesných prohlášení.

Mezi další parametry dolování dat patří Sekvence nebo Analýza trasy, Klasifikace, Klastrování a Předpověď. Parametry Posloupnost nebo Analýza cesty hledají vzory, ve kterých jedna událost vede k další následné události. Sekvence je seřazený seznam sad položek a je běžným typem datové struktury nalezené v mnoha databázích. Parametr klasifikace hledá nové vzory a může mít za následek změnu ve způsobu uspořádání dat. Tyto klasifikační algoritmy předpovědět proměnných na základě jiných faktorů, v rámci databáze.

Seskupení parametrů vizuálně vyhledá a dokumentuje skupiny dříve neznámých skutečností. Seskupení seskupí sadu objektů a agreguje je podle toho, jak jsou si navzájem podobné.

Existuje několik způsobů, jak může uživatel nasadit klastr, a rozlišovat mezi jednotlivými modely klastru. Povzbuzení parametrů v rámci dolování dat může odhalit vzory v datech, které mohou vést k rozumným předpovědím o budoucnosti, známým také jako prediktivní analýza.

Techniky dolování dat se používají v mnoha oblastech výzkumu, včetně matematiky, kybernetiky, genetiky a marketingu. Zatímco techniky dolování dat jsou prostředkem zvyšování efektivity a předvídání chování zákazníků, pokud se používají správně, může se podnik odlišit od své konkurence pomocí prediktivní analýzy.

Web mining, typ dolování dat používaný při řízení vztahů se zákazníky, integruje informace shromážděné tradičními metodami a technikami dolování dat přes web. Cílem webové těžby je porozumět chování zákazníků a vyhodnotit efektivitu konkrétního webu.