Obsah:
- Zobrazování skrytých seskupení ve vašich datech
- Zobrazení výsledků klasifikace dat
- Zobrazování extrémních hodnot ve vašich datech
- Vizualizace rozhodovacích stromů
- Zobrazení předpovědí
Video: Product Design Suite - Test Drive, Simulace v Inventor Professional (CZ titulky) 2025
Často musíte být schopni zobrazit výsledky své prediktivní analýzy těm, na kterých záleží. Zde jsou některé způsoby, jak využít vizualizační techniky k oznamování výsledků vašich modelů zúčastněným stranám.
Zobrazování skrytých seskupení ve vašich datech
Datové seskupování je proces objevování skrytých skupin souvisejících položek v rámci vašich dat. Ve většině případů obsahuje cluster (seskupování) datové objekty stejného typu, jako jsou uživatelé sociálních sítí, textové dokumenty nebo e-maily. Jeden způsob, jak vizualizovat výsledky modelu clustering dat, je uveden níže, kde graf představuje sociální skupiny (clustery), které byly objeveny v datech shromážděných od uživatelů sociálních sítí.
Údaje o zákaznících byly shromážděny v tabulkovém formátu; pak byl algoritmus shlukování aplikován na data a tři skupiny (skupiny) byly objeveny: věrní zákazníci, putující zákazníci a zákazníci slev. Předpokládejme, že osy X a Y představují dvě hlavní součásti generované původními daty. Analýza hlavních komponent (PCA) je technikou snižování dat.
Vizuální vztah mezi těmito třemi skupinami již naznačuje, kde by zvýšené a cílené marketingové úsilí mohlo být prospěšné.
Zobrazení výsledků klasifikace dat
Model klasifikace přiřazuje konkrétní třídu každému novému datovému bodu, který zkoumá. Konkrétní třídy, v tomto případě by mohly být skupiny, které jsou výsledkem vašeho seskupování. Výstup zvýrazněný v grafu může definovat vaše cílové množiny. Pro každého nového zákazníka se model prediktivní klasifikace pokouší předpovědět, do které skupiny bude nový zákazník patřit.
Po použití clusteringového algoritmu a objevování seskupení v zákaznických datech se dostanete do okamžiku pravdy: Přichází nový zákazník - chcete, aby model předpovídal, který typ zákazníka nebo to bude.
Obrázek ukazuje, jak jsou informace o novém zákazníkovi přiváděny do modelu prediktivní analýzy, což pak předpovídá, do které skupiny zákazníků patří tento nový zákazník. Noví zákazníci A, B a C se chtějí přiřadit klastrům podle klasifikačního modelu. Použití klasifikačního modelu vedlo k predikci, že zákazník A by patřil k věrným zákazníkům, zákazník B by byl cestujícím a zákazník C se objevil pouze pro slevu.
Zobrazování extrémních hodnot ve vašich datech
V průběhu seskupování nebo klasifikace nových zákazníků narazíte na extrémy (zvláštní případy, které neodpovídají stávajícím divizím).
Níže vidíte několik odlehčených hodnot, které se dobře nezapadají do předdefinovaných klastrů. Bylo zjištěno a vizualizováno šest odlehlých zákazníků. Chovají se natolik odlišně, že model neumí zjistit, zda patří ke kterékoli ze stanovených kategorií zákazníků.
Vizualizace rozhodovacích stromů
Mnohé modely používají jako výstupy rozhodovací stromy: Tyto diagramy ukazují možné výsledky z alternativních akčních postupů, vytyčených jako větve stromu.
Níže uvedený obrázek ukazuje příklad stromu používaného jako klasifikátor: klasifikuje fanoušky baseballu na základě několika kritérií, zejména částku vynaloženou na vstupenky a data nákupu. Z této vizualizace můžete předpovídat typ ventilátoru, který bude nový kupující vstupenek: příležitostný, loajální, roztomilý, nešťastný nebo nějaký jiný typ.
Atributy každého fanouška jsou uvedeny na každé úrovni ve stromu (celkový počet navštěvovaných her, celková částka strávená, sezóna); můžete sledovat cestu z určitého "kořenu" na konkrétní "list" stromu, kde narazíte na jednu z tříd fanoušků (c1, c2, c3, c4, c5).
Předpokládejme, že chcete zjistit typ fanoušky baseballu, který zákazník nabízí, abyste mohli určit, jaký typ marketingových reklam je zákazníkovi odeslán. Předpokládejme, že hypotéza, že fanoušci baseballu a fanoušci mohou být přesvědčeni, aby si koupili nové auto, když se jejich tým dobře daří a zamířil do play-off.
Možná budete chtít poslat marketingové reklamy a slevy, abyste je přesvědčili, aby uskutečnili nákup. Dále předpokládejme hypotézu, že fanoušci mohou být přesvědčeni, aby hlasovali na podporu určitých politických otázek. Můžete jim posílat marketingové reklamy, které si od nich vyžádají podporu. Pokud víte, jaký typ základny fanoušků máte, rozhodovací stromy vám pomohou rozhodnout, jak se k němu přiblížit jako řada typů zákazníků.
Zobrazení předpovědí
Předpokládejme, že jste spustili řadu prediktivních modelů analýzy, včetně rozhodovacích stromů, náhodných lesů a algoritmů vločkování. Můžete kombinovat všechny tyto výsledky a prezentovat konzistentní vyprávění, které všechny podporují. Zde důvěra je číselné procento, které lze vypočítat pomocí matematické funkce. Výsledek výpočtu zapíše skóre toho, jak je pravděpodobný možný výskyt.
Na ose x jsou podpůrné důkazy zdrojem obsahu, který byl analyzován pomocí modelů analýzy obsahu, které identifikovaly možné výsledky. Ve většině případů by váš předpovědní model zpracoval rozsáhlou datovou množinu s použitím dat z různých zdrojů, aby odvodil tyto možné výsledky. Proto potřebujete ukázat pouze ty nejdůležitější podpůrné důkazy ve své vizualizaci.
Nahoru shrnutí výsledků získaných z použití prediktivní analýzy je prezentováno jako vizualizace, která ilustruje možné výsledky, spolu s důvěryhodností a podpůrnými důkazy pro každý z nich. Zobrazí se tři možné scénáře:
- Seznam položky A nebude držet krok s poptávkou, pokud nebudete odesílat nejméně 100 jednotek týdně do obchodu S. (Skóre spolehlivosti: 98 procent.)
- Počet prodejů se zvýší o 40 procent, pokud zvýšíte produkci položky A alespoň o 56 procent. (Skóre důvěry: 83 procent.)
- Marketingová kampaň v Kalifornii zvýší tržby položek A a D, ale ne u položky K. (Skóre důvěryhodnosti: 72 procent.)
Skóre spolehlivosti představuje pravděpodobnost, že každý scénář podle vašeho prediktivního modelu analýzy. Všimněte si, že jsou zde uvedeny v sestupném pořadí pravděpodobnosti.
Zde jsou nejdůležitější podpůrné důkazy o tom, jak jsou z osy x prezentovány výňatky z několika zdrojů obsahu. Můžete se na ně obrátit, pokud potřebujete vysvětlit, jak se dostáváte k určitému možnému scénáři - a vyhnat se důkazům, které ho podporují.
Výkonnost této vizualizace je její jednoduchost. Představte si, že po několika měsících předkládání prediktivních analýz vašim datům, procházením několika opakováními, se můžete setkat s rozhodovateli. Jste ozbrojeni jednou vizualizací snímků ze tří možných scénářů, které by mohly mít obrovský dopad na podnikání. Taková vizualizace vytváří efektivní diskuse a může vést řízení k "aha" momentům.
