Domov Osobní finance Vizualizovat analytické výsledky vašeho prediktivního modelu

Vizualizovat analytické výsledky vašeho prediktivního modelu

Obsah:

Video: Product Design Suite - Test Drive, Simulace v Inventor Professional (CZ titulky) 2025

Video: Product Design Suite - Test Drive, Simulace v Inventor Professional (CZ titulky) 2025
Anonim

Často musíte být schopni zobrazit výsledky své prediktivní analýzy těm, na kterých záleží. Zde jsou některé způsoby, jak využít vizualizační techniky k oznamování výsledků vašich modelů zúčastněným stranám.

Zobrazování skrytých seskupení ve vašich datech

Datové seskupování je proces objevování skrytých skupin souvisejících položek v rámci vašich dat. Ve většině případů obsahuje cluster (seskupování) datové objekty stejného typu, jako jsou uživatelé sociálních sítí, textové dokumenty nebo e-maily. Jeden způsob, jak vizualizovat výsledky modelu clustering dat, je uveden níže, kde graf představuje sociální skupiny (clustery), které byly objeveny v datech shromážděných od uživatelů sociálních sítí.

Údaje o zákaznících byly shromážděny v tabulkovém formátu; pak byl algoritmus shlukování aplikován na data a tři skupiny (skupiny) byly objeveny: věrní zákazníci, putující zákazníci a zákazníci slev. Předpokládejme, že osy X a Y představují dvě hlavní součásti generované původními daty. Analýza hlavních komponent (PCA) je technikou snižování dat.

Clustering zákazníků ve třech skupinách: loajální, putování a slevy.

Vizuální vztah mezi těmito třemi skupinami již naznačuje, kde by zvýšené a cílené marketingové úsilí mohlo být prospěšné.

Zobrazení výsledků klasifikace dat

Model klasifikace přiřazuje konkrétní třídu každému novému datovému bodu, který zkoumá. Konkrétní třídy, v tomto případě by mohly být skupiny, které jsou výsledkem vašeho seskupování. Výstup zvýrazněný v grafu může definovat vaše cílové množiny. Pro každého nového zákazníka se model prediktivní klasifikace pokouší předpovědět, do které skupiny bude nový zákazník patřit.

Po použití clusteringového algoritmu a objevování seskupení v zákaznických datech se dostanete do okamžiku pravdy: Přichází nový zákazník - chcete, aby model předpovídal, který typ zákazníka nebo to bude.

Obrázek ukazuje, jak jsou informace o novém zákazníkovi přiváděny do modelu prediktivní analýzy, což pak předpovídá, do které skupiny zákazníků patří tento nový zákazník. Noví zákazníci A, B a C se chtějí přiřadit klastrům podle klasifikačního modelu. Použití klasifikačního modelu vedlo k predikci, že zákazník A by patřil k věrným zákazníkům, zákazník B by byl cestujícím a zákazník C se objevil pouze pro slevu.

Přiřazení zákazníků A, B a C k jejich klasifikacím (clustery).

Zobrazování extrémních hodnot ve vašich datech

V průběhu seskupování nebo klasifikace nových zákazníků narazíte na extrémy (zvláštní případy, které neodpovídají stávajícím divizím).

Níže vidíte několik odlehčených hodnot, které se dobře nezapadají do předdefinovaných klastrů. Bylo zjištěno a vizualizováno šest odlehlých zákazníků. Chovají se natolik odlišně, že model neumí zjistit, zda patří ke kterékoli ze stanovených kategorií zákazníků.

Šest odlehčených zákazníků nepopírá kategorizaci právě tím, že se objeví.

Vizualizace rozhodovacích stromů

Mnohé modely používají jako výstupy rozhodovací stromy: Tyto diagramy ukazují možné výsledky z alternativních akčních postupů, vytyčených jako větve stromu.

Níže uvedený obrázek ukazuje příklad stromu používaného jako klasifikátor: klasifikuje fanoušky baseballu na základě několika kritérií, zejména částku vynaloženou na vstupenky a data nákupu. Z této vizualizace můžete předpovídat typ ventilátoru, který bude nový kupující vstupenek: příležitostný, loajální, roztomilý, nešťastný nebo nějaký jiný typ.

Atributy každého fanouška jsou uvedeny na každé úrovni ve stromu (celkový počet navštěvovaných her, celková částka strávená, sezóna); můžete sledovat cestu z určitého "kořenu" na konkrétní "list" stromu, kde narazíte na jednu z tříd fanoušků (c1, c2, c3, c4, c5).

Hledání třídy, do které patří určitý baseballový ventilátor.

Předpokládejme, že chcete zjistit typ fanoušky baseballu, který zákazník nabízí, abyste mohli určit, jaký typ marketingových reklam je zákazníkovi odeslán. Předpokládejme, že hypotéza, že fanoušci baseballu a fanoušci mohou být přesvědčeni, aby si koupili nové auto, když se jejich tým dobře daří a zamířil do play-off.

Možná budete chtít poslat marketingové reklamy a slevy, abyste je přesvědčili, aby uskutečnili nákup. Dále předpokládejme hypotézu, že fanoušci mohou být přesvědčeni, aby hlasovali na podporu určitých politických otázek. Můžete jim posílat marketingové reklamy, které si od nich vyžádají podporu. Pokud víte, jaký typ základny fanoušků máte, rozhodovací stromy vám pomohou rozhodnout, jak se k němu přiblížit jako řada typů zákazníků.

Zobrazení předpovědí

Předpokládejme, že jste spustili řadu prediktivních modelů analýzy, včetně rozhodovacích stromů, náhodných lesů a algoritmů vločkování. Můžete kombinovat všechny tyto výsledky a prezentovat konzistentní vyprávění, které všechny podporují. Zde důvěra je číselné procento, které lze vypočítat pomocí matematické funkce. Výsledek výpočtu zapíše skóre toho, jak je pravděpodobný možný výskyt.

Na ose x jsou podpůrné důkazy zdrojem obsahu, který byl analyzován pomocí modelů analýzy obsahu, které identifikovaly možné výsledky. Ve většině případů by váš předpovědní model zpracoval rozsáhlou datovou množinu s použitím dat z různých zdrojů, aby odvodil tyto možné výsledky. Proto potřebujete ukázat pouze ty nejdůležitější podpůrné důkazy ve své vizualizaci.

Zobrazují se pouze ty nejdůležitější podpůrné důkazy ve vizualizaci.

Nahoru shrnutí výsledků získaných z použití prediktivní analýzy je prezentováno jako vizualizace, která ilustruje možné výsledky, spolu s důvěryhodností a podpůrnými důkazy pro každý z nich. Zobrazí se tři možné scénáře:

  • Seznam položky A nebude držet krok s poptávkou, pokud nebudete odesílat nejméně 100 jednotek týdně do obchodu S. (Skóre spolehlivosti: 98 procent.)
  • Počet prodejů se zvýší o 40 procent, pokud zvýšíte produkci položky A alespoň o 56 procent. (Skóre důvěry: 83 procent.)
  • Marketingová kampaň v Kalifornii zvýší tržby položek A a D, ale ne u položky K. (Skóre důvěryhodnosti: 72 procent.)

Skóre spolehlivosti představuje pravděpodobnost, že každý scénář podle vašeho prediktivního modelu analýzy. Všimněte si, že jsou zde uvedeny v sestupném pořadí pravděpodobnosti.

Zde jsou nejdůležitější podpůrné důkazy o tom, jak jsou z osy x prezentovány výňatky z několika zdrojů obsahu. Můžete se na ně obrátit, pokud potřebujete vysvětlit, jak se dostáváte k určitému možnému scénáři - a vyhnat se důkazům, které ho podporují.

Výkonnost této vizualizace je její jednoduchost. Představte si, že po několika měsících předkládání prediktivních analýz vašim datům, procházením několika opakováními, se můžete setkat s rozhodovateli. Jste ozbrojeni jednou vizualizací snímků ze tří možných scénářů, které by mohly mít obrovský dopad na podnikání. Taková vizualizace vytváří efektivní diskuse a může vést řízení k "aha" momentům.

Vizualizovat analytické výsledky vašeho prediktivního modelu

Výběr redakce

Rozdělit data do více sloupců v aplikaci Excel 2007 - figuríny

Rozdělit data do více sloupců v aplikaci Excel 2007 - figuríny

Použijte Průvodce převedením textu na sloupce v aplikaci Excel 2007 když potřebujete rozdělit kombinovaná data do samostatných sloupců, například křestní jméno a příjmení; nebo město, stát a PSČ. Tento typ kombinovaných dat často vyplývá, když otevíráte nebo importujete soubory vytvořené v jiné aplikaci.

Rychlost zadávání dat pomocí funkce Automatické vyplňování aplikace Excel 2010 - figuríny

Rychlost zadávání dat pomocí funkce Automatické vyplňování aplikace Excel 2010 - figuríny

Na základě údajů, které zadáte do jedné nebo dvou buněk. Funkce Automatické naplnění pracuje s dny v týdnu, měsíci v roce a ročními čtvrtletí. Chcete-li použít řadu čísel automatické vyplňování, zadejte dvě hodnoty ve dvou sousedních buňkách, ...

Výběr redakce

Jak upřednostnit velkou kvalitu dat - figuríny

Jak upřednostnit velkou kvalitu dat - figuríny

Získání správného pohledu na kvalitu dat může být ve světě velmi náročné velkých dat. S většinou velkých zdrojů dat je třeba předpokládat, že pracujete s daty, která nejsou čistá. Ve skutečnosti je ohromné ​​množství zdánlivě náhodných a odpojených dat v tocích dat v sociálních médiích ...

Instalace Pythonu v systému MacOS pro práci s algoritmy - dummy

Instalace Pythonu v systému MacOS pro práci s algoritmy - dummy

Instalace Mac OS X přichází pouze v jedné formě : 64bitové. Před provedením instalace musíte stáhnout kopii softwaru Mac z webu Continuum Analytics. Instalační soubory se dodávají ve dvou formách. První závisí na grafickém instalačním programu; druhá se spoléhá na příkazový řádek. Verze příkazového řádku ...

Integraci velkých dat do tradičního datového skladu

Integraci velkých dat do tradičního datového skladu

, Zatímco ve světě velkých dat a tradičních dat skladu se bude protínají, je nepravděpodobné, že se budou sloučit v dohledné době. Myslete na datový sklad jako systém záznamu pro business intelligence, podobně jako řízení vztahů se zákazníky (CRM) nebo účetní systém. Tyto systémy jsou vysoce strukturované a optimalizované pro konkrétní účely. Navíc ...

Výběr redakce

Plánování prezentace PowerPoint v Office 2008 pro Mac - figuríny

Plánování prezentace PowerPoint v Office 2008 pro Mac - figuríny

Plánování může jít dlouhou cestu k vytvoření váš Office 2008 pro Mac PowerPoint je ještě lepší. Ačkoli vytváření prezentací v PowerPointu není těžké, vytváření dobrých, nezapomenutelných z nich přemýšlí a plánuje. Před zahájením práce na prezentaci prezentací aplikace PowerPoint zvažte následující návrhy. Použijte pravidlo 10/20/30 Zde je nějaká vynikající rada aplikace PowerPoint od ...

Vložte logo společnosti do rohu všech prezentací PowerPoint - figuríny

Vložte logo společnosti do rohu všech prezentací PowerPoint - figuríny

Logo společnosti roh všech prezentací aplikace PowerPoint v prezentaci informuje diváky v nejistých termínech, které společnosti přednášející pracuje. A také firemní logo vypadá dobře. Chcete-li na všechny snímky umístit logo (nebo jiný obrázek), začněte tím, že obdržíte obrázek v grafickém souboru. Pak umístěte ...

Obnovit grafiku v aplikaci PowerPoint 2007 - figuríny

Obnovit grafiku v aplikaci PowerPoint 2007 - figuríny

Obnovit grafiku v aplikaci PowerPoint 2007, barva. Změna barvy vám dává grafickou verzi aplikace PowerPoint jednotnou barvu. Znovu načrtnutá grafika je užitečná pro pozadí. Vyberte grafiku a proveďte následující kroky k obnovení grafiky: