Domov Osobní finance Práce s daty grafů v Pythonu pro datovou vědu - figuríny

Práce s daty grafů v Pythonu pro datovou vědu - figuríny

Obsah:

Video: Azure Friday | Azure Notebooks 2025

Video: Azure Friday | Azure Notebooks 2025
Anonim

Většina vědců v oblasti dat musí v určitém okamžiku pracovat s údaji o grafech. Python vám dává tuto funkci. Představte si datové body, které jsou připojeny k jiným datovým bodům, například jak je jedna webová stránka propojena s jinou webovou stránkou přes hypertextové odkazy. Každý z těchto datových bodů je uzel . Uzly se vzájemně propojují pomocí odkazů .

Ne každý uzel odkazuje na každý jiný uzel, takže připojení uzlů se stává důležitým. Analýzou uzlů a jejich vazeb můžete provádět nejrůznější zajímavé úkoly v oblasti vědy o datech, například definovat nejlepší způsob, jak se dostat z práce do vašeho domova pomocí ulic a dálnic.

Pochopení matice sousedství

představuje spojení mezi uzly grafu. Pokud existuje spojení mezi uzly, matice to označuje jako hodnotu větší než 0. Přesné znázornění spojení v matici závisí na tom, zda je graf nasměrován (kde směr záležitosti má závislost) nebo neorientovaný.

Problémem mnoha příkladů online je to, že autoři jsou pro účely vysvětlení jednoduchí. Grafy v reálném světě jsou však často obrovské a vylučují snadnou analýzu prostě vizualizací. Jen si přemýšlejte o počtu uzlů, které by i malé město mělo při zvažování křižovatky ulic. Mnoho dalších grafů je mnohem větší a prostě se na ně díváte, nikdy neukáže žádné zajímavé vzory. Vědci z oblasti vědy nazývají problém při prezentaci libovolného složitého grafu s použitím adjacency matice vlasové koule .

Jedním z klíčů pro analýzu matric s přilehlostí je jejich třídění určitými způsoby. Můžete například zvolit řazení dat podle jiných vlastností, než jsou skutečná připojení. Graf spojů na ulici může obsahovat datum, kdy byla ulice naposledy dlážděna daty, což vám umožní hledat vzory, které nasměrují někoho na ulicích, které jsou v nejlepším stavu. Stručně řečeno, učinit z grafu užitečná data se stává záležitostí manipulace s organizací těchto dat určitými způsoby.

Používání základních funkcí sítě NetworkX

Práce s grafy by se mohla stát obtížná, kdybyste museli zapsat celý kód od začátku. Naštěstí balíček NetworkX pro Python usnadňuje vytváření, manipulaci a studium struktury, dynamiky a funkcí komplexních sítí (nebo grafů). Balík můžete použít i pro práci s grafy a multigrafiky.

Hlavním důrazem sítě NetworkX je vyhnout se celému problému koulí.Použití jednoduchých hovorů skrývá většinu složitosti práce s grafy a adjacency maticemi z pohledu. Následující příklad ukazuje, jak vytvořit základní matici adjacency z jednoho z grafů dodaných v NetworkX:

import networkx jako nx G = nx. cyklus_grafu (10) A = nx. adjacency_matrix (G) print (A. todense ())

Příklad začíná importováním požadovaného balíčku. Potom vytvoří graf pomocí šablony cycle_graph (). Graf obsahuje deset uzlů. Volání adjacency_matrix () vytvoří matici adjacency z grafu. Posledním krokem je vytisknout výstup jako matici, jak je zde zobrazeno:

[[0 1 0 0 0 0 0 0 0 1] [1 0 1 0 0 0 0 0 0 0] [0 1 0 1 0 0 0 0 0 0] [0 0 0 0 0 0 0 0 0 0] [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0 vytvořte svůj vlastní graf od začátku pro účely testování. Stránka NetworkX dokumentuje řadu standardních typů grafů, které můžete použít, které jsou všechny dostupné v rámci IPythonu.

Je zajímavé vidět, jak se graf stará po vygenerování. Následující kód zobrazuje graf pro vás.

Vykreslení původního grafu.

import matplotlib. pyplot jako plt nx. draw_networkx (G) plt. show ()
Graf ukazuje, že můžete přidat hranu mezi uzly 1 a 5. Zde je kód potřebný k provedení této úlohy pomocí funkce add_edge ().

Vykreslení grafu.

G. add_edge (1, 5) nx. draw_networkx (G) plt. show ()
Práce s daty grafů v Pythonu pro datovou vědu - figuríny

Výběr redakce

Rozdělit data do více sloupců v aplikaci Excel 2007 - figuríny

Rozdělit data do více sloupců v aplikaci Excel 2007 - figuríny

Použijte Průvodce převedením textu na sloupce v aplikaci Excel 2007 když potřebujete rozdělit kombinovaná data do samostatných sloupců, například křestní jméno a příjmení; nebo město, stát a PSČ. Tento typ kombinovaných dat často vyplývá, když otevíráte nebo importujete soubory vytvořené v jiné aplikaci.

Rychlost zadávání dat pomocí funkce Automatické vyplňování aplikace Excel 2010 - figuríny

Rychlost zadávání dat pomocí funkce Automatické vyplňování aplikace Excel 2010 - figuríny

Na základě údajů, které zadáte do jedné nebo dvou buněk. Funkce Automatické naplnění pracuje s dny v týdnu, měsíci v roce a ročními čtvrtletí. Chcete-li použít řadu čísel automatické vyplňování, zadejte dvě hodnoty ve dvou sousedních buňkách, ...

Výběr redakce

Jak upřednostnit velkou kvalitu dat - figuríny

Jak upřednostnit velkou kvalitu dat - figuríny

Získání správného pohledu na kvalitu dat může být ve světě velmi náročné velkých dat. S většinou velkých zdrojů dat je třeba předpokládat, že pracujete s daty, která nejsou čistá. Ve skutečnosti je ohromné ​​množství zdánlivě náhodných a odpojených dat v tocích dat v sociálních médiích ...

Instalace Pythonu v systému MacOS pro práci s algoritmy - dummy

Instalace Pythonu v systému MacOS pro práci s algoritmy - dummy

Instalace Mac OS X přichází pouze v jedné formě : 64bitové. Před provedením instalace musíte stáhnout kopii softwaru Mac z webu Continuum Analytics. Instalační soubory se dodávají ve dvou formách. První závisí na grafickém instalačním programu; druhá se spoléhá na příkazový řádek. Verze příkazového řádku ...

Integraci velkých dat do tradičního datového skladu

Integraci velkých dat do tradičního datového skladu

, Zatímco ve světě velkých dat a tradičních dat skladu se bude protínají, je nepravděpodobné, že se budou sloučit v dohledné době. Myslete na datový sklad jako systém záznamu pro business intelligence, podobně jako řízení vztahů se zákazníky (CRM) nebo účetní systém. Tyto systémy jsou vysoce strukturované a optimalizované pro konkrétní účely. Navíc ...

Výběr redakce

Plánování prezentace PowerPoint v Office 2008 pro Mac - figuríny

Plánování prezentace PowerPoint v Office 2008 pro Mac - figuríny

Plánování může jít dlouhou cestu k vytvoření váš Office 2008 pro Mac PowerPoint je ještě lepší. Ačkoli vytváření prezentací v PowerPointu není těžké, vytváření dobrých, nezapomenutelných z nich přemýšlí a plánuje. Před zahájením práce na prezentaci prezentací aplikace PowerPoint zvažte následující návrhy. Použijte pravidlo 10/20/30 Zde je nějaká vynikající rada aplikace PowerPoint od ...

Vložte logo společnosti do rohu všech prezentací PowerPoint - figuríny

Vložte logo společnosti do rohu všech prezentací PowerPoint - figuríny

Logo společnosti roh všech prezentací aplikace PowerPoint v prezentaci informuje diváky v nejistých termínech, které společnosti přednášející pracuje. A také firemní logo vypadá dobře. Chcete-li na všechny snímky umístit logo (nebo jiný obrázek), začněte tím, že obdržíte obrázek v grafickém souboru. Pak umístěte ...

Obnovit grafiku v aplikaci PowerPoint 2007 - figuríny

Obnovit grafiku v aplikaci PowerPoint 2007 - figuríny

Obnovit grafiku v aplikaci PowerPoint 2007, barva. Změna barvy vám dává grafickou verzi aplikace PowerPoint jednotnou barvu. Znovu načrtnutá grafika je užitečná pro pozadí. Vyberte grafiku a proveďte následující kroky k obnovení grafiky: