Domov Osobní finance Správa souborů s příkazy Hadoop File System - figuríny

Správa souborů s příkazy Hadoop File System - figuríny

Video: How to Install Hadoop on Windows 2025

Video: How to Install Hadoop on Windows 2025
Anonim

HDFS je jednou ze dvou hlavních součástí rámce Hadoop; druhá je výpočetní paradigma známá jako MapReduce. distribuovaný souborový systém je souborový systém, který spravuje ukládání v síťovém clusteru počítačů.

HDFS ukládá data do bloků , jejichž výchozí velikost je 64 MB. Soubory, které chcete uložit do formátu HDFS, je třeba rozdělit na bloky velikosti bloků, které jsou pak uloženy nezávisle na celém clusteru. Pomocí příkazu řádku fsck můžete seznam bloků, které tvoří každý soubor v HDFS, takto:

% hadoop fsck / -files -bloky

Protože Hadoop je napsán v jazyce Java, všechny interakce s HDFS jsou spravovány pomocí Java API. Mějte však na paměti, že nemusíte být Java guru pracující se soubory v HDFS. Několik rozhraní Hadoop postavených na rozhraní Java API se nyní běžně používá (a skrývá Java), ale nejjednodušší je rozhraní příkazového řádku; použijte příkazový řádek k interakci s HDFS v uvedených příkladech.

Přístup k shellu souborového systému Hadoop spuštěním jedné formy příkazu hadoop. Všechny příkazy hadoop jsou vyvolány skriptem bin / hadoop. (Chcete-li získat popis všech příkazů hadoop, spusťte hadoopový skript bez zadání argumentů.) Příkaz hadoop má syntaxi

hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]

config confdir přepíše výchozí konfigurační adresář ($ HADOOP_HOME / conf), takže můžete snadno přizpůsobit konfiguraci prostředí Hadoop. Obecné možnosti a možnosti příkazu jsou společnou sadou možností, které jsou podporovány několika příkazy.

Příkazy shellu souborového systému Hadoop (pro rozhraní příkazového řádku) považují za argumenty jednotné identifikátory zdrojů (URI). URI je řetězec znaků, který se používá k identifikaci jména nebo webového zdroje.

Řetězec může obsahovat název schématu - kvalifikátor povahy zdroje dat. U HDFS je název schématu hdfs a pro místní souborový systém je název schématu. Pokud nezadáte název schématu, výchozí je název schématu, který je uveden v konfiguračním souboru. Soubor nebo adresář v HDFS lze zadat plně kvalifikovaným způsobem, například v tomto příkladu:

hdfs: // namenodehost / parent / child

Nebo může být jednoduše / rodič / dítě, do hdfs: // namenodehost.

Příkazy shellu souborového systému Hadoop, které jsou podobné příkazům souborového systému Linux, mají následující obecnou syntaxi:

hadoop hdfs dfs - file_cmd

Čtenáři s některou předchozí zkušeností Hadoop by se mohli zeptat: "Ale co o příkazu hadoop fs?"Příkaz fs je zastaralý ve verzi vydání Hadoop 0. 2, ale stále funguje v Hadoopu 2. Místo toho použijte hdfs dfs.

Jak můžete očekávat, použijete příkaz mkdir k vytvoření adresáře v HDFS, stejně jako u operačních systémů Linux nebo Unix. Ačkoli HDFS má výchozí pracovní adresář, / user / $ USER, kde $ USER je vaše přihlašovací uživatelské jméno, musíte jej vytvořit sami pomocí syntaxe

$ hadoop hdfs dfs -mkdir / user / login_user_name

Chcete-li například vytvořit adresář s názvem "joanna", spusťte tento příkaz mkdir:

$ hadoop hdfs dfs -mkdir / user / joanna

místní souborový systém do formátu HDFS:

$ hadoop hdfs dfs -put jméno_souboru / user / login_user_name

Například kopírovat soubor s názvem data. txt do tohoto nového adresáře, spusťte následující příkaz put:

$ hadoop hdfs dfs -put data. txt / user / joanna

Spusťte příkaz ls pro zobrazení souboru HDFS:

$ hadoop hdfs dfs -ls. Nalezeno 2 položek drwxr-xr-x - joanna supergroup 0 2013-06-30 12: 25 / user / joanna -rw-r- r-- 1 joanna supergroup 118 2013-06-30 12: 15 / user / joanna / data. txt

Seznam souborů se rozděluje podle popisu v tomto seznamu:

  • Sloupec 1 zobrazuje režim souboru ("d" pro adresář a "-" pro normální soubor,. Ty tři typy oprávnění - čtení (r), zápis (w) a spuštění (x) - jsou stejné jako ty, které najdete na systémech Linux a Unix. Oprávnění k provedení souboru je ignorováno, protože v souboru HDFS nelze spustit soubor. Povolení jsou seskupena podle vlastníka, skupiny a veřejnosti (všichni ostatní).

  • Sloupec 2 zobrazuje faktor replikace souborů. (Koncepce replikace se nevztahuje na adresáře.) Bloky, které tvoří soubor v HDFS, jsou replikovány, aby se zajistila tolerance chyb. Replikační faktor , nebo počet replik uložených pro určitý soubor, je konfigurovatelný. Můžete zadat faktor replikace při vytváření souboru nebo později prostřednictvím aplikace.

  • Sloupce 3 a 4 zobrazují soubor vlastník a skupina . Supergroup je jméno skupiny superuserů a superuser je uživatel se stejnou identitou jako proces NameNode. Pokud spustíte NameNode, jste pro tuto chvíli superuser. Jedná se o speciální skupinu - běžní uživatelé budou mít své uživatelské nástroje patří do skupiny bez zvláštních vlastností - skupiny, kterou jednoduše definuje správce Hadoop.

  • Sloupec 5 zobrazuje velikost souboru v bajtech nebo 0, pokud je adresář.

  • Sloupce 6 a 7 zobrazují datum a čas poslední úpravy.

  • Sloupec 8 zobrazuje název bez oprávnění (tj. Název souboru není zadán) souboru nebo adresáře.

Použijte příkaz Hadoop get pro zkopírování souboru z HDFS do místního souborového systému:

$ hadoop hdfs dfs -get jméno_souboru / user / login_user_name

příkaz k odstranění souboru nebo prázdného adresáře:

$ hadoop hdfs dfs -rm jméno_souboru / user / login_user_name

Pomocí příkazu hadoop hdfs dfs -help získáte podrobnou pomoc volba.

Správa souborů s příkazy Hadoop File System - figuríny

Výběr redakce

Jak vybrat správné písmo pro infografiku - figuríny

Jak vybrat správné písmo pro infografiku - figuríny

Se trochu odnesly všechny vzrušující možnosti pro ilustraci zpráv. Hodně z práce bylo kresleno ručně, včetně titulků. Mnoho lidí používalo fonty, které viděli v časopisech, na obálech alb nebo na billboardech. Ty fonty vypadaly skvěle v té době, ...

Jak sbírat vlivy pro Infografics - dummies

Jak sbírat vlivy pro Infografics - dummies

To je čas. Všechna tvrdá práce při vytváření infografy jsou hotová a je na čase propagovat vaše infographic na světě. Hodně jezdit o tom, jak bude pokračovat další fáze. Koneckonců, nikdo nechce investovat zdroje, čas a peníze do budování infografy a pak nechat nikam jít. Takže ...

Jak přizpůsobit Adobe Illustrator pro tvorbu infographics - figuríny

Jak přizpůsobit Adobe Illustrator pro tvorbu infographics - figuríny

Adobe Illustrator je nejvíce preferovaný program pro tvorbu infografií . Zvykat si pracovat v aplikaci Adobe Illustrator je trochu jako přesun do nové čtvrti. Pomalu se učíte, kdo má rád chat, který si rád udržuje sebe sama, který si udržuje svůj dvůr pěkný a kdo operuje na operaci v 6 a. m. Představte si, že byste mohli ...

Výběr redakce

Otázky matematiky aCT: Logaritmy - dummies

Otázky matematiky aCT: Logaritmy - dummies

, Možná budete chtít udělat nějaké studium předtím, než přijme ACT Math zkoušku. Poté se můžete vrátit a řešit následující praktické otázky, kde musíte použít vlastnosti logaritmu pro řešení dvou různých rovnic. Praktické otázky Pokud ...

Otázky matematiky aCT: poměry - figuríny

Otázky matematiky aCT: poměry - figuríny

Nula špatných odpovědí na ACT Math zkoušku, pak byste měli určitě vyčistit vaše dovednosti poměru. V následujících praktických otázkách použijete poměry pro určení možných násobků dvou čísel a pak pro výpočet správných proporcí ...

Otázky matematiky aCT: Nastavení algebraických vzorců - figuríny

Otázky matematiky aCT: Nastavení algebraických vzorců - figuríny

Zobrazí vám problém se slovem, který vás požádá, abyste nastavili algebraický vzorec, který by problém vyřešil. Nervový? Nebuď. Místo toho se pokuste ohybnout vaše svaly pro formulaci následujících praktických otázek. Otázky k praxi Když jste se zeptali, kolik let pracovala na svém zaměstnání, Leah ...

Výběr redakce

Vytvořit standardní zobrazení v aplikaci SharePoint 2010 - dummy

Vytvořit standardní zobrazení v aplikaci SharePoint 2010 - dummy

Nejběžnější zobrazení, které vytvoříte v aplikaci SharePoint 2010 seznam nebo knihovna je veřejný standardní pohled. Veřejné zobrazení může být použito kdokoliv k zobrazení obsahu seznamu nebo knihovny. Zobrazení standardů mají následující vlastnosti: Jsou přístupné všem prohlížečům, včetně prohlížeče Firefox. Mají nejvíce konfiguraci ...

Vytvoření standardního zobrazení v aplikaci SharePoint 2016 App-dummies

Vytvoření standardního zobrazení v aplikaci SharePoint 2016 App-dummies

SharePoint 2016 nabízí několik předformátovaných stylů zobrazení můžete ovládat zobrazení vašeho zobrazení. Výchozí styl zobrazení zobrazuje data aplikací v řádcích. Můžete použít několik dalších stylů. Mnoho z nich je obzvláště užitečné při konfiguraci webových částí aplikace: Základní tabulka zobrazuje data aplikace v jednoduché tabulce. Boxed ...