Obohacení dat v ArcGIS Pro

19. 4. 2018
  • Desktopový GIS
  • ArcGIS Pro 1.2
  • ArcGIS Pro 1.3
  • ArcGIS Pro 1.4
  • ArcGIS Pro 2.0
  • ArcGIS Pro 2.1

V tomto článku pokračujeme v tématu statistického vyhodnocování dat pomocí R a ArcGIS Pro a navazujeme tak na příspěvky Analýza časoprostorových dat v ArcGIS ProPropojení ArcGIS Pro a R. Budeme se zabývat obohacením časoprostorových dat o další informace a budeme pokračovat s používáním datové sady a projektu vytvořeného v předchozím článku.

Ve sledované oblasti jsme nalezli místa s vysokou a nízkou intenzitou kriminality. Nyní, když víme KDE, chceme zjistit také PROČ. Hodláme analyzovat míru kriminality a počet obyvatel v oblasti, abychom zjistili, zda spolu tyto jevy souvisí. Následně zjistíme, zda je míra kriminality závislá na počtu provozoven, rozsahu zeleně, velikosti veřejného prostoru, průměrném příjmu domácností a ceně nemovitostí.

Tuto komplexnější analýzu nemůžeme provádět se stávající podobou časoprostorové kostky, kde jsme měli pouze počty kriminálních činů. Data tedy obohatíme o další atributy.

Spustíme nástroj Obohatit vrstvu. Tento nástroj je poskytován společností Esri a jeho použití spotřebovává kredity z organizace ArcGIS Online.

Jako parametry použijeme následující položky:

  • Vstupní prvky – vrstva San_Francisco_Crimes_Hot_Spots, kterou jsme vytvořili v minulém článku.
  • Výstupní třída prvkůSan_Francisco_Crimes_Enrich.shp, kterou uložíme do složky projektu.
  • Země – protože se celou dobu pohybujeme na území USA, zvolíme zde United States.
  • Sbírka dat – Z položek, které dostaneme na výběr, nejprve vybereme Key US Facts. Tento výběr nám nabídne sadu atributů pro obohacení, ze kterých vybereme 2010 Total Population, 2017 Median Home Value, 2017 Median Household Income2017 Renter Occupied HUs.
  • Sbírka dat – hodnotu v tomto poli změníme na Industry by NAICS. Počkáme, až se nám dostupné atributy v rozbalovacím menu níže aktualizují, a vybereme z nich následující: Food & Beverage Stores Bus, Food Service/Drinking Estab Bus.
  • Sbírka dat – naposledy změníme hodnotu na Landscape Facts a zde jako proměnnou vybereme % Forest (NLCD).

Nyní máme vše připraveno a můžeme nástroj spustit.

V obsahu pak nalezneme nově přidanou vrstvu San_Francisco_Crimes_Enrich. Když si otevřeme její atributovou tabulku, uvidíme hodnoty, které jsme získali obohacením původní vrstvy. Nyní vrstva obsahuje osm nových atributů:

  • HasData – Atribut značí, zda nástroj Obohatit vrstvu našel data pro daný šestiúhelník. Číslo 1 značí, že data jsou dostupná alespoň pro jeden z vybraných atributů, 0 značí, že nebylo možné najít data ani pro jeden. Atribut HasData bývá využíván pro filtraci obohacených dat.
  • TOTPOP10 – Značí počet obyvatel spadajících do šestiúhelníku. Šestiúhelníky s hodnotou 0 mohou spadat do neobydlených oblastí (parky, průmyslové oblasti apod.). V případě analýzy kriminality nám tento parametr pomůže se zaměřením na pouze obydlené oblasti.
  • MEDHINC_CY – Obsahuje medián příjmu domácností v daném šestiúhelníku.
  • RENTER_CY – Představuje počet nájemníků obývajících domy v daném šestiúhelníku.
  • MEDVAL_CY – Je mediánem hodnoty domů v daném šestiúhelníku.
  • N13_BUS – Obsahuje počet obchodů s jídlem a nápoji v daném šestiúhelníku.
  • N37_BUS –  Obsahuje počet restaurací, barů apod. v daném šestiúhelníku.
  • NLCDfrstPt – Představuje procentuální podíl zelené plochy v daném šestiúhelníku, která je klasifikována jako forest land v katalogu National Land Cover database.

V nově vzniklé vrstvě nyní nalezneme všechna data, která nás zajímala a která využijeme v analýze oblasti. Nicméně datová sada stále obsahuje některá data, která nejsou zcela relevantní – respektive existují některé šestiúhelníky, které neobsahují námi požadované informace z obohacení a které by tak ovlivňovaly analýzu. Proto filtrací odstraníme data, která by pro analýzu byla zavádějící.

V okně Geoprocessing otevřeme nástroj Výběr vrstvy podle atributů.

  • Pro vstupní vrstvu zvolíme obohacenou vrstvu San_Francisco_Crimes_Enrich.
  • Jako typ výběru nastavíme nový výběr.
  • Do výrazu nejprve přidáme tlačítkem podmínku a zadáme HasData je rovno 0 a stiskneme tlačítko Přidat.
  • Stejně přidáme podmínku atribut TOTPOT10 je rovný 0 spojenou operátorem Nebo (Or).

Spustíme nástroj a po jeho dokončení vidíme v atributové tabulce 231 vybraných prvků z celkových 1996. Nyní máme vybrány prvky, se kterými nechceme dál pracovat. Abychom vybrali ty, se kterými naopak chceme pracovat, použijeme tlačítko Přepnout v horní liště atributové tabulky.

Tato data exportujeme do nové třídy prvků pomocí nástroje Kopírovat prvky. Vstupem je vrstva obohacených dat (San_Francisco_Crimes_Enrich) s vybranými prvky a výstupní třídou bude vrstva San_Francisco_Crimes_Enrich_Subset.shp.

Nová vrstva obsahuje pouze obohacená data, se kterými budeme příště pracovat.