Analýza časoprostorových dat v ArcGIS Pro

6. 4. 2018
  • Desktopový GIS

Tento příspěvek nepřímo navazuje na článek Propojení ArcGIS Pro a R, a je tedy dalším dílem v seriálu článků zabývajících se statistickým vyhodnocováním dat pomocí R a ArcGIS Pro.

Než začneme se samotným zpracování dat pomocí R, je nejprve nutné si data připravit. Během toho si ukážeme i možnosti zpracování časoprostorových dat v ArcGIS Pro.

Datovou sadu, se kterou budeme v této ukázce pracovat, si můžete stáhnout na stránkách Esri.

Připojení dat

Otevřeme si nový projekt v ArcGIS Pro a nazveme jej Analýza kriminality. Uložíme jej do složky, kde máme stažená a rozbalená data. Před založením projektu zaškrtneme volbu Vytvořit pro tento projekt novou složku.

Projekt se otevře společně s kartou Katalog v hlavní části okna. Zde otevřeme položku Složky, v ní nalezneme složku se vzorovými daty a dostaneme se až ke geodatabázím. Otevřeme geodatabázi SF_Crime a pomocí kontextového menu (k jeho vyvolání použijeme pravé tlačítko myši) přidáme vrstvu San_Francisco_Crimes do nové mapy.

Zobrazí se body, které znázorňují místa, kde se v průběhu roku 2014 udál nějaký zločin.

Agregace bodových dat podle jejich počtu v rámci zadané lokality

Na první pohled není možné najít v bodové vrstvě žádný vzorec nebo závislost. Proto budeme „mračno bodů“ agregovat do skupin podle plošného členění a podle času, abychom data zobrazili srozumitelněji. Agregace dat sumarizuje body do časoprostorových krychliček, které v sobě kombinují počet kriminálních činů v daném místě a v daném čase.

Na panelu Geoprocessing otevřeme záložku Analýza a vyhledáme nástroj Vytvořit časoprostorovou kostku pomocí agregace bodů. Nastavíme vstupní hodnoty, které nám určí parametry časoprostorové kostky:

  • Vstupní prvky: San_Francisco_Crimes.
  • Výstupní časoprostorová kostka: San_Francisco_Crimes_Space_Time_Cube.nc, kterou uložíme do složky se zdrojovými daty.
  • V časovém poli vybereme atribut Dates.
  • Krok časového intervalu určíme 1 měsíc.
  • U zarovnání času ponecháme výchozí nastavení.
  • Tvar agregace nastavíme na šestiúhelníkovou mřížku.
  • Interval vzdálenosti určíme 300 m.

Po vyplnění všech položek podle obrázku výše nástroj spusťte.

Pozn. Výhodám šestiúhelníkové mřížky se budeme věnovat v jednom z příštích článků.

Nástroj vytvoří soubor typu netCDF (přípona NC), který umožňuje zobrazit prostorové vzory a trendy v průběhu času. Z 74 760 bodů vzniklo 3 510 šestiúhelníků. Každý šestiúhelník reprezentuje polohu přibližně 78 000 m2. Parametry časového kroku a intervalu vzdálenosti mají vliv na výsledný počet a velikost krychliček.

V praxi tyto hodnoty volíme na základě znalosti analyzované oblasti. Neznáme-li ale analyzovanou oblast dobře, můžeme nechat nástroj určit hodnoty na základě rozdělení dat.

Zpráva o úspěšném dokončení sumarizace se objeví v dolní části karty nástroje. Vytvořenou časoprostorovou kostku budeme dále zpracovávat, ale pokud byste si ji chtěli zobrazit již nyní,  můžete si založit novou scénu a soubor netCDF převést do zobrazitelné podoby pomocí nástroje Vizualizovat krychlový graf časoprostoru ve 3D. Výsledek pak vypadá jako na obrázku níže.

Data jsme agregovali a začneme s konkrétní analýzou. Využijeme nástroj Zkoumat Hot Spot analýzu a zobrazíme si statisticky významné oblasti s vysokou kriminalitou.

Za parametry zvolíme:

  • časoprostorovou kostku vytvořenou v předchozím kroku,
  • proměnný atribut Count,
  • výstup ve formátu shapefile, který nazveme San_Francisco_Crimes_Hot_Spots.shp.

Ostatní parametry ponecháme ve výchozím nastavení. Pro atribut Vzdálenost okolí si nástroj sám vypočítá optimální hodnotu založenou na prostorovém rozložení dat (ze záznamu nástroje se pak dozvíme, že vypočtená hodnota je 1041 m). Výchozí hodnotou pro parametr Časový krok okolí je 1 měsíc.

Výsledek zobrazí statisticky významné oblasti s vysokou (červené oblasti) a nízkou (modré oblasti) intenzitou kriminality v průběhu času. Každý šestiúhelník je vyhodnocen na základě trendu v daném klastru v průběhu času.

Tmavě rudé oblasti jsou tzv. Persistent Hot spots, tedy místa, která byla statisticky významná pro vysokou intenzitu v 90 % časových období (bez zaznamenání poklesů/zvyšování intenzity).

Okolní zářivě červené oblasti jsou tzv. Intensifying Hot spots, což jsou místa, u nichž dochází ke statisticky významnému růstu intenzity. Je z tedy patrné, že na tato místa by se měly bezpečnostní složky města více zaměřit.

Opakem míst s vysokou intenzitou jsou modrá místa s nízkou intenzitou. Symboly zde mají analogický význam vypovídající o opačném fenoménu – nízké či snižující se kriminalitě.