4 Eksploracyjna analiza danych przestrzennych

Odtworzenie obliczeń z tego rozdziału wymaga załączenia poniższych pakietów oraz wczytania poniższych danych:

4.1 Mapy

4.1.1 Podstawowe terminy | Kontekst przestrzenny

  • Populacja - cały obszar, dla którego chcemy określić wybrane właściwości, np. temperatura powietrza.
  • Próba - zbiór obserwacji, dla których mamy informacje, np. pomiary ze stacji meteorologicznych. Inaczej, próba to podzbiór populacji. Zazwyczaj niemożliwe (lub bardzo kosztowne) jest zdobycie informacji o całej populacji. Z tego powodu bardzo cenne jest odpowiednie wykorzystanie informacji z próby.

4.1.2 Mapy punktowe

Eksploracyjna analiza danych przestrzennych w przypadku danych punktowych ma na celu:

  • Sprawdzenie poprawności współrzędnych
  • Wgląd w typ próbkowania danych
  • Sprawdzenie poprawności danych, w tym między innymi określenie danych odstających lokalnie
  • Identyfikacja głównych cech struktury przestrzennej zjawiska (np. trend)

4.2 Sprawdzenie poprawności współrzędnych

Wstępne sprawdzenie poprawności współrzędnych można wykonać poprzez wizualizację danych przestrzennych za pomocą funkcji plot().

4.3 Próbkowanie

4.3.1 Podstawowe typy próbowania

Istnieje cały szereg typów próbkowania danych przestrzennych. Funkcja spsample() z pakietu sp pozwala na stworzenie kilku typów próbkowania (argument type), między innymi:

  • Regularny (ang.regular)
  • Losowy (ang.random)
  • Losowy stratyfikowany (ang.stratified)
  • Preferencyjny (ang.clustered)

4.3.2 Typ próbowania | Regularny

W regularnym typie próbkowania, kolejne punkty rozłożone są równomiernie na badanym obszarze.

4.3.3 Typ próbowania | Losowy

W losowym typie próbkowania każda lokalizacja ma takie samo prawdopodobieństwo wystąpienia. Dodatkowo, każdy punkt jest losowany niezależnie od pozostałych.

4.3.4 Typ próbowania | Losowy stratyfikowany

Losowy stratyfikowany typ próbkowania polega na podzieleniu analizowanego obszaru na regularne komórki, a następnie dla każdej komórki losowana jest lokalizacja punktu.

4.3.5 Typ próbowania | Preferencyjny

W preferencyjnym typie próbkowania istnieją obszary, które z jakieś powodu (np. specyficzne wartości analizowanej cechy) są znacznie częściej opróbkowane niż inne.

4.4 Dane lokalnie odstające

Dane lokalnie odstające oznaczają nietypowe przestrzennie wartości danej cechy. Inaczej mówiąc, może to być niska wartość otoczona wysokimi wartościami lub też wysoka wartość otoczona niskimi wartościami. Dane lokalnie ostające mogą oznaczać zarówno błąd w danych albo wpływ innego czynnika na analizowaną cechę. Przyjrzenie się wartościom analizowanej cechy można wykonać z użyciem funkcji plot(). Na poniższym przykładzie wyświetlona jest zmienna temp oznaczająca średnią temperaturę dobową.

Dodatkowo można wykorzystać pakiet mapview do interaktywnego określania wartości oraz numeru punktu (numer wiersza w tabeli atrybutów).

4.5 Zadania

  1. Określ i opisz typ próbkowania danych punkty.
  2. Wykonaj mapę pokazującą przestrzenny rozkład wartości NDVI w zbiorze punkty. (Dodatkowo: spróbuj użyć do tego pakietu tmap - install.packages("tmap")).