1 Wprowadzenie

Masz przed sobą skrypt zawierający materiały do ćwiczeń z geostatystyki. Składa się ona z kilkunastu rozdziałów pokazujących jak: dodawać i wizualizować dane przestrzenne w R (rozdział 2), wykonywać wstępną eksplorację danych nieprzestrzennych (rozdział 3), wstępnie analizować dane przestrzenne (rozdział 4), wykorzystywać deterministyczne metody interpolacji (rozdział 5), rozumieć i tworzyć przestrzenne miary podobieństwa i niepodobieństwa (rozdział 6), modelować semiwariogramy bezkierunkowe i kierunkowe (rozdział 7), tworzyć estymacje jednozmienne (rozdział 8), estymacje danych kodowanych (rozdział 9), estymacje wielozmienne (rozdział 10), estymacje wykorzystujące dane uzupełniające (rozdział 11), oceniać jakość wykonanych estymacji (rozdział 12) oraz budować symulacje przestrzenne (rozdział 13).

Dodatkowo załączone są trzy appendiksy. W appendiksie A można znaleźć odnośniki do innych materiałów związanych z geostatystyką i R, appendiks B opisuje dane użyte w tym skrypcie, a appendiks C wprowadza pojęcie powtarzalnego przykładu i tłumaczy jak taki przykład stworzyć.

Wszystkie zaprezentowane meotdy i analizy zawierają również kod w języku R. Skrypt został stworzony w R (R Core Team 2017) z wykorzystaniem pakietów bookdown (Xie 2018a), rmarkdown (Allaire et al. 2018), knitr (Xie 2018b) oraz programu Pandoc. Aktualna wersja skryptu znajduje się pod adresem https://bookdown.org/nowosad/Geostatystyka/.

Zachęcam do zgłaszania wszelkich uwag, błędów, pomysłów oraz komentarzy na adres mailowy nowosad.jakub@gmail.com.

1.1 Geostatystyczna analiza danych

Geostatystyka to gałąź statystyki skupiająca się na przestrzennych lub czasoprzestrzennych zbiorach danych

Geostatystyka jest stosowana obecnie w wielu dyscyplinach, jakich jak geologia naftowa, oceanografia, geochemia, logistyka, leśnictwo, gleboznawstwo, hydrologia, meteorologia, czy epidemiologia.

Geostatystyczna analiza danych może przyjmować różną postać w zależności od postawionego celu analizy. Poniższa rycina przestawia uproszczoną ścieżkę postępowania geostatystycznego.

Punktem wyjścia analizy geostatystycznej jest posiadanie danych przestrzennych opisujących badane zjawisko, np. w postaci punktowej:

Na ich podstawie chcemy zrozumieć zmienność przestrzenną analizowanej cechy. Do tego może nam posłużyć wykres nazywany semiwariogramem:

Opisuje on przestrzenną zmienność badanej cechy i za jego pomocą możemy stwierdzić jak szybko to zjawisko zmienia się w przestrzeni. Dodatkowo za pomocą mapy semiwariogramu możliwe jest stwierdzenie czy istnieją jakieś kierunki w których ta cecha zmienia się zmienia bardziej dynamicznie, a w których ta zmiana jest wolniejsza:

Następnie korzystając z wiedzy uzyskanej z semiwariogramu i mapy semiwariogramu, jesteśmy w stanie stworzyć model semiwariogramu:

Pozwala on zarówno na lepszy opis zmienności zjawiska, jak również służy do tworzenia predykcji czy też symulacji. Predykcja tworzy najbardziej potencjalnie możliwą wartość dla wybranej lokalizacji:

Rolą symulacji jest natomiast generowanie równie prawdopodobne możliwości rozkładu badanej cechy:

Każdy z powyższych elementów geostatystycznej analizy danych zostanie rozwinięty w dalszych rozdziałach tego skryptu.

1.2 Wymagania wstępne

1.2.1 Oprogramowanie

Do odtworzenia przykładów użytych w poniższym skrypcie wystarczy podstawowa znajomość R. Aby zainstalować R oraz RStudio można skorzystać z poniższych odnośników:

Dodatkowo, użyte zostały poniższe pakiety R (Jed Wing et al. 2018; Wei and Simko 2017; Hijmans et al. 2017; Nychka et al. 2018; Wickham et al. 2018; Auguie 2017; Pebesma and Graeler 2018; Appelhans et al. 2018; Giraudoux 2018; Bivand, Keitt, and Rowlingson 2018; Bivand and Rundel 2018; Pebesma and Bivand 2018).

Pakiety R używane w tym skrypcie można zainstalować poprzez funkcję install.packages():

Lub też za pomocą pakietu geostatbook (Nowosad 2018), który automatycznie zainstaluje wszystkie wymagane pakiety:

1.2.2 Dane

Dane wykorzystywane w tym skrypcie można pobrać w postaci spakowanego archiwum (dla rozdziału 2) oraz korzystając z pakietu geostatbook (dla kolejnych rozdziałów). Dodatkowo, przy instalacji pakietu geostatbook pobierane są wszystkie inne pakiety potrzebne do pełnego korzystania z materiałów zawartych w skrypcie.

Aby ułatwić korzystanie ze skryptu, rozdziały od 3 do 13 rozpoczynają się od wczytania wymaganych pakietów oraz zbiorów danych.