1 Wprowadzenie

1.1 Geostatystyczna analiza danych

Geostatystyka to gałąź statystyki skupiająca się na przestrzennych lub czasoprzestrzennych zbiorach danych

Geostatystyka jest stosowana obecnie w wielu dyscyplinach, jakich jak geologia naftowa, oceanografia, geochemia, logistyka, leśnictwo, gleboznawstwo, hydrologia, meteorologia, czy epidemiologia.

Geostatystyczna analiza danych może przyjmować różną postać w zależności od postawionego celu analizy. Rycina 1.1 przestawia uproszczoną ścieżkę postępowania geostatystycznego.

Uproszczona ścieżka postępowania geostatystycznego.

Rycina 1.1: Uproszczona ścieżka postępowania geostatystycznego.

Punktem wyjścia analizy geostatystycznej jest posiadanie danych przestrzennych opisujących badane zjawisko, np. w postaci punktowej (rycina 1.2).

Przykładowe dane reprezentujące pomiary punktowe zmiennej numerycznej.

Rycina 1.2: Przykładowe dane reprezentujące pomiary punktowe zmiennej numerycznej.

Dane należy poddać eksploracji w celu ich lepszego poznania, wyszukania relacji między zmiennymi, czy znalezienia potencjalnych błędów (rycina 1.3).

Rozkład wartości zmiennej numerycznej.

Rycina 1.3: Rozkład wartości zmiennej numerycznej.

Na ich podstawie chcemy zrozumieć zmienność przestrzenną analizowanej cechy. Do tego może nam posłużyć wykres nazywany semiwariogramem (rycina 1.4).

Wykres, nazywany semiwariogramem, reprezentujący niepodobieństwo wartości wraz z odległością.

Rycina 1.4: Wykres, nazywany semiwariogramem, reprezentujący niepodobieństwo wartości wraz z odległością.

Semiwariogram opisuje przestrzenną zmienność badanej cechy i za jego pomocą możemy stwierdzić jak to zjawisko zmienia się w przestrzeni. Dodatkowo za pomocą mapy semiwariogramu (rycina 1.5) możliwe jest stwierdzenie czy istnieją jakieś kierunki w których ta cecha zmienia się zmienia bardziej dynamicznie, a w których ta zmiana jest wolniejsza.

Mapa semiwariogramu reprezentująca niepodobieństwo wartości wraz z odległością i kierunkiem.

Rycina 1.5: Mapa semiwariogramu reprezentująca niepodobieństwo wartości wraz z odległością i kierunkiem.

Następnie korzystając z wiedzy uzyskanej z semiwariogramu i mapy semiwariogramu, jesteśmy w stanie stworzyć model semiwariogramu (rycina 1.6).

Model reprezentowany przez ciągłą linię naniesiony na semiwariogram.

Rycina 1.6: Model reprezentowany przez ciągłą linię naniesiony na semiwariogram.

Pozwala on zarówno na lepszy opis zmienności zjawiska, jak również służy do tworzenia estymacji czy też symulacji. Estymacja tworzy najbardziej potencjalnie możliwą wartość dla wybranej lokalizacji (rycina 1.7).

Estymacja (oszacowanie) wartości badanej zmiennej dla całego obszaru.

Rycina 1.7: Estymacja (oszacowanie) wartości badanej zmiennej dla całego obszaru.

Rolą symulacji (rycina 1.8) jest natomiast generowanie równie prawdopodobne możliwości rozkładu badanej cechy.

Przykłady symulowanych wartości badanej zmiennej dla całego obszaru.

Rycina 1.8: Przykłady symulowanych wartości badanej zmiennej dla całego obszaru.

Każdy z powyższych elementów geostatystycznej analizy danych zostanie rozwinięty w dalszych rozdziałach tego skryptu.