Materi 10 : SPATIAL STATISTICS


SPATIAL STATISTICS

Statistik Spasial adalah segala teknik analisis untuk mengukur distribusi suatu kejadian berdasarkan keruangan (Scott & Warmerdam, 2006). Keruangan yang dimaksud disini adalah variabel yang ada di permukaan bumi seperti kondisi topografi, vegetasi, perairan, dan lain-lain. Berbeda dengan statistik non-spasial yang tidak memasukkan unsur keruangan dalam analisisnya. 
Apa yang terlihat secara visual pada peta tidak dapat dengan mudah dijelaskan secara kualitatif mengenai pola distribusinya. Statistik Spasial dapat menggambarkan hal tersebut secara kuantitatif. Spasial statistik membantu kita dalam menilai pola, hubungan dan trend dari suatu distribusi.
Kelebihan lain dari statistik spasial menurut Scott & Warmerdam (2006) yaitu;
a) Diperolehnya pemahaman yang lebih baik mengenai fenomena goegrafis dari suatu kejadian;
b) Diketahuinya dengan tepat penyebab suatu kejadian berdasarkan pola geografis yang spesifik;
c) Disimpulkannya distribusi kejadian berdasarkan satuan data;
d) Diperolehnya keputusan yang lebih baik dengan tingkat kepercayaan yang lebih tinggi.

Dalam pengukuran distribusi suatu kejadian berdasarkan keruangan dibedakan berdasarkan dua kategori menurut (Scott & Warmerdam, 2006), yaitu:
•Identifikasi karakteristik dari suatu distribusi
•Kuantifikasi pola geografi dari suatu distribusi.

Pola distribusi spasial secara umum terbagi menjadi tiga (Briggs, 2007):
•Mengelompok (Clustered) yaitu beberapa titik terkonsentrasi berdekatan satu sama lain dan ada area besar yang berisi sedikit titik yang sepertinya ada jarak yang tidak bermakna.
•Menyebar (Dispersed) yaitu setiap titik berjauhan satu sama lain atau secara jarak tidak dekat secara bermakna
•Acak (Random) yaitu titik-titik muncul pada lokasi yang acak dan posisi satu titik dengan titik lainnya tidak saling terkait.

Deskripsi lawan Kesimpulan
Statistik deskripsi dan penjelasan deskripsi
·         Berkaitan dengan memperoleh ringkasan pengukuran  untuk menggambarkan seperangkat data
Statistik kesimpulan dan statistik dapat disimpulkan
·         Berkaitan dengan membuat kesimpulan dari sampel tentang populasi
·         Berkaitan dengan membuat kesimpulan yang sah tentang mendasari proses dari pola yang diamati

Statistik Deskriptif klasik: Univariate (Satu variable)
Ukuran pemusatan dan disperse
  • Pusat Tendensi: Ringkasan untuk ukuran satu variable tunggal :
    • mean (rerata)
    • median (nilai tengah)
    • mode (yang paling sering muncul)
  • Dispersi: ukuran sebaran atau variabilitas
    • Variance (variasi)
    • Simpangan baku (Akar kuadrat dari variasi)
Pusat tendensi bisa didapat dalam ArcGIS dengan:
          - Membuka sebuah table, klik kanan mouse pada heading kolom dan pilih Statistics.
          - Pergi ke ArcToolbox>Analysis>Statistics>Summary Statistics
Sebuah penghitungan frekuensi yang nilainya terjadi pada variabel
  • Paling mudah dipahami untuk variabel kategori (e.g. kesukuan)
  • Untuk variable kontinu, frekuensi dapat di :
o   Dihitung dengan membagi variable kedalam kategori atau “keranjang”
(e.g kelompok masukan)
o   Digambarkan oleh proporsi luasan dibawah kurva frekuensi
Dalam ArcGIS,  anda dapat memperoleh perhitungan frekuensi pada variable kategori melalui:
·         ArcToolbox>Analysis>Statistics>Frequency
Mengukur derajat asosiasi  atau kekuatan dari hubungan antara dua variable kontinu
Skalanya bervariasi  dari (–1  melalui 0  ke +1)
-1 mengisyaratkan hubungan negatif sempurna
Nilai pada salah satu variabel mengalami kenaikan dan tidak dengan yang lain
0 mengisyaratkan tidak adanya hubungan
+1  mengisyaratkan hubungan positif sempurna
Ketika nilai pada salah satu variabel naik maka nilai pada variabel yang lain juga ikut naik

Statistik Inferensial: untuk mencari tahu apakah perbedaan tersebut nyata
Seringkali terjadi kekurangan data untuk seluruh populasi (semua kemungkinan kejadian) sehingga sebagian besar ukuran (statistik) diperkirakan berdasarkan data sampel.
Statistik adalah ukuran yang dihitung dari sampel yang merupakan perkiraan parameter populasi. Pertanyaan yang selalu muncul yakni mengenai apakah perbedaan yang diamati (katakanlah antara dua statistik) bisa muncul karena peluang yang terkait dengan proses pengambilan sampel, atau mencerminkan perbedaan nyata dalam populasi yang mendasari . Jawaban atas pertanyaan ini melibatkan konsep inferensi statistik dan pengujian hipotesis statistik, dimana selalu penting untuk mengeksplorasi sebelum kesimpulan pasti ditarik.
Namun, perlu diingat bahwa signifikansi statistik tidak selalu sama dengan signifikansi ilmiah (atau substantif). Dengan ukuran sampel yang cukup besar (dan set data sering besar dalam GIS), signifikansi statistik sering mudah dicapai.

Pengujian Hipotesis Statistik: Pendekatan Klasik
Ukuran atau indeks yang berasal dari sampel (misalnya pusat rata-rata atau Indeks Tetangga Terdekat) Dimana sampel mungkin memiliki dua ukuran sampel  atau satu ukuran sampel yang dibandingkan dengan "keacakan spasial"
Statistik uji, berasal dari ukuran atau indeks, yang distribusi probabilitasnya diketahui ketika sampel yang diulang dibuat, ini digunakan untuk menguji signifikansi statistik dari ukuran / indeks. Yang kemudian melanjutkan dari hipotesis nol (Ho) bahwa, dalam populasi, "tidak ada perbedaan" antara dua statistik sampel, atau dari keacakan spasial

  • ·       Jika statistik uji diperoleh sangat tidak mungkin terjadi (kurang dari 5% kemungkinan) jika hipotesis nol itu benar, hipotesis nol ditolak
  • ·         Jika statistik uji berada di luar  ±1.96 (dengan asumsi distribusi Normal), hipotesis nol ditolak (tidak ada perbedaan) dan mengasumsikan perbedaan yang signifikan secara statistik setidaknya pada tingkat signifikansi 0,05.
Karena kompleksitas yang melekat pada proses spasial, kadang-kadang sulit untuk mendapatkan statistik uji yang sah yang distribusi probabilitasnya diketahui
Pendekatan alternatif yang dapat digunakan diantaranya adalah dengan menggunakan atau memanfaatkan system komputer untuk mensimulasikan pola spasial acak ganda (atau sampel) katakanlah 100, statistik spasial (misalnya NNI atau LISA) dihitung untuk masing-masing, dan kemudian ditampilkan sebagai distribusi frekuensi.
Distribusi sampling simulasi ini kemudian dapat digunakan untuk menilai kemungkinan (probabilitas) memperoleh nilai yang kami amati untuk Indeks jika polanya acak.
Nilai yang diamati:
- sangat tidak mungkin terjadi jika prosesnya acak
- menyimpulkan bahwa prosesnya tidak acak
- distribusi frekuensi empiris dari sampel pola acak

Proses berbeda dari Acak
Proses berbeda dari acak dalam dua cara mendasar
·         Variasi dalam penerimaan wilayah studi untuk menerima suatu titik
Efek urutan pertama
·         Interdependensi dari poin-poin itu sendiri
Efek urutan kedua
Dalam prakteknya, sangat sulit untuk menguraikan dua efek ini hanya dengan analisis data spasial

Jenis-Jenis Distribusi
·         Random (Acak) : titik mana pun kemungkinan sama terjadi di lokasi mana pun, dan posisi titik mana pun tidak terpengaruh oleh posisi titik lainnya.
·         Uniform/Dispersed (Seragam) : setiap titik sejauh mungkin dari semua tetangganya: "tidak mungkin dekat"
·         Clustered (Dikluster) : banyak titik terkonsentrasi berdekatan, dan ada area besar yang berisi sangat sedikit, jika ada, poin: "tidak mungkin berada jauh"


Statistik Centrographic
Deskriptor dasar untuk distribusi titik spasial
Ukuran Centrality Tindakan Dispersi

  • ·         Mean Center - Jarak Standar
  • ·         Centroid - Ellipse Deviasi Standar
  • ·         Rata-rata pusat tertimbang
  • ·         Pusat Jarak Minimum
Dua dimensi (spasial) setara dengan statistik deskriptif standar untuk distribusi variabel tunggal. Dapat diterapkan pada poligon dengan terlebih dahulu mendapatkan centroid dari masing-masing polygon.
Paling baik digunakan dalam konteks perbandingan untuk membandingkan satu distribusi



Komentar

Postingan populer dari blog ini

MATERI 4: Konsep Desain Software Database

Materi 5 : DATUM GEODETIK & SISTEM KOORDINAT

MATERI 1: Sistem Informasi Geografik