Membuat Peta dari Data Titik
Data titik (atau points) merupakan data paling basic dalam bahasan data spasial. Data titik menggambar sebuah lokasi (x,y) dari sebuah tempat, peristiwa, fenomena, atau hal-hal lainnya. Bisa jadi data tersebut memang mendefinisikan letak sebenarnya secara akurat ataupun hanya berupa perkiraan. Data titik disimpan dalam format vector (semisal shapefile) sehingga dapat memuat banyak data atribut. Data titik yang paling populer adalah point of interest (POI) yang mana POI banyak dikumpulkan karena digunakan untuk sektor bisnis. Contoh lain dari data titik adalah data sebaran lokasi kejadian kebakaran atau kecelakaan lalu lintas, data sebaran lokasi kemunculan satwa dilindungi, serta banyak lagi.
Dengan Geographic Information System (GIS), data titik dapat divisualisasikan pada sebuah peta. Namun membuat data titik tampak bagus pada sebuah peta merupakan tantangan tersendiri bagi seorang kartografer. Hal ini disebabkan oleh tampilan data titik yang hanya berupa sebaran titik-titik tidak beraturan sehingga terlihat tidak menarik. Peta memang akan menggambarkan persebaran titik-titik secara spasial. Bahkan dengan beberapa pendekatan tertentu, nilai (value) yang merupakan atribut dari data titik juga dapat divisualisasikan sehingga memperkaya informasi peta selain hanya menampilkan lokasi titik. Namun dengan visualisasi yang “seadanya” data titik akan terlihat jelek dan tidak menarik pada peta.
Setidaknya terdapat tiga metode visualisasi yang dapat dilakukan untuk menampilkan data titik pada peta dengan sederhana, namun mampu memberikan makna dan tampilan yang lebih baik.
Metode 1: Point Symbols
Metode pertama adalah “Point Symbols”. Maksudnya ialah langsung menampilkan data titik apa adanya sebagai titik-titik yang banyak; atau point as a symbols. Metode ini merupakan cara paling mudah dan paling umum ditemui untuk menampilkan data titik pada peta. Namun biasanya banyak orang yang menampilkan data titik dengan metode ini “seadanya”, sehingga tampilan peta menjadi tidak menarik. Padahal terdapat beberapa elemen yang bisa diutak-atik sehingga tampilan data titik dengan metode “Point Symbols” menjadi lebih menarik.
Elemen pertama yang dapat diubah adalah bentuk simbol yang digunakan. Selain menggunakan lingkaran bergaris tepi, titik dapat disimbolkan dengan bentuk geometris lain bahkan dengan clip art. Contohnya untuk menunjukkan lokasi “kedai buah” dapat menggunakan simbol clip art dari buah-buahan. Tentunya menampilkan titik dengan simbol selain “lingkaran bergaris tepi” akan memberikan tampilan yang lebih menarik dan lebih representatif.
Elemen selanjutnya yang dapat diubah adalah ukuran simbol. Mengatur ukuran simbol sesuai nilai atribut (kuantitatif ataupun kualitatif) yang terkandung pada data titik tentu akan memberikan informasi yang jelas mengenai sebuah titik. Contohnya data titik sebaran tambak ikan sebuah perusahaan di sebuah pantai. Data titik dapat divisualisasikan dengan ukuran yang berbeda-beda berdasarkan pada jumlah panen ataupun populasi ikan yang ada di masing-masing tambak ikan.
Elemen lain yang dapat diatur adalah warna simbol. Sama halnya dengan ukuran, warna simbol dapat diubah berdasarkan nilai atribut pada data titik (kuantitatif ataupun kualitatif). Tentunya mengubah warna simbol akan memberikan kemudahan pada data titik yang memiliki nilai sangat beragam ketimbang ukuran simbol. Mengatur tiga elemen pada simbol data titik ini akan membuat tampilan peta menjadi lebih menarik dan kaya akan informasi.
Metode 2: Binning
Metode selanjutnya adalah “Binning”. Sesuai namanya, binning merupakan sebuah metode yang menggeneralisasi (menyederhanakan) data titik menjadi grid (atau bin). Pada dasarnya titik-titik yang ada diagregasi ke dalam grid yang mereka tempati. Tiap bagian grid akan memiliki atribut dengan nilai count dari titik yang berada di dalam grid tersebut. Grid yang dimaksud dapat berbentuk geometri apapun bahkan batas administrasi.
Bentuk yang paling umum ditemui adalah grid persegi empat (square) dan segi enam (hexagon). Terdapat dua sistem grid universal populer yang memungkinkan definisi lokasi grid yang sama di seluruh dunia pada setiap analisis. Dua sistem grid universal tersebut adalah H3 Uber dengan bentuk hexagon, lalu sistem yang kedua adalah S2 Google dengan bentuk persegi empat yang menyesuaikan pada kelengkungan tiga dimensi bumi.
Untuk melakukan binning pada data titik, tentunya pembuat peta harus memiliki sebuah data grid berformat vektor. Data grid ini tentunya harus merepresentasikan area of interest dari data titik, sehingga dapat dilakukan “agregasi”. Agregasi adalah mengumpulkan informasi titik-titik ke dalam satu grid yang mereka tempati bersama. Biasanya saat melakukan agregasi pada data titik ke dalam grid, akan ditambahkan atribut baru pada grid berupa informasi statistik hasil agregasi. Statistik yang dimaksud berupa “COUNT” dari titik yang ada pada grid. Selain itu statistik lain (SUM, MEAN, MIN, MAX, Standard Deviation, Variance, dan RANGE) dapat diambil dari nilai atribut titik-titik yang ada di dalam grid.
Contohnya apabila terdapat grid yang merupakan hasil agregasi titik kejadian kecelakaan. Data titik kejadian kecelakaan berisikan atribut [ID, Lat, Lon, Casualties, Costs_Rp]. Sehingga informasi statistik dari hasil agregasi dapat berupa:
- Jumlah kejadian kecelakaan (COUNT)
- Jumlah korban kecelakaan (COUNT_Casualties)
- Lokasi dengan korban kecelakaan tertinggi (MAX_Casualties)
- Lokasi dengan korban kecelakaan terendah (MIN_Casualties)
- Jumlah total kerugian akibat kecelakaan (SUM_Costs_Rp)
- Rata-rata kerugian akibat kecelakaan (MEAN_Costs_Rp)
Contoh dari visualisasi data titik menggunakan peta dapat dilihat dibawah. Data titik yang digunakan pada peta adalah data titik bangunan dengan [luas > 350 m2] di Kota Bukittinggi, Provinsi Sumatera Barat, bersumber dari Open Buildings oleh Google. Binning dilakukan dengan menggunakan tiga bentuk grid, yakni hexagon (t = 500 m), persegi empat (s = 500 m), dan diamond (d = 500 m). Visualisasi dilakukan dengan statistik COUNT yang diklasifikasi menggunakan metode Natural Breaks.
Tiap kelas hasil agregasi diberi warna berdasarkan kelas dengan gradasi warna kuning (COUNT bangunan rendah) hingga merah (COUNT bangunan tinggi). Adapun grid yang tidak memiliki hasil agregasi diberi warna putih. Tampak COUNT tertinggi bangunan dengan [luas > 350 m2] terdapat di wilayah barat daya Kota Bukittinggi, Namun pada hampir sekitar 80% grid dapat ditemukan setidaknya 1 bangunan tersebut.
Namun metode binning akan menerima dampak langsung dari bias statistik Modifiable Areal Unit Problem (MAUP). Ketika ukuran dan bentuk grid diubah, atau lokasinya di geser maka akan terjadi perbedaan hasil agregasi pada data titik yang sama. Akibatnya akurasi dari visualisasi menjadi dipertanyakan —Mana yang lebih benar? Contohnya pada peta diatas, di ujung barat laut Kota Bukittinggi dapat dilihat perbedaan jumlah area yang teragregasi; hexagon = 3 grid, persegi empat = 4 grid, dan diamond = 5 grid.
Bahkan pada bagian tengah kota jika menggunakan bentuk diamond (yang lebih kecil dari bentuk lainnya) dapat dilihat bahwa terdapat banyak area berwarna kuning (jumlah bangunan rendah). Namun bentuk lainnya menceritakan hal yang berbeda, dimana hanya terdapat grid dengan warna jingga bahkan merah (jumlah bangunan sedang dan tinggi). MAUP dapat diatasi dengan berbagai pendekatan untuk hasil yang lebih baik.
Metode 3: Heatmap
Metode lainnya adalah “Heatmap”. Heatmap merupakan metode visualisasi peta yang menunjukkan cluster “Hot” dan cluster “Cold” sebuah informasi pada peta. Cluster yang dimaksud ialah densitas relatif dari sebuah hal pada suatu lokasi. Contohnya pada data titik kejadian kecelakaan lalu lintas, hotspot-nya merupakan lokasi dengan jumlah kecelakaan terbanyak (misalnya dengan warna merah) dan coldspot-nya merupakan lokasi dengan jumlah kecelakaan paling rendah (misalnya dengan warna merah muda transparan).
Namun tidak hanya menampilkan densitas relatif dari lokasi suatu hal atau objek, heatmap juga akan memberikan visualisasi nilai (atribut) dari suatu hal atau objek. Nilai (atribut) yang dimaksud dapat berupa nilai suhu, pendapatan, jumlah penduduk, dan lainnya dari sebuah titik. Contohnya data titik sebaran kota di Amerika Serikat divisualisasikan jumlah populasi penduduk menggunakan heatmap (gambar dibawah). Tampak lokasi dengan populasi tinggi ditampilkan dengan hotspot berwarna kuning, serta populasi rendah dengan coldspot berwarna biru muda.
Pembuatan heatmap dapat menggunakan metode “Kernel Density Estimation” atau KDE. Metode ini merupakan metode statistik non-parametrik untuk membuat visualisasi densitas relatif dari data titik atau data garis (polylines). Input dari metode ini adalah berupa data vektor (point ataupun polylines), dengan output berupa data raster. “Raster” output akan memvisualisasikan densitas relatif dari input-data berupa heatmap. Contohnya adalah Heatmap Bangunan [luas > 350 m2] di Kota Bukittinggi, Provinsi Sumatera Barat. Ketimbang binning, heatmap memberikan visualisasi yang lebih baik untuk menampilkan densitas satu dataset titik. Binning tetap unggul apabila terdapat banyak dataset yang diperlukan untuk analisis.
Memvisualisasikan data spasial memang menjadi tantangan tersendiri, karena seyogyanya dalam sekali lihat sebuah peta harus langsung dapat dipahami isinya. Jikalau membutuhkan waktu lama untuk memahami maksud dari sebuah visualisasi, dalam konteks ini peta dan data titik, maka artinya visualisasi tersebut “jelek” dan harus segera diperbaiki. Mengetahui beberapa metode visualisasinya secara empiris akan sangat membantu pembuat peta memvisualisasikan data spasial dengan lebih menarik sesuai kebutuhan mereka.