news

Tampilkan postingan dengan label visualisasi data. Tampilkan semua postingan
Tampilkan postingan dengan label visualisasi data. Tampilkan semua postingan

Senin, 25 Mei 2020

Apa itu Dokumentasi Data?


Pernahkah mendengar istilah dokumentasi data? Dokumentasi data atau yang sering disebut dengan data provenance adalah sebuah langkah untuk melihat sumber data yang kita peroleh. Kata provenance sendiri berasal dari bahasa perancis provenir yang berarti “berasal” atau dalam istilah juga disebut silsilah. 

Dalam konsep sejarah seni, kata provenance sering digunakan dalam dokumentasi sebuah karya seni sehingga setiap detailnya tetap tercatat. Misalnya kapan pertama kali sebuah karya seni diciptakan dari sisi ide, eksekusi, hingga akhirnya menjadi yang dapat kita nikmati saat ini. 
Contoh lainnya, coba bayangkan Anda berperan sebagai seorang Data Scientist. Anda mendapatkan sebuah dataset yang siap untuk dianalisis. Anda tidak tahu data ini berasal dari mana, bagaimana validitasnya, apakah ia akan berubah selama proses pengerjaan Anda, dan sebagainya. Gawat kan? Padahal dokumentasi data ini penting untuk mengetahui keabsahan data dan memungkinkan kita menggunakannya kembali di waktu yang lain.
W3C Provenance Incubator Group menjelaskan tentang dokumentasi data sebagai berikut:
“a record that describes entities and processes involved in producing and delivering or otherwise influencing that resource. Provenance provides a critical foundation for assessing authenticity, enabling trust, and allowing reproducibility. Provenance assertions are a form of contextual metadata and can themselves become important records with their own provenance.”
Terdengar rumit? Baiklah. Berikut ini contoh sebuah penggambaran dokumentasi data yang ditunjukkan dalam sebuah metadata.
20200415111156eccc5b94c1893e6cab12243818924ff4.jpeg
Contoh data provenance di atas didapat dari website kaggle. Pada gambar di atas terlihat dokumentasi yang menyertakan sumber data, metodologi pembuatan data, dan juga pemilik dari dataset. Berikut contoh lain dari dokumentasi data yang familiar bagi Anda.
20200415111156602278bd47814103a7a8325a83f3a005.jpeg
Tampilan di atas merupakan version history dari berkas Google Spreadsheet. Semua perubahan data tercatat mulai dari tanggal hingga nama orang yang melakukan perubahan. Version history ini dapat Anda temukan saat klik bagian berikut:
20200415111419130a0dfa1c32687dbdba7f6d95f5f2df.jpeg 
Untuk dapat kembali ke penulisan sebelumnya kita dapat melakukan restore version dengan memilih dari riwayat penulisan dan klik Restore this version.
20200415111452c24cd60a851b1bc7293d2243a6964010.jpeg

Menggambarkan Kuantitatif Data ke Bentuk Diagram


Untuk penggunaan grafik secara lebih rinci akan kita bahas pada pembelajaran selanjutnya. Diharapkan pada pembelajaran kali ini setidaknya Anda bisa mengetahui struktur data yang dapat digunakan untuk membuat grafik-grafik tersebut. Nah kini, setelah teori, tak lengkap rasanya tanpa latihan. Pada bagian kali ini kita akan belajar untuk membuat data ke dalam sebuah grafik menggunakan Google Sheet. Jenis grafik dalam Google Sheet bisa dikombinasikan dengan jenis model lainnya. Misalnya, diagram batang dapat dikombinasikan dengan diagram garis. Namun, penerapannya juga harus sesuai dan tidak dipaksakan supaya data dapat mudah dipahami.

Oke, dalam latihan ini kita akan menggunakan data kamar Airbnb yang disewakan di New York yang bisa diunduh melalui Kaggle.
Dataset: New York City Airbnb
Deskripsi: Sejak 2008, para tamu dan tuan rumah telah menggunakan Airbnb untuk memperluas kesempatan travelling dan menghadirkan cara yang lebih unik dan personal untuk mengalami dunia. Dataset ini menjelaskan aktivitas cantuman dan metrik di NYC, New York untuk 2019.
Tools: Google Sheet
Untuk mengunduh data dari Kaggle harus memiliki akun Kaggle terlebih dahulu.
Untuk menggunakan Google Sheet harus memiliki akun Gmail terlebih dahulu.

Langkah 1: Persiapan

Pastikan semua tools dan data sudah dipersiapkan. Setelah semua siap, maka buat Google Sheet baru.
202004141645398b04d5dbad1506c0b6be48b835eda3e0.jpeg
Data yang kita unduh sebelumnya memiliki ekstensi .zip, oleh karena itu kita perlu untuk unzipped file tersebut. Untuk memasukkan data dari komputer ke Google Sheet, klik File → Import dan pilih/taruh berkas yang ingin dimasukkan.
20200414164612f1bb0a5737cccc199cd98bbe0209c40c.jpeg
Unggah berkas AB_NYC_2019.csv dari data yang telah kita ekstrak dan masukkan konfigurasi seperti gambar di bawah. Setelah itu klik Import data. Sheet akan terisi dengan data dari berkas yang kita unggah.
20200414164758e961294a5f2bad1ead1867979d2242e7.jpeg
Sheet akan terisi dengan data dari berkas yang kita unggah seperti berikut:
2020041416484720c7f5179040346d62ffb9ada84873bd.jpeg

Langkah 2: Visualisasi

Preparasi data dan semua data sudah berhasil ditampilkan, bukan? Sekarang saatnya kita mulai membuat visualisasi data-data tersebut. Caranya sangat mudah, kita tinggal memilih kolom dan baris mana yang ingin kita visualisasikan. Nah sebelum kita memilih kolom dan baris untuk divisualisasikan, kita perlu memahami maksud dari data tersebut. Mulailah dari deskripsi secara global data sampai dengan arti kolom dan isinya. Pertama kita mengetahui bahwa data ini merupakan data kamar Airbnb yang disewakan. Namun apa sajakah arti tiap kolom pada data tersebut?
  • Id : Identifier unik untuk tiap tempat sewa
  • Name : Nama tempat
  • Host_id : Identifier penyedia kamar/tempat
  • Host_name : Nama penyedia kamar/tempat
  • Neighbourhood_group : Kelompok lingkungan dari tempat tinggal yang disediakan host, merupakan pengelompokan dari neighbourhood
  • Neighbourhood : Nama dari lingkungan tempat tinggal yang disediakan host
  • Latitude & longitude : Garis lintang dan garis bujur dari tempat tinggal yang disediakan
  • Room_type : Tipe kamar yang disediakan
  • Price : Harga sewa per malam
  • Minimum_nights : Minimal sewa per malam
  • Number_of_reviews : Jumlah ulasan oleh pelanggan
  • Last_review : Tanggal review terakhir
  • Reviews_per_month : Rasio banyaknya ulasan perbulan
  • Calculated_host_listings_count : Jumlah daftar per host
  • Availability_365 : Beberapa hari ketika daftar tersedia untuk pemesanan
Atau untuk lebih mengetahui deskripsi data, lihatlah di sini. Setelah kita mengetahui maksud dari kolom dan isian data tersebut kita mulai dapat membuat pertanyaan pada diri sendiri, sebagai contohnya “Saya ingin melihat perbandingan rata-rata harga tiap tipe kamar.”
Dari sana kita tahu bahwa kolom yang kita gunakan adalah room_type dan price dengan menggunakan semua baris. Untuk mulai membuat visualisasi klik kolom I (room_type) dan J (price) dengan menekan shift, maka akan tampil seperti gambar di bawah ini
20200414170832dfeafdd9af31068367a3b84255007383.jpeg
Pemilihan data bisa digunakan dengan membuat pivot table, dari tabel tersebut kita dapat memilih baris dan kolom yang diinginkan untuk membuat visualisasi.
Setelah data yang dibutuhkan telah dipilih, kita dapat memvisualisasikan dengan klik Insert → Chart.
20200414170952ab42d01a0847ede76eebbb6fd2ab2fe4.jpeg 
Secara standar grafik yang pertama terbentuk adalah Grafik kolom dengan X Axis adalah room_type dan Y Axis adalah sum (penjumlahan) dari price.
20200414171015048d3ec2a10ce5392ab3b7d269f2c307.jpeg
Nah bisa kita lihat bahwa grafik yang terbentuk tidak rapi. Terlalu banyak data poin pada X Axis. Hal tersebut dikarenakan kita tidak melakukan grouping atau pengelompokan. Oleh karena itu silakan a ceklis tombol Aggregate untuk melakukan agregasi terhadap room_type yang sama. Maka visualisasi akan berubah seperti gambar di bawah ini.
20200414171037eab5e86e5e2a9a8729b6584c741106d4.jpeg 
Untuk merubah jenis grafik yang diinginkan dan sesuai dengan jenis data yang kita pilih, klik Chart type pada Chart editor. Misalnya jika kita ingin merubah tampilan grafik menjadi bentuk Grafik Pie, cukup klik bentuk Grafik Pie yang kita inginkan.
2020041417113955f9a7fa24eda0ccee29f9aa98695116.jpeg 
Lalu grafik sebelumnya akan berubah seperti di bawah ini.
20200414171201fc6b2346af831733553ab32e14504636.jpeg
Perlu diingat bahwa nilai Y Axis di sini masih menggunakan nilai awal yaitu sum. Untuk merubah menjadi rata-rata kita dapat dengan mengklik seperti gambar di bawah dan menggantinya menjadi average.
20200414172047d94b56af4d927fa297b85315a50395c0.jpeg
Sehingga hasil grafiknya seperti berikut.
202004141721418c0417ab54655274566d0496723b7a88.jpeg
Nah hal yang perlu diperhatikan adalah setiap tipe grafik masing-masing memiliki kebutuhan data yang berbeda-beda. Seperti halnya pada grafik kolom sebelumnya, data yang dibutuhkan ada X Axis dan Y Axis. Sementara itu pada bentuk grafik kolom kombo area, Y Axis dapat dimasukkan oleh beberapa data lainnya sebagai perbandingan seperti gambar di bawah ini.
20200414172817a27634052afa33fc4eace66297f7fbfc.jpeg
20200414172834c969d4c0a6970c99070ee24940082ba3.jpeg
Untuk melakukan styling pada font, legend, warna, dan lainnya, lakukan konfigurasi sesuai jenis grafik yang kita pilih pada bagian Customize. Setelah mengetahui itu semua ini saatnya Anda mencoba sendiri dan pelajari terus potensi-potensi yang ada untuk membuat grafik yang lebih kompleks dan lebih mudah dipahami.
20200414172900babb7b197f2737a3b69172d64d74bbe0.jpeg

Kesalahan Umum dalam Visualisasi Data


Sudahkah Anda menerapkan visualisasi data dalam menyajikan data? Kita telah sepakat bahwa visualisasi data memudahkan audiens dalam memahami data yang kita presentasikan. Namun, apakah metode visualisasi data dapat selalu menyampaikan informasinya dengan efektif?

Visualisasi akan efektif jika dibuat dengan mematuhi kaidah yang ditentukan. Namun, terkadang penerapan visualisasi data dilakukan dengan cara yang sebaliknya: tak tepat dan tak patuh pedoman. Sehingga penerapan visualisasi data kadang berujung pada output data yang membingungkan, ambigu. Alhasil, alih-alih membuat paham, audiens jadi meragukan kebenaran data. 
Karena itulah, Anda perlu tahu dan hindari beberapa kesalahan umum yang sering dilakukan dalam membuat visualisasi data. Berikut ini penjelasannya:

Nilai Persentase Tidak Sesuai

20200415090714238572920fedd514d2167888c12e75b1.jpeg
Menurut Anda, adakah yang salah dari diagram lingkaran di atas? Jika Anda mengatakan “Ya, ada yang salah” itu sudah tepat. Alasannya, total nilai persentase yang ditunjukkan dari diagram sebesar 98% atau kurang dari 100%. Selain itu ada juga kesalahan lainnya yaitu besar / porsi irisan lingkaran Small Companies (42%) lebih besar daripada Large Companies (56%). Karena 42 itu lebih kecil dari 56, maka besar porsi potongan lingkarannya pun seharusnya lebih kecil, bukan sebaliknya. 
Perhatikan bahwa penulisan persentase dan besar porsi irisan yang merepresentasikan data, harus tepat. Jika menggunakan satuan persen maka total data yang disajikan totalnya harus 100%. Apabila menggunakan satuan derajat maka data yang disajikan totalnya harus 360 derajat. Sehingga dari diagram di atas jika datanya sudah tepat maka bisa menjadi seperti berikut:
20200415090846744fe3411589d67618be86d8eae7087f.jpeg
Besar porsi irisan juga harus sesuai dengan nilai datanya. Jangan pula menampilkan terlalu banyak irisan yang bisa berujung bias, contohnya di bawah ini:
20200415101235892dbb5eb3aaccc50697b06effd14d91.jpeg 
Pasti Anda akan sulit untuk membaca informasi dari diagram lingkaran di atas. Sulit untuk membedakan data mana yang lebih besar dibandingkan lainnya. Memang idealnya irisan diagram lingkaran tak lebih dari empat irisan supaya perpotongan irisannya terlihat jelas. Sehingga kita tahu data mana yang lebih besar atau lebih kecil. 
Lalu bagaimana kalau data yang ingin ditulis berjumlah enam? Sebagai contoh Anda dapat menggambarkannya seperti di bawah ini:
202004151013133057983af5b1a294d8baccc4bcc15e96.jpeg
“Lainnya” merupakan data hobi yang dihimpun selain sepak bola, bulu tangkis, dan basket. Bisa jadi ada menulis, membaca, dan lain sebagainya.  
Namun, menulis “lainnya” saja tidak cukup. Anda perlu tambahkan keterangan: kategori lainnya itu berisi hobi apa saja? Jika data yang dibutuhkan sangat banyak misal lebih dari 100 data, maka kita perlu menuliskan data hobi ini dalam bentuk tabel saja, bukan diagram lingkaran.

Terlalu Banyak Data

Kita telah mengetahui tujuan visualisasi data adalah membuat sebuah data yang kompleks menjadi lebih mudah dipahami dengan bentuk visual. Namun, bagaimana jika sebaliknya?
Ini dapat terjadi jika kita “maksa” untuk memasukkan semua data yang berjumlah besar. Hasilnya  tidak efektif dan tentu membingungkan pembaca. Contohnya perhatikan gambar di bawah ini:
20200415101723980923be5e333ad3316bb93c37760868.jpeg
Begitu banyak data yang dimasukkan dalam diagram lingkaran di atas, bukan? 
Sebagai pembaca, kita sulit bahkan tak bisa menangkap informasi apa yang ingin disampaikan oleh diagram tersebut. Seperti diulas pada poin sebelumnya bahwa apabila menggunakan diagram lingkaran, paling efektif gunakan 4 irisan data saja. Apabila banyak sekali data seperti gambar di atas, maka sebaiknya tuliskan data Anda dalam bentuk tabel saja. Hal tersebut berlaku juga untuk semua jenis diagram.

Tidak Mengikuti Standar Penulisan

2020041510173683b3a6d083498595b254100e07571ed5.jpeg
Apabila Anda melihat grafik di atas, bagaimana tren data yang menunjukkan angka pembunuhan menggunakan senjata api di Florida? Sekilas tidak ada yang salah tetapi coba perhatikan kembali sumbu Y. Nilai yang ditunjukkan, terbalik. Angka 0 berada di atas sebagai nilai minimum dan angka 1000 sebagai nilai minimum berada di bawah. Hal tersebut sudah tidak sesuai dengan standar umum penulisan karena umumnya sumbu Y dimulai dari nilai minimum berada di bawah dan semakin ke atas semakin naik nilainya.
Tentu saja ini berpengaruh bagi pembaca informasi karena bisa menimbulkan salah persepsi. Mereka akan mengira bahwa trennya turun padahal dari 2005 hingga 2007 menunjukkan kenaikan apabila sumbu Y tidak terbalik. Jadi, usahakan dalam pembuatan sumbu X maupun Y gunakanlah standar penulisan umum yang berlaku.

Terdapat Sumbu yang Terpotong

Nilai pada suatu sumbu sangat penting kaitannya dengan data yang ditampilkan dalam sebuah diagram. Jika penerapannya kurang tepat maka memicu bias bagi pembacanya. Sebagai contoh, lihatlah gambar di bawah ini:
20200415110130421046001b074951aa7f661eb1306e5b.jpeg
Ada “diskon” alias potongan pada sumbu Y sehingga langsung dimulai dari 34, bukan 0. Akibatnya, pembaca dapat menyimpulkan terdapat  kesenjangan potongan pajak yang tinggi antara 1 Januari 2013 dan saat berita tersebut rilis. Padahal nilainya hanya 35% versus 39% sehingga seharusnya tampilan kedua diagram batang tak begitu berbeda tingginya. Di sini kita jadi paham bahwa setiap data pada sumbu Y mutlak harus dimulai dari 0 agar menghindari bias dan salah interpretasi data.

Penggunaan Grafik 3D yang Kurang Sesuai

Pasti kita ingin visualisasi data kita terlihat keren kan? Saat terselip di benak kita untuk menggunakan skema 3 dimensi dalam visualisasi, segeralah cari alternatif lain. Tahukah Anda mengapa penggunaan jenis diagram 3 dimensi kurang disarankan dalam visualisasi data? Dapat memudahkan pembaca dalam memahami data dan tidak terjadi bias supaya tidak menimbulkan perbedaan persepsi tentang data yang disajikan. Contohnya dapat Anda lihat di bawah ini:
2020041511042333a3d46735644233f2509eceea7d02f0.jpeg
Selain penggunaan 3D yang menyebabkan bias, diagram batang di atas juga tidak menuliskan nilai dari sumbu Y dan sumbu X. Pembaca akan kebingungan dan sulit memahami maksud dari informasi yang tersaji.

Susah Dibandingkan

EWVWGIcWBLfyXgC9aCIOJAffSX04SJUITJKzrhgxlIOEr3XN4DXCpdlIxX71EJEuEkiw36O6fhFUNFY2EanWESwf6fkljeNdfgpB80Xm6AQgysQsxRP24gH6kFx0s2G7X-I3KBBf
Visualisasi data bertujuan untuk memudahkan kita membandingkan data yang ada. Namun, contoh di atas menunjukkan sebaliknya. Perbandingan dari setiap data, sulit dipahami. Selain karena menggunakan jenis diagram 3D, tiap diagram lingkaran yang dibuat juga mengandung terlalu banyak data. Seharusnya kita dapat menggunakan jenis diagram lainnya untuk membandingkan atau melihat tren dari beberapa kategori misalnya diagram batang atau diagram garis.
Untuk memahami contoh lainnya mengenai kesalahan dalam visualisasi data, cek di  https://viz.wtf/

Cara Transformasi Data ke Diagram


Diagram adalah sebuah representatif visual terhadap informasi yang menunjukkan bagaimana mereka bekerja sama. Anda mungkin pernah mendengar chart atau graph, kedua hal tersebut merupakan bagian dari diagram. 

Diagram digunakan untuk mempermudah kita memahami informasi dari data yang kita miliki. Ketika kita membicarakan data maka yang paling sering terlintas adalah bentuk baris dan kolom yang berisi informasi, namun berapakah waktu yang kita butuhkan untuk mengerti informasi dalam bentuk baris dan kolom tersebut? Atau ketika kita memiliki banyak poin data, berapa lama waktu yang dibutuhkan untuk mengetahui relasi antar poin data tersebut?
20200414162322adb7e482a6d28e80206b6b9b05b16de8.jpeg
Dari gambar diatas kita dapat lebih mudah memahami bagaimana data bekerja dan berelasi antara satu sama lain. Hal ini disebut sebagai data understanding, nantinya pemahaman ini akan memudahkan kita untuk membuat hipotesa atau analisis lebih dalam terhadap data. 
Ketika kita menganalisa data lebih dalam kita akan menemukan beberapa pemahaman baru yang menunjang hipotesis kita. Untuk menunjukan bahwa hipotesis kita adalah benar, maka kita perlu menunjukan pemahaman tersebut terhadap orang lain. Semakin mudah orang lain paham dengan pemahaman kita maka hipotesis tersebut semakin valid.
20200414162434374516c234574a829d2bdd1da1c64e09.jpeg
Ketika kita memiliki hipotesis bahwa ada 3 orang yang suka buah apel. Dari gambar tabel tersebut kita sulit untuk mendapat justifikasi dari hipotesa karena otak kita harus memproses data dalam tabel tersebut terlebih dahulu. Coba bandingkan ketika kita melihat gambar grafik di bawah.
202004141624584e3264b12acd6f43a5fe51da82689e23.jpeg 
Dengan melihat grafik di atas. sekilas kita dapat melihat bagaimana data tersebut mendukung hipotesa kita karena, secara eksplisit Jill, Sam, dan Seth memakan apel lebih dari rata-rata anak memakan apel sehingga mendukung terdapat 3 orang yang suka memakan buah apel. Jadi fungsi grafik di sini adalah mempersingkat waktu pemahaman orang lain terhadap informasi yang ingin kita sampaikan.

Macam-macam diagram/grafik spreadsheet

Untuk mempermudah penyerapan informasi dari sebuah data, grafik disediakan dalam berbagai macam bentuk. Terdapat banyak tools pengolahan data menjadi grafik seperti halnya Microsoft Excel, Google Sheet, Tableau, Power BI, dan lain sebagainya. Nah sebenarnya tiap-tiap tools menyediakan jenis grafik yang berbeda. Untuk pembelajaran kali ini kita akan mengambil salah satu tools pengolah angka yaitu Google Sheet, kenapa? Karena penggunaan tools ini gratis, cukup mudah karena hampir sama dengan Microsoft Excel, dan tersedia setidaknya 7 jenis grafik yaitu Column, Line, Bar, Area, Pie, Scatter, dan Map yang umum digunakan untuk pengolahan data.

Bar/Column Chart

Adalah jenis grafik di mana setiap kategori diwakili oleh persegi panjang, dengan tinggi persegi panjang yang sebanding dengan nilai agregasi data. Grafik ini juga dikenal sebagai Vertical Bar Chart.
20200414162632dad7b3ac748fcc0b34919ae6913b6db6.jpeg
Column chart menampilkan data untuk satu set kategori, dengan satu nilai untuk setiap kategori. Kita juga dapat menggabungkan lebih dari satu kategori, misalnya saat ingin menghitung pengeluaran dan pemasukan dari setiap bulan selama satu tahun. Pada kasus tersebut kita akan membandingkan jumlah pengeluaran dan pemasukan pada tiap bulan. Apabila kita ingin menggabungkan kategori pengeluaran dan pemasukan ke dalam satu representasi namun berbeda warna, hal tersebut dinamakan Stacked Column Chart. Namun biasanya stacked digunakan untuk melihat persentase atau komposisi dari sebuah kategori.
20200414163200cdd222767e67a6277317e22f82f9b79f.jpeg
Horizontal Bar Chart atau biasa disebut dengan Bar Chart sama persis dengan Column chart, perbedaannya hanya arah dari grafik tersebut yaitu persegi panjang akan memanjang secara horizontal sesuai dengan nilai. Atau bisa dibilang nilai sumbu x dan y ditukar.

Line Chart

Jenis grafik yang menampilkan informasi sebagai serangkaian titik data yang disebut 'penanda' yang dihubungkan oleh segmen garis lurus. Terdiri dari sumbu x horizontal dan sumbu y vertikal. Sebagian besar grafik garis hanya berurusan dengan nilai angka positif, sehingga sumbu ini biasanya berpotongan di dekat bagian bawah sumbu y dan ujung kiri sumbu x. Titik di mana sumbu berpotongan selalu (0, 0). Setiap sumbu dilabeli dengan kategori data.
20200414163416146b76f1746fed3ec4d5066849b3393a.jpeg
Sumbu x juga disebut sumbu independen karena nilainya tidak bergantung pada apa pun. Sebagai contoh, waktu selalu ditempatkan pada sumbu x karena terus bergerak maju terlepas dari apa pun. Sumbu y juga disebut sebagai poros dependen karena nilainya tergantung pada sumbu x.
Anda dapat membuat grafik yang membandingkan jumlah uang yang dipegang oleh setiap kantor cabang dengan garis yang terpisah untuk setiap kantor. Dalam hal ini setiap baris akan memiliki warna yang berbeda. Bahkan Anda bisa menggabungkan Column Chart dengan Line Chart, biasanya hal ini digunakan untuk melihat realita terhadap ekspektasi seperti halnya target penjualan(line) dan hasil penjualan(bar).
Grafik ini adalah alat visual yang kuat untuk pemasaran, keuangan, atau fungsi lain yang melibatkan korelasi antara dua nilai numerik. Jika dua atau lebih garis ada di grafik, itu dapat digunakan sebagai perbandingan di antara mereka.

Area Chart

Memperlihatkan perubahan dalam satu jumlah atau lebih dari waktu ke waktu. Ini mirip dengan Line Chart. Dalam Area dan Line Chart, titik data diplot dan kemudian dihubungkan dengan segmen garis untuk menunjukkan nilai kuantitas pada beberapa waktu yang berbeda. Namun, bagan area berbeda dari grafik garis, karena area antara sumbu x dan garis diisi dengan warna atau bayangan.
2020041416350366c9fb08f0fdab8a288ac39158cf41dd.jpeg
Grafik ini merupakan pilihan yang baik untuk digunakan ketika Anda ingin menunjukkan tren dari waktu ke waktu nilai yang tepat. Dalam bagan area skor ujian, kita dapat melihat bahwa skor pada umumnya meningkat seiring waktu bahkan tanpa mengetahui skor pasti pada setiap ujian tunggal.
Sama seperti Line & Bar Chart, grafik ini juga dapat menggabungkan beberapa nilai agregasi ke dalam satu representasi atau disebut stacked. Bagian stacked menunjukkan seberapa banyak masing-masing bagian berkontribusi terhadap jumlah keseluruhan. Misalnya, pemilik rantai toko grosir mungkin ingin membuat bagan yang menunjukkan keuntungan yang dihasilkan oleh masing-masing tokonya dan total laba yang dihasilkan oleh semua toko bersama.

Pie Chart

Jenis grafik yang menampilkan data dalam grafik lingkaran. Potongan-potongan grafik sebanding dengan fraksi keseluruhan dalam setiap kategori. Dengan kata lain, setiap irisan pai relatif terhadap ukuran kategori tersebut dalam kelompok secara keseluruhan. Seluruh "kue pai" mewakili 100% dari keseluruhan, sedangkan pai "irisan" mewakili bagian dari keseluruhan.
202004141636005bc92fa742f13e3f082aec5a7bb9527d.jpeg
Kita sulit melihat nilai secara presisi dengan grafik ini sulit untuk melihat nilai secara presisi, terutama dengan persentase yang rumit yaitu 13,9% dengan 15%. Ketika dalam bentuk irisan kita tidak dapat melihat secara jelas perbedaan antara kedua nilai tersebut ataupun ketika kita ingin membelah grafik ini ke dalam 10 bagian yang sama besar, akan ada banyak irisan yang kita sulit pahami. Oleh karena itu grafik jenis ini umum digunakan ketika nilai irisan memiliki perbedaan cukup signifikan dan jumlah kategori data yang tidak banyak.

Scatter Chart

Menggunakan titik untuk merepresentasikan nilai numerik pada kategori yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Grafik ini digunakan untuk mengamati hubungan antar variabel.
20200414163641da856292c77a15bd55f2f78ee5f45340.jpeg
Biasanya warna pada titik akan merepresentasikan kategori yang berbeda. Contohnya apabila kita memiliki 100 poin data nilai ujian siswa, di mana terdapat kategori kelas. Dengan menggunakan grafik ini kita dapat melihat relasi antara kelas terhadap nilai ujian. Apabila sebuah kelas memiliki nilai yang tinggi maka akan terlihat banyak titik-titik yang sewarna saling berdekatan. Ataupun kita dapat melihat korelasi antara jenis kelamin terhadap nilai. Hasil dari grafik ini akan mempermudah kita untuk mengelompokkan suatu golongan berdasarkan hipotesa-hipotesa yang kita buat.
Grafik ini juga dapat berguna untuk mengidentifikasi pola lain dalam data. Kita dapat membagi titik data menjadi kelompok berdasarkan seberapa dekat kumpulan titik dikelompokkan bersama. Plot pencar juga dapat menunjukkan apakah ada kesenjangan tak terduga dalam data dan jika ada titik outlier. Ini bisa bermanfaat jika kita ingin membagi data menjadi beberapa bagian, seperti dalam pengembangan persona.

Map Chart

Memungkinkan kita untuk memvisualisasikan hubungan spasial dalam data dengan menunjukkan data pada peta geografis. Misalnya kita ingin melihat penyebaran virus corona (COVID-19) di dunia, kita membuat peta penanda sesuai dengan jumlah orang yang terkena virus. Umumnya pada peta seperti ini, semakin tebal warna hijaunya, semakin intens pula kepadatan datanya. Kita jadi dapat melihat bagian geografis mana yang banyak terkena penyakit tersebut.
20200414163751a981c0015e93d37d56e8fdafbdc92b26.jpeg
Ketika membuat grafik ini kita membutuhkan informasi secara geografis, apakah itu nama lokasi, kota, negara, atau secara spesifik latitude/longitude. Terdapat dua jenis penanda untuk grafik ini yaitu 
  • Poin Geografis: menunjukkan titik data pada peta dengan menunjukkan penanda pada koordinat geografis yang mirip dengan cara bagan XY menempatkan titik pada koordinat XY. Penanda dapat memvariasikan bentuk, warna, dan ukurannya (yang terakhir disebut grafik "Gelembung"). Penanda itu sendiri dapat menjadi diagram lingkaran seperti yang akan kita lihat nanti.
  • Area Geografis: area warna pada peta untuk menunjukkan nilai atau kategori data untuk suatu area. Misalnya, area bisa berupa negara bagian Amerika Serikat dan warnanya dapat menunjukkan nilai numerik untuk setiap negara bagian. Jenis bagan peta di mana kita mewarnai area geografis dikenal sebagai choroplet

Tips Lengkap Menggunakan Pivot Tabel di Google Spreadsheets

Pivot table merupakan sebuah cara yang efektif dalam mengelompokkan data. Untuk memaksimalkan penggunaannya, berikut tips-tips dalam pembuatan pivot table:

  1. Pertama tentukan dulu baris yang ingin dibuat. Di sini kita akan menggunakan jenis indekos. Caranya sama yaitu tekan Add pada bagian Rows kemudian pilih Jenis Kos.
    2020041414505779995a712f994446ce1175fdf50c0bff.jpeg
    Sehingga hasilnya sebagai berikut:
    20200414145137faa9173f9b11a1adffc7383fdf0adde7.jpeg
  2. Berikutnya tambahkan dua nilai (value) baru yaitu Jenis Kos dan Harga per-bulan dengan rincian sebagai berikut:
    20200414145200bb0f1b5f74655b7136c763d479ddfb0a.jpeg
  3. Seperti ditunjukkan gambar pada langkah ke-2 di atas kita telah menambahkan nilai jenis indekos dan harga per-bulan. Sesuai dengan fungsinya, kita ingin mengetahui jumlah jenis indekos yang ada maka pada Summarize by pilih fungsi COUNTA. Sedangkan untuk tahu Harga per-Bulan, kita ingin tahu harga rata-ratanya maka isilah Summarize by dengan AVERAGE. Sehingga hasilnya menjadi seperti di bawah ini:
    202004141453024b0ead591f7eac3bea4f5341f1758152.jpeg

Menambahkan Fitur Penyaringan (filter)

Kita juga dapat melakukan penyaringan dengan menampilkan beberapa data yang kita inginkan. Misal, dari hasil pivot kita hanya ingin menampilkan hasil data dari indekos putra saja. Maka kita dapat menambahkan filter pada pivot table editor seperti berikut:
  1. Pada pivot table editor, klik Add pada bagian Filter dan pilih Jenis Kos.
    2020041414540299c0f9ac47c558104b0e219ad712e85b.jpeg
  2. Selanjutnya terlihat status “Show all items”. Klik tombol dropdown tersebut dan hilangkan centang pada data yang tidak ingin kita lihat. Pada contoh kali ini kita hanya ingin melihat data dari indekos putra saja. Klik OK apabila sudah sesuai.
    20200414145426f7dbfba3ba377a89be2da0bf514d7449.jpeg
  3. Kita telah mendapatkan hasil filter yang menampilkan data indeindekos putra saja dari table pivot. Tampilannya sebagai berikut:
    2020041414545159ea1b78c41de7f5954a3ee2af5b8a04.jpeg

Menampilkan Detail Data dari Pivot Table

Kali ini terdapat sedikit tambahan tips tentang menampilkan detail data dari pivot table. Percayalah, caranya benar-benar sederhana. Misal kita memiliki data pivot table sebagai berikut:
20200414145525914044b3eb7a3020467f102b25d58f09.jpeg
Dari hasil di atas, kita ingin tahu detail indekos campur yang berjumlah empat dengan harga rata-rata per bulan sejumlah 1.165.000 rupiah itu.

Nah, kekuatan super yang dapat dilakukan pivot table adalah mampu menampilkan detail dengan hanya klik dua kali pada salah satu value yang ingin dilihat detailnya. Di sini kita klik dua kali pada alamat sel B2 dan yang terjadi adalah sebagai berikut.
2020041414554928ad816a67d38457f6fec1b26df958c0.jpeg
Dengan sekejap saja Google Spreadsheet membuat sheet baru lagi dengan berisi detail masing-masing dari indekos campur yang berisi pemilik dan harga per bulan. Keren, bukan?