news

Tampilkan postingan dengan label google sheets. Tampilkan semua postingan
Tampilkan postingan dengan label google sheets. Tampilkan semua postingan

Senin, 25 Mei 2020

Apa itu Dokumentasi Data?


Pernahkah mendengar istilah dokumentasi data? Dokumentasi data atau yang sering disebut dengan data provenance adalah sebuah langkah untuk melihat sumber data yang kita peroleh. Kata provenance sendiri berasal dari bahasa perancis provenir yang berarti “berasal” atau dalam istilah juga disebut silsilah. 

Dalam konsep sejarah seni, kata provenance sering digunakan dalam dokumentasi sebuah karya seni sehingga setiap detailnya tetap tercatat. Misalnya kapan pertama kali sebuah karya seni diciptakan dari sisi ide, eksekusi, hingga akhirnya menjadi yang dapat kita nikmati saat ini. 
Contoh lainnya, coba bayangkan Anda berperan sebagai seorang Data Scientist. Anda mendapatkan sebuah dataset yang siap untuk dianalisis. Anda tidak tahu data ini berasal dari mana, bagaimana validitasnya, apakah ia akan berubah selama proses pengerjaan Anda, dan sebagainya. Gawat kan? Padahal dokumentasi data ini penting untuk mengetahui keabsahan data dan memungkinkan kita menggunakannya kembali di waktu yang lain.
W3C Provenance Incubator Group menjelaskan tentang dokumentasi data sebagai berikut:
“a record that describes entities and processes involved in producing and delivering or otherwise influencing that resource. Provenance provides a critical foundation for assessing authenticity, enabling trust, and allowing reproducibility. Provenance assertions are a form of contextual metadata and can themselves become important records with their own provenance.”
Terdengar rumit? Baiklah. Berikut ini contoh sebuah penggambaran dokumentasi data yang ditunjukkan dalam sebuah metadata.
20200415111156eccc5b94c1893e6cab12243818924ff4.jpeg
Contoh data provenance di atas didapat dari website kaggle. Pada gambar di atas terlihat dokumentasi yang menyertakan sumber data, metodologi pembuatan data, dan juga pemilik dari dataset. Berikut contoh lain dari dokumentasi data yang familiar bagi Anda.
20200415111156602278bd47814103a7a8325a83f3a005.jpeg
Tampilan di atas merupakan version history dari berkas Google Spreadsheet. Semua perubahan data tercatat mulai dari tanggal hingga nama orang yang melakukan perubahan. Version history ini dapat Anda temukan saat klik bagian berikut:
20200415111419130a0dfa1c32687dbdba7f6d95f5f2df.jpeg 
Untuk dapat kembali ke penulisan sebelumnya kita dapat melakukan restore version dengan memilih dari riwayat penulisan dan klik Restore this version.
20200415111452c24cd60a851b1bc7293d2243a6964010.jpeg

Menggambarkan Kuantitatif Data ke Bentuk Diagram


Untuk penggunaan grafik secara lebih rinci akan kita bahas pada pembelajaran selanjutnya. Diharapkan pada pembelajaran kali ini setidaknya Anda bisa mengetahui struktur data yang dapat digunakan untuk membuat grafik-grafik tersebut. Nah kini, setelah teori, tak lengkap rasanya tanpa latihan. Pada bagian kali ini kita akan belajar untuk membuat data ke dalam sebuah grafik menggunakan Google Sheet. Jenis grafik dalam Google Sheet bisa dikombinasikan dengan jenis model lainnya. Misalnya, diagram batang dapat dikombinasikan dengan diagram garis. Namun, penerapannya juga harus sesuai dan tidak dipaksakan supaya data dapat mudah dipahami.

Oke, dalam latihan ini kita akan menggunakan data kamar Airbnb yang disewakan di New York yang bisa diunduh melalui Kaggle.
Dataset: New York City Airbnb
Deskripsi: Sejak 2008, para tamu dan tuan rumah telah menggunakan Airbnb untuk memperluas kesempatan travelling dan menghadirkan cara yang lebih unik dan personal untuk mengalami dunia. Dataset ini menjelaskan aktivitas cantuman dan metrik di NYC, New York untuk 2019.
Tools: Google Sheet
Untuk mengunduh data dari Kaggle harus memiliki akun Kaggle terlebih dahulu.
Untuk menggunakan Google Sheet harus memiliki akun Gmail terlebih dahulu.

Langkah 1: Persiapan

Pastikan semua tools dan data sudah dipersiapkan. Setelah semua siap, maka buat Google Sheet baru.
202004141645398b04d5dbad1506c0b6be48b835eda3e0.jpeg
Data yang kita unduh sebelumnya memiliki ekstensi .zip, oleh karena itu kita perlu untuk unzipped file tersebut. Untuk memasukkan data dari komputer ke Google Sheet, klik File → Import dan pilih/taruh berkas yang ingin dimasukkan.
20200414164612f1bb0a5737cccc199cd98bbe0209c40c.jpeg
Unggah berkas AB_NYC_2019.csv dari data yang telah kita ekstrak dan masukkan konfigurasi seperti gambar di bawah. Setelah itu klik Import data. Sheet akan terisi dengan data dari berkas yang kita unggah.
20200414164758e961294a5f2bad1ead1867979d2242e7.jpeg
Sheet akan terisi dengan data dari berkas yang kita unggah seperti berikut:
2020041416484720c7f5179040346d62ffb9ada84873bd.jpeg

Langkah 2: Visualisasi

Preparasi data dan semua data sudah berhasil ditampilkan, bukan? Sekarang saatnya kita mulai membuat visualisasi data-data tersebut. Caranya sangat mudah, kita tinggal memilih kolom dan baris mana yang ingin kita visualisasikan. Nah sebelum kita memilih kolom dan baris untuk divisualisasikan, kita perlu memahami maksud dari data tersebut. Mulailah dari deskripsi secara global data sampai dengan arti kolom dan isinya. Pertama kita mengetahui bahwa data ini merupakan data kamar Airbnb yang disewakan. Namun apa sajakah arti tiap kolom pada data tersebut?
  • Id : Identifier unik untuk tiap tempat sewa
  • Name : Nama tempat
  • Host_id : Identifier penyedia kamar/tempat
  • Host_name : Nama penyedia kamar/tempat
  • Neighbourhood_group : Kelompok lingkungan dari tempat tinggal yang disediakan host, merupakan pengelompokan dari neighbourhood
  • Neighbourhood : Nama dari lingkungan tempat tinggal yang disediakan host
  • Latitude & longitude : Garis lintang dan garis bujur dari tempat tinggal yang disediakan
  • Room_type : Tipe kamar yang disediakan
  • Price : Harga sewa per malam
  • Minimum_nights : Minimal sewa per malam
  • Number_of_reviews : Jumlah ulasan oleh pelanggan
  • Last_review : Tanggal review terakhir
  • Reviews_per_month : Rasio banyaknya ulasan perbulan
  • Calculated_host_listings_count : Jumlah daftar per host
  • Availability_365 : Beberapa hari ketika daftar tersedia untuk pemesanan
Atau untuk lebih mengetahui deskripsi data, lihatlah di sini. Setelah kita mengetahui maksud dari kolom dan isian data tersebut kita mulai dapat membuat pertanyaan pada diri sendiri, sebagai contohnya “Saya ingin melihat perbandingan rata-rata harga tiap tipe kamar.”
Dari sana kita tahu bahwa kolom yang kita gunakan adalah room_type dan price dengan menggunakan semua baris. Untuk mulai membuat visualisasi klik kolom I (room_type) dan J (price) dengan menekan shift, maka akan tampil seperti gambar di bawah ini
20200414170832dfeafdd9af31068367a3b84255007383.jpeg
Pemilihan data bisa digunakan dengan membuat pivot table, dari tabel tersebut kita dapat memilih baris dan kolom yang diinginkan untuk membuat visualisasi.
Setelah data yang dibutuhkan telah dipilih, kita dapat memvisualisasikan dengan klik Insert → Chart.
20200414170952ab42d01a0847ede76eebbb6fd2ab2fe4.jpeg 
Secara standar grafik yang pertama terbentuk adalah Grafik kolom dengan X Axis adalah room_type dan Y Axis adalah sum (penjumlahan) dari price.
20200414171015048d3ec2a10ce5392ab3b7d269f2c307.jpeg
Nah bisa kita lihat bahwa grafik yang terbentuk tidak rapi. Terlalu banyak data poin pada X Axis. Hal tersebut dikarenakan kita tidak melakukan grouping atau pengelompokan. Oleh karena itu silakan a ceklis tombol Aggregate untuk melakukan agregasi terhadap room_type yang sama. Maka visualisasi akan berubah seperti gambar di bawah ini.
20200414171037eab5e86e5e2a9a8729b6584c741106d4.jpeg 
Untuk merubah jenis grafik yang diinginkan dan sesuai dengan jenis data yang kita pilih, klik Chart type pada Chart editor. Misalnya jika kita ingin merubah tampilan grafik menjadi bentuk Grafik Pie, cukup klik bentuk Grafik Pie yang kita inginkan.
2020041417113955f9a7fa24eda0ccee29f9aa98695116.jpeg 
Lalu grafik sebelumnya akan berubah seperti di bawah ini.
20200414171201fc6b2346af831733553ab32e14504636.jpeg
Perlu diingat bahwa nilai Y Axis di sini masih menggunakan nilai awal yaitu sum. Untuk merubah menjadi rata-rata kita dapat dengan mengklik seperti gambar di bawah dan menggantinya menjadi average.
20200414172047d94b56af4d927fa297b85315a50395c0.jpeg
Sehingga hasil grafiknya seperti berikut.
202004141721418c0417ab54655274566d0496723b7a88.jpeg
Nah hal yang perlu diperhatikan adalah setiap tipe grafik masing-masing memiliki kebutuhan data yang berbeda-beda. Seperti halnya pada grafik kolom sebelumnya, data yang dibutuhkan ada X Axis dan Y Axis. Sementara itu pada bentuk grafik kolom kombo area, Y Axis dapat dimasukkan oleh beberapa data lainnya sebagai perbandingan seperti gambar di bawah ini.
20200414172817a27634052afa33fc4eace66297f7fbfc.jpeg
20200414172834c969d4c0a6970c99070ee24940082ba3.jpeg
Untuk melakukan styling pada font, legend, warna, dan lainnya, lakukan konfigurasi sesuai jenis grafik yang kita pilih pada bagian Customize. Setelah mengetahui itu semua ini saatnya Anda mencoba sendiri dan pelajari terus potensi-potensi yang ada untuk membuat grafik yang lebih kompleks dan lebih mudah dipahami.
20200414172900babb7b197f2737a3b69172d64d74bbe0.jpeg

Tips Lengkap Menggunakan Pivot Tabel di Google Spreadsheets

Pivot table merupakan sebuah cara yang efektif dalam mengelompokkan data. Untuk memaksimalkan penggunaannya, berikut tips-tips dalam pembuatan pivot table:

  1. Pertama tentukan dulu baris yang ingin dibuat. Di sini kita akan menggunakan jenis indekos. Caranya sama yaitu tekan Add pada bagian Rows kemudian pilih Jenis Kos.
    2020041414505779995a712f994446ce1175fdf50c0bff.jpeg
    Sehingga hasilnya sebagai berikut:
    20200414145137faa9173f9b11a1adffc7383fdf0adde7.jpeg
  2. Berikutnya tambahkan dua nilai (value) baru yaitu Jenis Kos dan Harga per-bulan dengan rincian sebagai berikut:
    20200414145200bb0f1b5f74655b7136c763d479ddfb0a.jpeg
  3. Seperti ditunjukkan gambar pada langkah ke-2 di atas kita telah menambahkan nilai jenis indekos dan harga per-bulan. Sesuai dengan fungsinya, kita ingin mengetahui jumlah jenis indekos yang ada maka pada Summarize by pilih fungsi COUNTA. Sedangkan untuk tahu Harga per-Bulan, kita ingin tahu harga rata-ratanya maka isilah Summarize by dengan AVERAGE. Sehingga hasilnya menjadi seperti di bawah ini:
    202004141453024b0ead591f7eac3bea4f5341f1758152.jpeg

Menambahkan Fitur Penyaringan (filter)

Kita juga dapat melakukan penyaringan dengan menampilkan beberapa data yang kita inginkan. Misal, dari hasil pivot kita hanya ingin menampilkan hasil data dari indekos putra saja. Maka kita dapat menambahkan filter pada pivot table editor seperti berikut:
  1. Pada pivot table editor, klik Add pada bagian Filter dan pilih Jenis Kos.
    2020041414540299c0f9ac47c558104b0e219ad712e85b.jpeg
  2. Selanjutnya terlihat status “Show all items”. Klik tombol dropdown tersebut dan hilangkan centang pada data yang tidak ingin kita lihat. Pada contoh kali ini kita hanya ingin melihat data dari indekos putra saja. Klik OK apabila sudah sesuai.
    20200414145426f7dbfba3ba377a89be2da0bf514d7449.jpeg
  3. Kita telah mendapatkan hasil filter yang menampilkan data indeindekos putra saja dari table pivot. Tampilannya sebagai berikut:
    2020041414545159ea1b78c41de7f5954a3ee2af5b8a04.jpeg

Menampilkan Detail Data dari Pivot Table

Kali ini terdapat sedikit tambahan tips tentang menampilkan detail data dari pivot table. Percayalah, caranya benar-benar sederhana. Misal kita memiliki data pivot table sebagai berikut:
20200414145525914044b3eb7a3020467f102b25d58f09.jpeg
Dari hasil di atas, kita ingin tahu detail indekos campur yang berjumlah empat dengan harga rata-rata per bulan sejumlah 1.165.000 rupiah itu.

Nah, kekuatan super yang dapat dilakukan pivot table adalah mampu menampilkan detail dengan hanya klik dua kali pada salah satu value yang ingin dilihat detailnya. Di sini kita klik dua kali pada alamat sel B2 dan yang terjadi adalah sebagai berikut.
2020041414554928ad816a67d38457f6fec1b26df958c0.jpeg
Dengan sekejap saja Google Spreadsheet membuat sheet baru lagi dengan berisi detail masing-masing dari indekos campur yang berisi pemilik dan harga per bulan. Keren, bukan?

Belajar Elemen Pivot Tabel di Google Spreadsheets

Bicara mengenai pivot table, erat kaitannya dengan kolombaris, dan nilai (value). Seperti yang telah kita lakukan pada materi sebelumnya, hasil pivot tersebut pasti mengandung ketiga elemen tadi yaitu kolom, baris, dan nilai. Mari kita bedah satu per satu setiap elemennya.


Baris

20200414144445f58efc371258a043be2e4ff5e213c2fd.jpeg
Elemen pertama yang akan kita bahas adalah baris. Pada saat klik tombol Add pada bagian Rows di Pivot table editor, secara otomatis sistem akan memberikan Anda pilihan nama judul dari setiap kolom yang Anda buat. Ketika kita memilih salah satu, misalnya “pemilik,” sistem akan menampilkan data nama pemilik yang ada secara unik. Unik di sini menjelaskan bahwa jika terdapat nama pemilik yang sama, seperti “Budi” yang disebut 2 kali, maka yang tampil dalam pivot hanya satu saja.

Kolom

20200414144642b1fc410b6ffb53a799e52293691da5ec.jpeg 
Sama seperti membuat baris data berdasarkan nama judul dari setiap tabel secara mendatar dalam bentuk kolom sehingga nantinya data nilai tampil dalam bentuk agregat setiap kolom.

Nilai (Value)

2020041414470149bd86dae063f9c079973ee99e9fea8c.jpeg
Ketika kita menekan tombol Add pada bagian Values, sistem akan menyuguhkan pilihan yang sama seperti pada baris dan kolom. Misal pilihannya ada pemilik, jenis indekos, dan harga per bulan. Nah, jika kita mengisinya dengan jenis indekos dan fungsi penghitungnya menggunakan COUNTA, maka semua data yang ada berdasarkan jenis indekos akan dihitung dan disesuaikan dengan nama pemilik indekos. Misalnya gambar di atas menunjukkan nama pemilik Alan memiliki nilai 2 indekos yang ia kelola dan berjenis campur. Begitu pula data jenis indekos lainnya. Jumlah yang ditampilkan berdasarkan nama pemilik indekos masing-masing.

Total

Pada saat membuat pivot pada baris atau kolom, di bagian bawah terdapat show totals yang dapat dicentang atau tidak. Jika dicentang maka tabel akan menampilkan grand total, dan sebaliknya.
202004141447413b5842efc5e445b66aaa0347fa1e19ff.jpeg
2020041414475439dd5d475cc246161daf685337f00841.jpeg

Penyaringan

Setiap baris dan kolom memiliki sistem pengurutan berdasarkan parameter masing-masing. Misal pada baris pemilik terdapat pengaturan untuk mengurutkan datanya secara ascending (naik) atau descending (turun) berdasarkan abjad awal dari setiap nama pemilik. Misalkan seperti berikut:
202004141448377b530975e8496620bb1335ff89b1b736.jpeg
20200414144849e58e7f1820b7246298b8dee15b8504cc.jpeg

Belajar Pivot Table Dasar di Google Spreadsheets

Untuk membantu menjelaskan pivot dalam spreadsheet, berikut akan gambarannya lewat contoh data harga indekos per bulan.

20200414135914979335eda833286160c9e1fedba79424.jpeg
Menurut Anda, bagaimana jika kita ingin mengetahui berapa jumlah indekos putra dan total harga per bulannya? Mungkin Anda pernah menggunakan fungsi COUNTIF (menghitung jumlah data berupa teks dengan parameter tertentu) dan SUMIF (menjumlahkan data berupa angka sehingga diketahui jumlah keseluruhannya) untuk menyelesaikan permasalahan tersebut. 
Namun, bagaimana jika contoh kasusnya diganti dengan berapa jumlah indekos putri dan total harga per bulannya? Pasti Anda akan mengganti rumus tersebut dan terkesan kurang praktis dan efisien. Nah, di sinilah waktunya kita menggunakan pivot agar lebih fleksibel dalam mengetahui sebuah kelompok data yang diinginkan. Cukup dengan beberapa klik, kita bisa mengetahui hasilnya sebagai berikut:
20200414140232f2634db118e248f61aa13257f8d123a0.jpeg
Berdasarkan contoh di atas kita dapat mengetahui jumlah dan harga indekos per bulan berdasarkan jenisnya. Dengan ini bisa disimpulkan bahwa pivot table dapat bantu mengumpulkan dan mengelompokkan data berdasarkan parameter tertentu sesuai kebutuhan. Sebelum membuat pivot, pastikan data Anda sudah rapi atau bisa dirapikan dulu baik dari kategori, nilai, dan sebagainya.

Membuat Pivot Table dari Data Sederhana

Sudah coba membuat pivot table dengan contoh data di atas? Jika belum yuk kita belajar bersama membuat pivot tabel sederhana dengan contoh data di bawah ini:
202004141404169a6666a473a69c77db2fd7fe5a0288b3.jpeg
Contoh data di atas merupakan modifikasi dari tabel sebelumnya dengan menambahkan nama pemilik. Penerapan pivot table pun jadi lebih detail. Untuk memulai, simak langkah-langkahnya di bawah ini ya.
  1. Pertama pastikan Anda sudah membuat tabel data seperti contoh di atas, kemudian sorot semua data.
    202004141405052155f2e8cea97f965e55f09f9de7b3e4.jpeg
  2. Setelah itu pilih menu Data - Pivot table.
    2020041414250345eec336ef35ff289abbecc197a2618a.jpeg
  3. Muncul jendela baru Create pivot table. Pilih  New Sheet supaya data hasil pivot dibuat pada sheet lain sehingga tidak bercampur dengan data asal. Namun, jika Anda menghendaki hasil pivot diletakkan dalam sheet yang sama maka pilih Existing sheet. Setelah itu klik Create.
    202004141428445cb17e23cf6c63cd8c560e13b413403b.jpeg
  4. Setelah itu muncul sheet baru dengan isi RowColumn, dan Values. Serta di samping kanan terdapat Pivot table editor seperti di bawah ini.
    202004141430147b878e9162acb1d78768e535da92b0c1.jpeg
  5. Selanjutnya kita tentukan data apa yang ingin dikelompokkan dengan pivot table. Misal, kita ingin melihat setiap pemilik mengelola beberapa jenis tempat indekos.
  6. Dari kondisi di atas, kita coba masukkan ke dalam pivot table editor. Untuk menambahkan nama pemilik indekos, kita dapat memasukkannya ke dalam Rows dengan klik tombol Add dan pilih Pemilik.
    20200414143120db5491c8266c050c3209b6bf9d2d1479.jpeg
  7. Hasil yang didapatkan dari langkah tersebut adalah menampilkan baris nama pemilik seperti di bawah ini.
    20200414143150d48089ed6dc340bfb81d4a41fb5222f0.jpeg
  8. Selanjutnya kita ingin mengetahui jenis indekos yang ada. Anda dapat mulai menambahkan kolom baru pada Pivot table editor dengan klik Add - pilih Jenis Kos.
    20200414143218c3d19c44d310f8b88e858e27f67e15ac.jpeg
  9. Hasil yang didapatkan setelah menambah kolom jenis indekos pada pivot table editor adalah menampilkan jenis indekos yang ada dalam bentuk kolom seperti berikut:
    20200414143415992a98968900ca1d7adc67817b708f41.jpeg
  10. Kemudian untuk mengetahui berapa jumlah indekos yang dikelola setiap pemiliknya, pada Pivot table editor bagian value, klik Add - pilih Jenis Kos.
    2020041414350312050820ae75cc6de8cb15fd5766333f.jpeg
  11. Nah, saat ini kita telah mengetahui setiap pemilik mengelola berapa jenis indekos dari data yang telah dikelompokkan di bawah ini.
    202004141435330169b9e63e7b40aef78c8212a6a09c95.jpeg
Berdasarkan hasil pivot table di atas kita telah berhasil mengetahui setiap pemilik mengelola berapa jenis indekos. Misal, Alan memiliki 2 indekos berjenis campur, Budi memiliki 1 indekos campur dan 2 indekos putra, dan lain seterusnya. Yay, kita telah berhasil membuat pivot table. Selanjutnya kita akan melanjutkan pembahasan mengenai elemen setiap pivot table. Yuk, lanjut ke materi berikutnya