Merapikan Data dengan Open Refine

Sekarang eranya OPEN DATA.

Undang-Undang Keterbukaan Informasi Publik (KIP) No. 14 tahun 2008 memberikan amanat kepada seluruh instansi pemerintahan mulai level pusat sampai daerah untuk membuka datanya kepada masyarakat.

Salah satu implementasinya, pemerintah pusat membangun suatu portal open data yaitu data.go.id sebagai wadah data pemerintahan dan komunitas.

Data pemerintahan yang disimpan di portal tersebut memiliki format CSV (Comma Separated Value). Dengan format tersebut, data akan mudah diproses oleh komputer atau aplikasi lain sehingga memiliki nilai tambah dan kebermanfaatan. Contoh : http://smartcity.jakarta.go.id/

Persoalannya, sebagian besar data yang dimiliki pemerintah masih berupa format dokumen (doc, docx), spreadsheet (excel), PDF, gambar (JPG, PNG), atau bahkan lembaran-lembaran kertas. Selain itu, data tersebut juga masih belum rapi dan inkonsisten.

Tentu saja perlu ada usaha untuk melakukan

  • konversi dari berbagai macam format data di atas menjadi format yang machine readable. Selain itu,
  • perlu dipastikan pula bahwa data yang siap dibuka sudah bersih, rapi, dan konsisten.

Jika teman-teman sekalian sedang atau akan melakukan pekerjaan nomor dua (2), maka insya Allah, tutorial ini cocok untuk teman-teman semua.

Jika teman-teman sekalian sedang atau akan melakukan konversi data dengan format PDF menjadi CSV, maka insya Allah bagian BONUS tutorial ini juga cocok untuk teman-teman semua.

Tutorial ini masih versi awal dan perlu banyak perbaikan. Kami berharap komentar dan masukan yang membangun untuk kebermanfaatan yang lebih optimal.

link tutorial : bit.ly/rapikandata

Happy refining!