Senin, 09 Maret 2009

We are Drowning in Data but Starving for Knowledge!

Biasanya pembahasan tentang data mining dimulai dari cerita tentang apa yang disebut sebagai “ledakan data”. Disebutkan di sejumlah referensi bahwa jumlah data di dunia mengganda menjadi 2 kali lipatnya setiap 20 bulan. Hal itu terjadi karena data bertambah dalam orde per detik, serentak, melalui berbagai jalur, dan dalam partai besar, mulai dari data web, data e-commerce, data pembelian di grosir dan supermarket, data transaksi di bank, data telekomunikasi, hingga data satelit. Hal itu juga tidak lepas dari dampak perkembangan cepat bidang perangkat keras yang membuat komputer sebagai alat pengumpul data menjadi kian murah, tapi pada saat yang sama, juga kian powerful. Di lain pihak peningkatan data yang eksponesial itu sama sekali tidak diimbangi oleh jumlah analis data (Lihat gambar di bawah). Terciptalah di dunia ini apa yang disebut sebagai “onggokan data raksasa” dan tercetuslah idiom yang terkenal ini: “We are drowning in data but starving for knowledge!”. Ya, kita semua tenggelam dalam data tapi dilanda kelaparan akan pengetahuan, kurang lebih menyerupai ayam mati di lumbung padi. Data mining lahir untuk memecahkan masalah ini.



Dengan menggabungkan beberapa definisi dari beberapa sumber, saya merumuskan ini dia definisi yang paling komprehensif untuk data mining: eksplorasi dan ekstraksi non-trivial akan informasi / pola / aturan yang implisit, tidak diketahui sebelumnya, dan potensial berguna dari sekumpulan besar data menggunakan kakas otomatis atau semiotomatis. Jika kita harus menerjemahkan setiap istilah penting ke dalam bahasa Indonesia, definisi di atas menuntun kita untuk menerjemahkan data mining cenderung sebagai “penambangan data” alih-alih "pertambangan data”. Kenyataannya kita tidak harus, bahkan tidak perlu, menggunakan bentuk Indonesia untuk setiap istilah kita karena, seperti yang kita ketahui bersama, data mining tetap disebut data mining, bahkan kebanyakan tanpa dicetak miring, dalam artikel-artikel berbahasa Indonesia.

Referensi:
- Introduction to Data Mining (Tan, Steinbach, & Kumar)
- Data Mining Concepts and Techniques (Han & Kamber)

0 komentar: