Senin, 09 Maret 2009

Kenapa Data Mining Disebut sebagai “Ilmu Muda yang Prospektif”? (part 1)

Untuk menjawab pertanyaan tersebut, pertama-tama tentu saja pastikan bahwa kita memahami apa itu data mining. Inilah makna dari pepatah Arab “Fahmus su’al nishfuj jawab” : mengerti maksud dari pertanyaan adalah separuh jalan menuju jawaban. Jangan bermimpi bisa menjawab pertanyaan – pertanyaan apapun itu – dengan benar jika maksud dari pertanyaan atau bahkan maksud dari subpertanyaan pun kita tidak mengerti; sedangkan orang yang mengerti maksud pertanyaan pun belum tentu kemudian menjawabnya dengan benar karena dari posisi orang itu ke jawaban yang benar masih ada jarak separuh jalan lagi. Oleh sebab itu jika ketika mendapat pertanyaan tersebut kita justeru balik bertanya, “Data mining itu semacam data tentang perusahaan tambang di dunia bukan?” atau bahkan “Data mining itu makanan apa ya?”, alamat kita harus membaca dulu artikel saya yang satu ini.

Jika kita sudah relatif tidak bermasalah dengan pengetahuan dasar data mining yang merupakan modal utama untuk menjawab pertanyaan di atas, kita masih harus mengupas pertanyaan di atas lebih lanjut sebelum menjawabnya – seperti mengupas bawang: sesiung demi sesiung. Apa sesungguhnya yang benar-benar ditanyakan dengan pertanyaan itu? Kenapa data mining disebut sebagai “ilmu muda yang prospektif”? dengan kata muda dicetak miring atau Kenapa data mining disebut sebagai “ilmu muda yang prospektif”? dengan kata prospektif dicetak miring? Itu adalah dua pertanyaan yang berbeda. Untunglah kita akan menjawab kedua-duanya.

Kenapa data mining disebut sebagai “ilmu muda yang prospektif” dapat dijelaskan pertama-tama dengan memperhatikan tabel yang disebut sebagai timeline evolusi teknologi basisdata di bawah ini.



Timeline di atas jelas menunjukkan bahwa ternyata data mining masih muda, bahkan remaja! Jika dianalogikan dengan fase kehidupan manusia ia berada di sekitar usia SMP atau SMA pada hari ini. Bandingkan dengan usia bapak dan abang-abangnya di mana ia belajar dan mengambil ide dari mereka: matematika /statistik yang sudah ratusan atau bahkan ribuan tahun, teknologi mesin pembelajar yang sudah berkepala lima, dan teknologi basisdata yang sudah setengah baya. Sebagaimana kata Plato “Necessity if the mother of invention” data mining adalah penemuan baru era 90-an yang tampil sebagai jawaban atas kebutuhan yang tidak ada sebelumnya. Kebutuhan baru itu adalah kebutuhan untuk membuat “onggokan data raksasa” – onggokan ajaib yang baru ditemukan pada beberapa tahun yang lalu itu – tidak sekedar sebagi onggokan, namun bisa menjadi lahan pertambangan penghasil emas permata pengetahuan dan informasi yang berkilauan penuh manfaat.

Akan tetapi perlu saya tekankan di sini bahwa meskipun data mining sebagai sebuah disiplin ilmu yang tersendiri dan mapan adalah sangat belia, sesungguhnya cikal bakal tradisionalnya telah ada bahkan sejak kehidupan manusia berawal. Jika data mining hanya dipandang sebagai analisis pencarian pola dari data minus aspek otomatisasi dan skalabilitasnya, maka analisis pencarian pola sudah dilakukan bahkan oleh bapak-bapak kita di awal kehidupan manusia. Pemburu mencari pola pergerakan binatang buruan; petani mencari pola musim dan pertumbuhan tanaman; politisi mencari pola opini pemilih; bahkan para pecinta mencari pola respon para kekasih mereka. Itu semua adalah bentuk-bentuk pencarian pola dari data dalam bentuk-bentuknya yang paling tradisional. Sungguh sayang, dengan menyesal kita menyatakan bahwa praktik-praktik bapak-bapak kita tersebut tidak bisa kita kategorikan sebagai data mining karena batasan-batasan kerumitan yang kita tetapkan dan tentu saja… agar data mining tetap bisa kita nyatakan sebagai ilmu yang masih belia nan imut. (To be continued…)

Referensi:
- Introduction to Data Mining (Tan, Steinbach, & Kumar)
- Data Mining Concepts and Techniques (Han & Kamber)
- Data Mining: Practical Machine Learning Tools and Techniques (Witten & Frank)

0 komentar: