Saturday, June 19, 2010

Pentaho Data Integration 3.2 : Beginner's Guide



Tidak bisa dipungkiri lagi,  Pentaho Data Integration (PDI) atau Kettle adalah primadona di proyek Pentahodan merupakan salah satu utilitas ETL terbaik di pasaran saat ini.

Sudah dua tahun ini Kettle membantu PHI memecahkan banyak kasus pengolahan data yang sulit dan melibatkan banyak sumber data. Sebagai konsultan dan trainer data warehouse, hampir tidak ada kasus yang tidak dapat dipecahkan oleh Kettle baik dari sisi solusi maupun performa

Di samping itu saya sendiri sudah lama menunggu datangnya buku yang cukup komprehensif untuk PDI ini. Dan akhirnya penantian itu datang juga dengan terbitnya buku dari Packt publishing dengan judul "Pentaho Data Integration 3.2 : Beginner's Guide".

Buku ini merupakan karangan María Carina Roldán yang merupakan salah satu kontributor artikel tutorial PDI di wiki Pentaho. Terima kasih saya sampaikan kepada Packt karena diberi kesempatan untuk mereview versi e-book buku tersebut pada bulan ini.

Kesan positif langsung hinggap di diri saya ketika telah membaca daftar isi dan bab awal buku ini, beberapa pertanyaan dasar dan sering diajukan langsung terjawab dengan penjelasan singkat dan jelas :

"Apa sih itu ETL ? "

"Kenapa data warehouse membutuhkan utilitas ETL ? "

"Pentaho Data Integration sebagai ETL "

Kesan positif tadi kemudian berlanjut dengan konsisten melalui contoh  : Hello World versi ETL / Kettle. Dari contoh tersebut langsung diekspresikan berbagai konsep dasar Spoon (utilitas grafis Kettle) :
- Cara menjalankan Spoon
- Pembentukan Step
- Row / Hop
- Running / Preview
- Membaca log console

Sangat dasar sehingga user dapat langsung memahami apa yang terjadi. Ini dimungkinkan karena penjelasan dilengkapi dengan banyak screenshot pengerjaan dan gambar/skema konsep yang jelas. Sesuatu yang kadang membutuhkan beberapa saat dari peserta untuk mendapatkan gambaran yang sama pada sesi training yang kami lakukan.

Penyampaian pada saat memasuki sesi praktis juga sangat baik, satu per satu contoh disampaikan dengan instruksi penggunaan "step" Kettle yang digunakan. Baru kemudian dilanjutkan dengan pembahasan dari apa yang telah dilakukan. Ini mengakibatkan buku tidak menjadi terlalu bertele-tele.

Konsistensi penyampaian terjaga terus sampai dengan bab-bab berikutnya. Halaman-halaman pada buku   tetap kaya akan screenshot dan gambar / skema konsep.

Urutan source data yang dibahas juga sangat bertahap. Dimulai dari pengolahan file teks, XML, spreadsheet / Excel, relational database / MySQL, dan sampai akhirnya pada pembentukan datamart.

Akhir kata, tanpa bermaksud berpromosi terlalu berlebihan buku ini sangat direkomendasikan buat pembaca yang baru akan mengenal Pentaho Data Integration. Bahkan pengguna lama sekalipun akan banyak  mendapatkan manfaat dari buku ini.

Tertarik ? Silahkan mengunjungi situs buku ini atau download bab contoh dalam format PDF : "Developing and Implementing a Simple Datamart".