Tuesday, September 9, 2008

OpenBravo Mengadopsi Pentaho

Pentaho makin menunjukkan ‘keperkasaan’-nya dengan diadopsi sebagai bagian dari solusi beberapa ERP open source.


Berita terbaru adalah bahwa OpenBravo - pemain ERP open source berbasis web - telah bersepakat mengadopsi Pentaho ke dalam produknya dalam skema OEM.

Berita selengkapnya dapat dibaca di situs Pentaho dan OpenBravo.


Hm… sepertinya Pentaho akan menjadi mainstream di dunia reporting open source neh. Dan mungkin pula dengan model open source yang diusungnya akan segera menyusul produk proprietary dalam hal kecepatan dan kualitas ?


Kita lihat saja perkembangan yang semakin menarik ini...

Feris

Tuesday, September 2, 2008

Enterprise Information Integration (EII) dan Pentaho Platform

Pada saat ini kita selalu menggunakan utilitas ETL - seperti Kettle, Microsoft DTS/SSIS, Informatica, aplikasi buatan Anda sendiri, dan lain sebagainya - untuk menggabungkan berbagai data source yang berbeda (Excel, CSV, MySQL, dsbnya) ke dalam suatu sistem database tunggal sehingga bisa di-relate dengan baik dan mudah seperti sesama database SQL Server, Oracle, MySQL, dsbnya. Penyajian laporan setelah sumber data di suatu tempat juga tidak merepotkan tentunya.

Tapi pada saat ini dengan makin beragamnya sumber data terutama yang berasal dari web service dan ada beberapa kendala dimana pengguna boleh melihat data tapi tidak boleh menyimpan sumber datanya (berkaitan dengan policy) maka posisi kita menjadi sulit.

Untuk contoh web service misalnya, apa yang bisa kita lakukan adalah mengerti API dan mengambil data berdasar parameter tertentu dan baru kemudian kita gabungkan dengan sumber data lainnya secara "on the fly".

Bagaimana kalau kita tidak begitu mengerti API tersebut atau sangat memakan waktu untuk melakukan programming / coding lagi ?

Beruntung untuk Anda yang sudah menggunakan Pentaho Reporting, Kettle dan Pentaho platform. Kenapa ? Karena dengan Kettle kita bisa mengambil berbagai source tersebut dengan designer Spoon, menempatkan file transformation yang dihasilkan di dalam platform, dan hasil dari data integrasi Kettle inilah yang akan sumber data untuk laporan dengan menggunakan Pentaho Reporting. 

Solusi integrated dan looseless seperti ini serign  disebut dengan istilah Enterprise Information Integration (EII).

Anda ingin tahu langkah demi langkah cara penggabungan seperti itu ?

Anda dapat membaca artikel teknisnya di :

http://www.nicholasgoodman.com/bt/blog/2007/08/15/using-kettle-for-eii/.

Walau ini artikel lama, tapi tentunya artikel dari Nicholas Goodman (salah satu inisiator Pentaho) ini tidak boleh dilewatkan begitu saja - karena membahas tentang solusi EII yang telah saya ringkas di atas.

Selamat Mencoba !

Feris

Saturday, August 30, 2008

Change Data Capture (CDC)

Apa itu Change Data Capture ?


Salah satu kendala di dalam implementasi data warehouse adalah mengambil data-data transaksi yang mengalami perubahan dari titik pengambilan terakhir saat proses data warehousing. Hal ini dikenal dengan nama proses pengambilan data yang berubah atau Change Data Capture (CDC).

Solusi


Untuk beberapa vendor BI pemecahan masalah ini mungkin sederhana seperti membuat kolom timestamp baru baik pada tabel yang akan di-capture maupun ke tabel lain. Kolom ini kemudian akan dipopulasi berdasarkan perubahan yang terjadi melalui mekanisme trigger (insert, update dan delete).

Beberapa vendor lainnya mencoba untuk menggantungkan diri pada sistem ERP (Enterprise Resource Planning) dengan memanfaatkan field yang menceritakan update terakhir dari row data terkait. Sebagai contoh misalnya vendor biasanya akan mengambil field seperti creation_date dan updated_date - yang masing-masing mewakili waktu dibentuknya row data dan waktu update terakhir.

Namun solusi ini masih memiliki kelemahan, bagaimana kalau row tersebut dihapus ? Tentunya kita tidak bisa melakukan query terhadap row tersebut lagi dan row data yang berkaitan di data warehouse kita tentu sudah menjadi tidak valid lagi tanpa kita ketahui asal row tersebut.

Solusi lainnya yang "tidak mau ambil pusing" akan mencoba mengambil jalan aman dengan membandingkan satu per satu row dari data warehouse dengan data asalnya. Solusi ini tentunya adalah proses yang sangat lama dan 'mahal'. Bukan saja ini solusi yang tidak tepat tapi hampir mustahil dilakukan atas alasan praktis terutama jika data yang ditangani sudah sangat besar.

Walau pada awalnya bagi sebagian orang masalah capture data ini kelihatan sepele tapi ternyata memang tidak sesederhana yang dipikirkan. Malah pada kebanyakan kasus kita tidak boleh merubah struktur maupun membuat trigger apapun pada database client kita sehingga menjadikan solusi pengambilan data ini menjadi semakin sulit.

Jika ini yang terjadi, maka solusi terbaik yang biasanya dapat dilakukan adalah membuat aplikasi untuk membaca dan menganalisa transaction log dari database yang digunakan sehingga tidak mengganggu data sebenarnya. Transaction log biasanya adalah file yang digunakan sebagai jembatan untuk mencatat transaksi yang dilakukan sebelum dilakukan perubahan ke tabel sebenarnya.

Namun lagi-lagi solusi ini terkendala oleh tidak adanya log file ini pada beberapa sistem database terutama jika itu adalah legacy database system atau sistem database lama seperti XBase.

Masalah lain yang dihadapi dengan pendekatan ini adalah kebanyakan sistem database populer tidak menyertakan dokumentasi ataupun API untuk mengambil informasi dari transaction log-nya seperti contoh MS SQL Server 2000. Jika ini yang terjadi, maka kita terpaksa harus menduga-duga dengan melakukan reverse engineering yang tentunya sangat menghabiskan waktu.

Nah untungnya bagi para teman-teman sesama praktisi data warehousing, sebagian database populer ternyata mendukung fitur CDC ini seperti Oracle 9i ke atas. Berita baik juga untuk para pengguna produk Microsoft SQL Server, sejak versi 2008 fitur CDC sudah disertakan di dalam produk ini.

Produk Pihak Ketiga


Bagaimana untuk produk database server lainnya yang tidak mendukung langsung pembacaan perubahan data ?

Untuk Anda yang serius untuk mendapatkan solusi ini ada beberapa vendor/produk yang mengkhususkan diri di area ini, diantaranya :
  • Attunity , untuk produk seperti DB2, Oracle, Microsoft SQL Server, dan lainnya.
  • Apex SQL , untuk produk Microsoft SQL Server
  • Golden Gate, fiturnya hampir sama dengan Attunity
  • dan lain-lain, untuk list lengkapnya dapat dilihat di situs IT-Toolbox.

Penutup


Change Data Capture (CDC) atau masalah pengambilan data yang berubah dari suatu titik waktu tertentu adalah hal yang cukup krusial di dunia data warehousing. Dengan mengambil strategi populasi bertahap maka kita harus memastikan kalau data yang akan kita ambil pada tahap berikutnya memang berbeda dari data saat terakhir kita melakukan proses.

Dan dengan mengenali dukungan untuk CDC ini pada produk database yang digunakan oleh klien kita dan juga mengetahui adanya solusi pihak ketiga yang menyediakan dukungan ini maka akan menjamin kesuksesan lebih lanjut dari implementasi proyek yang kita lakukan.

Semoga berguna dan sampai jumpa di artikel BI berikutnya...

Feris

Sunday, August 24, 2008

Kettle - Pentaho Data Integration

Dengan popularitas Kettle yang semakin meningkat sebagai solusi ETL open source yang handal oleh berbagai organisasi terkenal di dunia maka penulis merasa perlu menularkan sedikit 'ilmu' dari Kettle ini kepada para komunitas BI di Indonesia yang sudah sangat sering menanyakan tentang produk ini.

Wiki Pentaho Indonesia telah penulis lengkapi dengan pengenalan Kettle mulai dari cara instalasi, cara penggunaan Spoon sebagai utilitas utama dan cara otomatisasi eksekusi melalui utilitas batch script.

Silahkan kunjungi wiki ini yang kebetulan telah berganti wajah yang terkesan lebih cerah dan kontras dengan harapan para pengunjung dapat lebih mudah melakukan navigasi.



Semoga situs wiki ini dapat bermanfaat untuk pemelajaran Kettle lebih baik. Segala komentar dan saran bagi pengembangan wiki ini ke arah yang lebih baik tentunya sangat diharapkan oleh penulis.

Sunday, August 10, 2008

RITECH 8 Agustus 2008

RITECH (Research, Inovation and Technology) Expo diselenggarakan tanggal 8 s/d 11 Agustus 2008. Event ini adalah ajang pameran dan workshop tahunan di bidang riset, inovasi dan teknologi di Indonesia. Untuk Informasi Teknologi tema kali ini adalah mengusung Free Open Source Software (FOSS).

Beruntung, PHI-Integration dapat ikut untuk event RITECH kali ini dengan ikut serta di workshop dengan topik Pengenalan Mondrian sebagai Server OLAP Open Source.

Terima kasih kepada Pak Onno dan juga Bu Antari dan Pak Kemal dari kementerian RISTEK (Riset dan Teknologi) sehingga saya dapat diberi kesempatan untuk berpartisipasi di RITECH kali ini.

Berikut adalah slide presentasi dari PHI-Integration pada event workshop RITECH EXPO tanggal 8 Agustus 2008 pukul 14.00 - 16.00 WIB. Slide ini juga dapat dilihat di wiki Pentaho PHI-Integration.



Saturday, August 9, 2008

Wiki Pentaho Bahasa Indonesia

Dengan semakin antusiasnya komunitas IT di Indonesia terhadap Pentaho dan dengan demikian untuk mengedukasi para praktisi IT yang ingin memulai Pentaho maka PHI-Integration telah membuat sebuah situs wiki khusus untuk produk ini dalam bahasa Indonesia.

Anda dapat mengunjungi wiki tersebut di http://pentaho.phi-integration.com. Format dan tulisan wiki ini mungkin agak sedikit berbeda dengan situs sebelumnya yang ditulis dalam bahasa Inggris. Namun tidak akan mengurangi substansi teknis dari penggunaan Pentaho sebagai solusi BI di perusahaan/instansi Anda.




Saran dan kritikan dari Anda tentunya sangat diharapkan dan dapat dialamatkan ke info@phi-integration.com untuk kesempurnaan dari wiki ini.




Saturday, August 2, 2008

SampleData.org

Sering sekali dalam keterlibatan kita menangani suatu proyek pembuatan sistem atau aplikasi perangkat lunak, maka hal yang sangat membantu adalah ketersediaan contoh data dalam jumlah yang cukup banyak. Contoh data tersebut bisa dalam bentuk cetakan laporan, formulir yang telah terisi, file spreadsheet, legacy data dan sebagainya.

Begitu juga pada saat kita mempelajari suatu sistem penyimpanan data atau database system seperti Microsoft SQL Server, Microsoft Access, MySQL, Oracle, DB2, dan berbagai produk lainnya. Kumpulan contoh data yang baik akan sangat membantu kita dalam memahami suatu sistem dan juga berbagai proses bisnis seperti penjualan, personalia, persediaan barang, dan sebagainya.

Dan beruntung juga untuk kita karena biasanya berbagai sistem database yang telah disebutkan sebelumnya datang dengan berbagai contoh data. Beberapa yang terkenal diantaranya seperti database Northwind dari Microsoft yang tersedia untuk Microsoft Access dan SQL Server, Adventure Works untuk produk SQL Server, Foodmart untuk produk SQL Server dan Microsoft Analysis Server, Sakila untuk MySQL, dan sebagainya.

Namun sebagai implementor dari beberapa produk business intelligence atau data management, pada saat presentasi ke client atau pun pada saat ingin transfer knowledge kita sering sekali membutuhkan berbagai contoh kasus data yang agak sulit untuk diambil dari contoh-contoh data yang telah disebutkan tersebut.

Untuk mengatasi hal tersebut, saya beberapa kali harus merancang dan megenerasi sendiri contoh data dengan menggunakan aplikasi spreadsheet seperti Microsoft Excel dan OpenOffice Calc. Atau juga dengan menggunakan kode program khusus yang dibuat sendiri.

Dan ini membuat saya berpikir bahwa kasus yang dihadapi oleh kami (PHI-Integration) pastilah tidak unik. Apalagi oleh vendor atau perusahaan yang bergerak di bidang teknologi informasi ataupun dosen dan mahasiswa jurusan ilmu komputer.

Hal ini mendorong saya untuk berinisiatif memulai proyek pembuatan berbagai contoh data dengan model kolaborasi. Hasil dari proyek ini bisa berupa contoh data dengan lisensi open source maupun proprietary - gratis maupun berbayar.

Proyek tersebut kami namakan sama dengan nama domain dari proyek tersebut, yaitu SampleData.org.

Adapun visi dan misi dari proyek tersebut cukup sederhana, yakni menyediakan ketersediaan contoh data dengan berbagai format data sehingga dapat dimanfaatkan oleh berbagai kalangan untuk penggunaan seluas-luasnya.

Hal ini mudah-mudahan dapat menimbulkan efek jangka panjang bahwa dengan contoh data yang melimpah dan berdasarkan best practice dari para kolaboratornya akan menelurkan banyak aplikasi yang baik terutama bagi pengembang aplikasi tingkat pemula.

Untuk Anda yang berminat untuk kolaborasi di proyek ini, silahkan mengunjungi situs proyek ini di sampledata.org atau turut berdiskusi di grup sample-data dengan mengirimkan email ke sample-data-subscribe@googlegroups.com.

Salam,

Feris Thia