Extract(Read) > Transform(Test&Apply) > Load(Learn) Blog

August 23, 2010

Oracle veri madenciliği seçeneğine giriş(Getting started with Oracle Data Mining option)

Filed under: Oracle Business Intelligence — H.Tonguç Yılmaz @ 5:18 pm

Önceki Türkçe yazıma gösterdiğiniz ilgi için teşekkürler, umarım TROUG’nin yolu açık olur ve hepimize önemli katkı sağlar bu grup. Hazır başlamışken bir süre Türkçe yazmaya devam edelim istedim, umarım hoşunuza gider :)

Bu yazı ile veri madenciliğini merak eden arkadaşlara giriş yapabilecekleri kaynaklara nasıl ulaşabilecekleri hakkında fikir vermek istedim. Biliyorsunuz belki bu sene OOW’de bir sunumumuz olacak, bir süredir SAS kullanıcısı olan Turkcell’de In-Database Data Mining denemeleri yapıyorduk, sonuçlarını Deniz paylaşıyor olacak, gidenlere şimdiden reklamını yapmak istedim.

TurkCell’s Pre-paid Churn Prediction Model with Oracle Data Mining option on ExadataV2, OOW10 21 Sep. 12:30 -13:30 Moscone South

Öncelikle neden veri madenciliği diye bir soru akla gelebilir, hemen bu yazı fırsatı ile güzel Türkçe’siyle Burak’ın yazılarını paylaşmak istiyorum muhtemel cevaplar için. Ve eğer cidden bu konuya ilgili iseniz Oracle® Data Mining Concepts(11.2) kılavuzuna mutlaka göz atmanızı öneririm.

Peki neden Oracle ile veri madenciliği diye bir soru da akla gelebilir, özelliklede bu seçeneğin Enterprise Edition üzerine ayrıca ek maliyet ile alınabilecek seçenekler listesinde olduğunu düşünürsek, Oracle’ın savı eğer üzerinde çalışacağınız veri hazırda veritabanı içinde ise veritabanı içinde veri madenciliğini başlamak ve tamamlamak önemli bir avantaj. Bu pazarda Oracle ve diğerlerinin en önemli rakipleri SAS, Oracle’ın dünya BI veritabanı pazarındaki konumunu düşünürsek çok keskin bir rekabet avantajı oluşturduğunu Oracle’a bu yaklaşımın hemen hissedebilirsiniz. SAS lisans maliyetlerinin Oracle Data Mining seçeneği lisans maliyetleri ile kıyaslanamayacak kadar pahallı olduğunu da belirtmekte fayda var tabii bu noktada.

Hazırda Oracle veritabanı kullanıcısı iseniz 12 adet hazır machine learning algoritması ve XE dahil tüm sürümlerde ek ücret ödemeden kullanabileceğiniz 50+ statistical function keşfetmeniz için sizi bekliyor. Oracle’da bir veri madenciliği modelini SQL*Plus’dan basit birkaç PL/SQL API çağrımı ile yaratılan ve SQL ile çağrılabilen bir şema nesnesi olarak düşünebiliriz basit anlamda(bir örnek altta fikir vermesi için paylaşıyorum). Elbette bu modeli yaratırken ve çalıştırırken elinizin altındaki Oracle sürümünün tüm kabiliyetlerinden de sonuna kadar faydalanabilirsiniz(Exadata, Parallel Query, Partitioning, Bitmap Index gibi).


-- Faud Prediction Demo
drop table CLAIMS_SET;
exec dbms_data_mining.drop_model('CLAIMSMODEL');
create table CLAIMS_SET (setting_name varchar2(30), setting_value varchar2(4000));
insert into CLAIMS_SET values ('ALGO_NAME','ALGO_SUPPORT_VECTOR_MACHINES');
insert into CLAIMS_SET values ('PREP_AUTO','ON');
commit;
begin
   dbms_data_mining.create_model('CLAIMSMODEL', 'CLASSIFICATION','CLAIMS', 'POLICYNUMBER', null, 'CLAIMS_SET');
end;
/

--Top 5 most suspicious fraud policy holder claims
select * from(
   select POLICYNUMBER, round(prob_fraud*100,2) percent_fraud,
   rank() over (order byprob_frauddesc)rnk from(
      select POLICYNUMBER, prediction_probability(CLAIMSMODEL, '0' using *) prob_fraud
      from CLAIMS
	  where PASTNUMBEROFCLAIMS in ('2 to 4', 'more than 4')))
where rnk<= 5 order by percent_frauddesc; 

Oracle Data Mining seçeneği Enterprise Edition veritabanınızı kurarken sizin için hazır ediliyor, kısa zaman önce Apex’e taşınan Oracle By Example(OBE) Data Mining tutorial’larını takip edebilirsiniz kurulum hızlı bilgileri için. Tutorial yanında kurulum adımlarını detayları ile Oracle® Data Mining Administrator’s Guide (11.2)’dan da takip etmek mümkün. Ama ben bu kurulumlarla uğraşamam şimdi ve merak içindeyim birkaç tur deneme yapmak isterim derseniz de apex.oracle.com benzeri bir cloud düşünülmüş bu seçenek için de; Oracle 11gR2 + Data Mining seçeneği + Oracle Data Miner klasik kullanıcı arayüzü ve örnek datasetler için Amazon Cloud’a erişebilirsiniz(ne yazık ki apex.oracle.com’daki gibi ücretsiz değil ama).

Oracle Data Miner(ODM) ise ücretsiz bir GUI, güncel sürümlerinde çok da başarılı olduğunu iddia etmeyen bu uygulamayı OTN’den indirerek ücretsiz kullanabiliyorsunuz Mining çalışmalarını kolaylaştırması amacı ile. ODM’in yeni sürüm ön yüzleri bu OOW’de yüksek ihtimal ile OTN’den indirilebilir olacağını düşündüğüm SQL Developer’ın yeni sürümü ile entegre olacak, SAS ile rekabete odaklanmış bir sürüm bu, ekran görüntüleri için Oracle Data Mining Blog’a göz atabilirsiniz, SAS kullanıcılarının vazgeçilmezi GUI kabiliyetleri motivasyonunu ekarte edebilmek için tıpa tıp benzerlikler göreceksiniz. Yine bu Blog’da yeni sürüm ile SAS modellerini Oracle’a otomatik taşımaya imkan veren DBMS_DATA_MINING.IMPORT_MODEL örneklerini de bulabilirsiniz, özetle anlayacağınız saldırı çok sağlam :)

Giriş için bu kadar bilgi yeterli sanırım, eksik olmasın bir de herhangi bir sorun yaşadığınızda sorularınıza ücretsiz bir üyelik alarak hızla cevap alabileceğiniz OTN Data Mining forumu ve Oracle® Data Mining Application Developer’s Guide (11.2)’dan bahsetmemiz yerinde olur. Eğer ilgi görürse bu yazımı örnekler ile bu doküman üzerinden ilerletmeyi düşündüm.

Kaynakça: Oracle Data Mining 11g Release 2 Overview and Demo presentation – Charlie Berger, Sr. Director Product Management at Oracle, Data Mining Technologies

Not: Konu hoşuma gitti ama Oracle değil de açık kaynak ne var, okulda proje amaçlı Java ile felan ne kullanabiliriz derseniz de Weka’ya göz atmanızı öneririm.

1 Comment »

  1. Weka’da kullanılmak üzere http://archive.ics.uci.edu/ml/datasets.html adresinden veri setleri indirilebilir.
    Weka ile bir örnek uygulama: http://maya.cs.depaul.edu/~classes/ect584/weka/

    Comment by ilovedatabase — August 23, 2010 @ 10:53 pm | Reply


RSS feed for comments on this post. TrackBack URI

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Create a free website or blog at WordPress.com.

%d bloggers like this: