Veri madenciliği

Basit bir tanım yapmak gerekir ise veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecek ile ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği deyimi yanlış kullanılan bir deyim olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (knowledge mining from databases), Bilgi çıkarımı(knowledge extraction), data/pattern anaysis (veri ve örüntü analizi), veri arkeolojisi gibi.

Bunların arasındaki en popüler kullanım Veritabanlarında Bilgi Keşfi (VBK – Knowledge Discovery From Databases – KDD) ‘dir. Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar:

1- Veri Temizleme (gürültülü ve tutarsız verileri çıkarmak)
2- Veri Bütünleştirme (birçok veri kaynağını birleştirebilmek)
3- Veri Seçme (Yapılacak olan analiz ile ilgili olan verileri belirlemek )
4- Veri Dönüşümü (Verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
5- Veri Madenciliği (Veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
6- Örüntü Değerlendirme (Bazı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
7- Bilgi Sunumu (Madenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek),

Veri madenciliği adımı, kullanıcı ve bilgi tabanı ile etkileşim halindedir. İlginç örüntüler kullanıcıya gösterilir, ve bunun ötesinde istenir ise bilgi tabnına da kaydedilebilir. Buna göre, veri madenciliği işlemi, gizli kalmış örüntüler bulunana kadar devam eder.

Bir veri madenciliği sistemi, aşağıdaki temel bileşenlere sahiptir: ·Veritabanı, veri ambarı ve diğer depolama teknikleri ·Veritabanı ya da veri ambarı Sunucusu ·Bilgi Tabanı ·Veri Madenciliği Motoru ·Örüntü Değerlendirme ·Kullanıcı Arayüzü

Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.

Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir.

Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılması ile ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.

Veri madenciliğini istatistiksel bir yöntemler serisi olarak görmek mümkün olabilir. Ancak veri madenciliği, geleneksel istatistikten birkaç yönde farklılık gösterir. Veri madenciliğinde amaç, kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bağlamda, veri madenciliği insan merkezlidir ve bazen insan – bilgisayar arayüzü birleştirilir.

Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı işlem gibi temelleri de içerir.

Veri madenciliği konusunda bahsi geçen geniş verideki geniş kelimesi, tek bir iş istasyonunun belleğine sığamayacak kadar büyük veri kümelerini ifade etmektedir. Yüksek hacimli veri ise, tek bir iş istasyonundaki ya da bir grup iş istasyonundaki disklere sığamayacak kadar fazla veri anlamındadır. Dağıtık veri ise, farklı coğrafi konumlarda bulunan verileri anlatır.
Devamını oku “Veri madenciliği”

Olasılıklar Evreni

deney_tupuTermodinamiğin kanunlarını bilirsiniz. Bu kanunların sonucuna göre şöyle bir cümle kurabiliriz.

“Düzensizlik ya değişmez ya da artar.”

Her ne kadar bir kesinliği içerse de gerçekte durum tam olarak bu değildir. Basit bir örnek üstünden gitmeye çalışalım.

Odanın bir köşesine konmuş içinde Klor gazının bulunduğu ucu açık bir tüp düşünelim. Tüpün içinde bulunan klor gazının odaya dağılıp dağılmaması durumunu bu kanunlar ışığında gözlemleyelim. Termodinamiğe göre entropi artışı olacak ve klor gazı mutlaka odaya yayılacaktır.

Aslında işin özünde farklı bir matematiksel süreç yatar. Klor gazının odaya yayılması sadece bir olasılıktır. Fakat tüp içinde kalma olasılığı yayılma olasılık dağılımına göre çok çok daha düşük olduğu için (trilyonda birden daha da küçük) gerçekleşmesi ihtimali zordur. Ama imkansız değildir.

bozuk_para

Olasılık kuramları 1900 lü yıllarda gelişip yeni bir bilim dalı olan “istatiksel mekanik” geliştirilmiştir. Termodinamik değerlerden sapmalarla bu teori defalarca ispatlanmıştır.

Bunu para örneği ile açıklayabiliriz. Diyelim ki aynı anda bir milyon bozuk para atılıyor. Hepsinin tura gelme olasılığı vardır. Daha eşit bir dağılımların yüzdesi ise çok daha fazladır. Fakat sonuçta gelen parça dağılımı ne olursa olsun aslında hepsinin tura gelmesiyle aynı olasılığa sahip bir dağılım olacaktır.

Yani kısacası şu; Her olay, milyarlarca olasılıktan sadece birisidir ve yaşadığımız bu evren tamamen matematiksel olasılıklar evrenidir.

Bulanık Mantık

BULANIK MANTIĞIN TARİHÇESİ

Bulanık ilkeleri ilk olarak oluşturan 1965 yılında Azerbaycanlı Lütfi Askerzadedir.Ancak bu ilkeler batı dünyasında şüpheyle karşılanmıştır.Çünkü batı kültürünün temeli “Aristo mantığına” dayanmaktaydı ve bir çok batılıya göre mantık kelimesinin “bulanık” kelimesiyle ifade olunuşu başlı başına mantıksız bir şeydi.Karşı çıkanlar çoğunlukla ihtimaller hesabı üzerine çalışanlardı.Onlara göre bulanık mantığın açıkladığını ifade ettiği her şey zaten ihtimaller teorisiyle açıklanabilirdi.

Doğuda ve özellikle Japonya da ise bulanık mantık benimsenmiş ve 1970 li yıllardan sonra teknolojik bir çok aletin yapımında bu ilkeler kullanılmıştır.Çünkü doğuda belirsizlikte bile güzelliklerin bulunabileceği düşüncesi vardır.
Bulanık kavram ve sistemler ilk defa 1975 yılında buhar makinasının kontrol mekanizmasına uygulanmasıyla gerçekleştirilmiştir.

Daha sonraki yıllarda bulanık sistem, bir çimento fabrikasının işletilmesi ve kontrolü için uygulanmıştır.Ayrıca bu sistemler elektronik cihazlara da uygulanarak 1980’ler den sonra dünya geneline yayılmaya başlamıştır.Günümüzde çamaşır,bulaşık makinaları,elektirikli süpürgeler,asansörler,metrolarda ve şirket işletimi gibi konularda bu ilkeler uygulanmaktadır.

Bulanık mantık sibernetik ve yapay zeka çalışmalarında da etkin rol oynamaktadırlar.
Devamını oku “Bulanık Mantık”