Veritabanları Hakkında Temel Bilgiler
Download -> ilknur_koksal2
VERİTABANI NEDİR?
Birbirleri ile ilişkili verilerin tutulduğu,saklandığı, depolandığı yerdir.
Veritabanı tablolardan, tablolar satır ve sütunlardan oluşur.
Birçok veri saklama yazılımı mevcuttur.Önemli nokta veriyi verimli ve hızlı bir
şekilde yönetip değişikliğe olanak sağlamasıdır.
Örneğin; Ms Access,Sql Server Oracle,Postresql,mysql,DB2
Veri Nasıl Saklanır ?
Veritabanında girdiğimiz kayıtlar, disk üzerinde saklanan ve veritabanı yazılımına göre
farklı formatta bulunan dosyalardır.
Bu dosyalar oracle da .dbf ,sql server da .mdf , access de .mdb uzantılı olarak
tutulmaktadır.
En basit örneği excel dosyamız satır ve sütunlardan oluşmaktadır ve .xls uzantılıdır.
Veri Güvenliği
Verilere erişimdeki hız kadar güvenlikde önemlidir.
Yetkisi olmayan kişilerin eline izinsiz geçen şifreler veritabanının silinmesine kadar
gidebilir.
İşletmelerde her departmana göre yetkilendirme yapmak, güvenlik açısından önem arzeden
finans, muhasebe, arge verisini korumak veritabanı yöneticisinin görevidir.
Bu sebeple veriler fiziksel olarak saklanırken mantıksal olarak da bir hiyerarşiye sahip
olmalıdır.
Bu yetkilendirme veritabanı yöneticileri tarafından yapılmaktadır.
Veritabanı Yöneticisinin Görevleri Nelerdir ?
Veritabanının kurulumundan, gerekli konfigürasyonunun yapılması, bakımı, performansı ve
güvenliğinden sorumlu olan kişidir.
Bir veritabanı yöneticisi hergün düzenli olarak database’ i izlemeli performans ölçümlerini
almalı datanın büyüme grafiğine göre disk planını yapmalıdır.
Kullanıcı hataları ve sistem hatalarına karşı geri dönüş için recovery,yedekleme için
backup metodlarını hazırlamalıdır.
Veritabanı Yönetim Sistemimizi Seçerken Nelere Dikkat Etmeliyiz ?
Bu veritabanı ile neler yapacaksınız ?
Küçük bir şirket çalışanlarının özel
bilgileri mi tutulacak, yoksa büyük bir şirketin milyarlarca bilgisi mi ?
Aynı anda kaç işlem yapılacak?
Verilerimin güvenliği ne ölçüde olmalı ?
Şu anda ne kadar verim var ? 1 yıl ,5 yıl, 10 yıl sonra ne kadar olacak ?
Bütçeden bir vtys için ne kadar ayırabilirim ?
Kullandığım uygulama vtys ile uyumlu mu ?
Ms Access
Microsoft firmasının Office paketi içinden çıkan Access, paralı veritabanları arasında
ucuz olarak göze çarpar.
Küçük ölçekli uygulamalardaki gereksinimlerinizi karşılayabilir.
Eğer bir web sitesinde veri miktarı ve aynı
anda yapılan işlem sayıları az ise, Access kullanabilirsiniz.
Tek bir veri tablosunda 2 GB a kadar veri depolayabilir ve aynı anda 255 bağlantıya izin
verebilirsiniz.
Access, MS Windows sistemleri dışında kullanılamamakta, bu da kullanım alanını
daraltmaktadır.
“Transaction locking” özelliğine sahiptir, ancak “trigger” ve “stored procedure”
özelliklerine sahip değildir.
MySQL
MySQL, Access ile karşılaştırıldığında daha güvenlidir.
Windows’un yanı sıra Linux, OS/2, Solaris, AIX ve birçok işletim sistemini desteklemesi
nedeniyle çok yaygındır.
Ev kullanıcıları tarafından, kolay kurulumu ve gelen kurulum paketleri nedeniyle sıkça
tercih edilmektedir.
Tablo başına 8 TB veri depolayabilmektedir.
MySQL’ in en büyük dezavantajlarından biri ücretsiz olmasından kaynaklanan destek
eksikliğidir
Özellikle web uygulamaları için cok hızlıdır.
Transaction’ ları desteklemediği için alabildiğine yalındır ve transaction desteği olmadan
gerçekleştirilebilecek web uygulamaları için çok hızlı bir alternatiftir.
MS Sql Server
Yine Microsoft firmasının bir ürünü olan Microsoft SQL Server (MSSQL), iyi bir performansa
sahiptir.
En büyük dezavantajı, sadece Windows üzerinde çalışabilmesidir.
Kullanım kolaylığı, güvenilirliği ve işlem gücüyle dikkat çekmektedir.
Maliyeti diğer veritabanlarına göre yüksektir.
Tablo başına 4 TB veri depolayabilmektedir.
“Transaction locking”, “trigger” ve “stored
procedure” özelliklerine sahiptir.
DB2
IBM firmasının ürünü olan DB2, Access ve MySQL e göre daha performanslı,
ancak küçük işletmelere göre daha yüksek maliyete sahiptir.
Windows ve *nix
sistemlerinde çalışabilir.
“Transaction locking”, “trigger” ve “stored procedure” özelliklerine sahiptir
PostgreSQL
PostgreSQL, veritabanları için ilişkisel modeli kullanan ve SQL standart sorgu dilini
destekleyen bir veritabanı yönetim sistemidir.
İyi performans veren, güvenli ve geniş özellikleri olan bir DBMS’tir.
Tüm UNIX ya da Unix türevi (Linux, FreeBSD gibi) işletim sistemlerinde ve NT tabanlı
Windows sistemlerde çalışır.
Ücretsiz ve açık kodludur.
PostgreSQL diğer ticari ya da açık kodlu veritabanlarında bulabileceğiniz
özellikleri kapsar.
Oracle
Oracle, dünyanın en güçlü ve güvenilir veritabanı olarak gösterilmektedir, ancak çok yüksek
maliyeti nedeniyle sadece büyük kurumların tercih edebilecekleri bir veritabanıdır.
Windows,Unix,Linux,Solaris,RedHat sistemlerde kullanılabilmektedir.
1 sn 1milyon transaction yapılabilmektedir.
Oracle, sınırsız sayıda tablo ve bir tablonun 32 TB a kadar tablo büyüklüğü destekler.
Neden Oracle ?
Teknik Desteğinin ve know-how bilgisinin sınırsız olması
Platformdan bağımsız çalışabilmesi
Hızı
Güvenlik (İşletim sistemindeki dosyalarınn haklarından,tablodaki tek kayıdı hashing
yöntemi ile şifrelemeye kadar security kontrolleri yapılabilir.)
Text ve number dışında video,audio,complex,spatial,uydu görüntüleri data
ilişkilendirebilir.
Enterprise Manager Console sayesinde yönetimi kolay, Sorgulama dili (sql,pl/sql),Forms ve
Reports ekranları ile kullanımı kolay.
Kullanım Alanları
Bankacılıktan (Merkez Bankası,IMKB,Garanti Bankası,İş Bankası,Yapı Kredi, Finansbank..)
Otomotiv Sanayisine (Ford, Tofaş, Chrysler,Renault, Hyundai..)
Sağlık Bilgi Sistemlerinden(Acıbadem Hastaneleri)
Şirket Yönetimine (ERP,SAP,CRM,E-Business,Google-Earth)
Telekomünikasyon Sistemlerinden (Turkcell,Avea,Vodafone,Telsim..)
Hava Taşımacılığına(THY,Pegasus ) kadar..
Veri Madenciliği
Veri Madenciliği şirketlerin çok büyük veri yığınlarından kritik bilgileri elde etmelerini
sağlar.
Şirketler normal şartlar altında uzun zaman süren araştırmalarla doğruluğu kesin olmayacak
şekilde elde edecekleri bilgiyi Data Mining (Veri Madenciliği) sayesinde kısa sürede ve
kesin olarak elde ederler.
Elde ettikleri bu bilgiyi objektif değerlendirmeler yaparak ya da şirketle ilgili
stratejik kararlar almada kullanırlar.
Bu bilgiler kurumsal veri kaynaklarının iyi analiz edilmesine ve iş dünyasındaki
yaklaşımlara ilişkin tahminlerde bulunulmasına yardımcı olur.
Data Mining sayesinde şirketler stratejik adımlar atarken çok büyük veri yığınları
arasından kendilerine yol gösterecek kritik verileri ayıklayarak analiz edebilirler.
Veri Madenciliği Yöntemleri
Bağıntı Yöntemi
“Çocuk bezi alan müşterilerin %30’u bira da satın alır.”
Sepet analizinde (basket analysis) müşterilerin beraber satın aldığı malların analizi
yapılır. Buradaki amaç mallar arasındaki pozitif veya negatif korelâsyonları bulmaktır.
Çocuk bezi alan müşterilerin mama da satın alacağını veya bira satın alanların cips de
alacağını tahmin edebiliriz .
Otomatik bir analiz bütün olasılıkları göz önüne alır ve kolay düşünülemeyecek,
örneğin çocuk bezi ve bira arasındaki bağıntıları da bulur.
Sınıflandırma Yöntemi
“Genç kadınlar küçük araba satın alır, yaşlı, zengin erkekler büyük, lüks araba satın
alır.”
Amaç bir malın özellikleri ile müşteri özelliklerini eşlemektir. Böylece bir müşteri için
ideal ürün veya bir ürün için ideal müşteri profili çıkarılabilir.
Örneğin bir otomobil satıcısı şirket geçmiş müşteri hareketlerinin analizi ile yukarıdaki
gibi iki kural bulursa genç kadınların okuduğu bir dergiye reklam verirken küçük modelinin
reklamını verir.
Regresyon Yöntemi
“Ev sahibi olan, evli, aynı iş yerinde beş yıldan fazladır çalışan, geçmiş kredilerinde geç
ödemesi bir ayı geçmemiş bir erkeğin kredi skoru 825’dir.”
Başvuru skorlamada (application scoring) bir finans kurumuna kredi için başvuran kişi ile
ilgili finansal güvenilirliğini notlayan örneğin 0 ile 1000 arasında bir skor hesaplanır. Bu
skor kişinin özellikleri ve geçmiş kredi hareketlerine dayanılarak hesaplanır.
Zaman İçinde Sıralı Örüntüler Yöntemi
“İlk üç taksitinden iki veya daha fazlasını geç ödemiş olan müşteriler %60 olasılıkla kanuni
takibe gidiyor.”
Davranış skoru (behavioral score), başvuru skorundan farklı olarak kredi almış ve taksitleri
ödeyen bir kişinin sonraki taksitlerini ödeme/geciktirme davranışını notlamayı amaçlar.
Benzer Zaman Sıraları
“X şirketinin hisse fiyatları ile Y şirketinin hisse fiyatları benzer hareket ediyor.”
Amaç zaman içindeki iki hareket serisi arasında bağıntı kurmaktır.
Bunlar iki malın zaman içindeki satış miktarları olabilir.
Örneğin dondurma satışları ile kola satışları arasında pozitif, dondurma satışları ile
salep satışları arasında negatif bir bağıntı beklenebilir.
Fark Saptanması
“Normalden farklı davranış gösteren müşterilerim var mı?”
Amaç önceki uygulamaların aksine kural bulmak değil, kurala uymayan istisnai hareketleri
bulmaktır.
Olası sahtekârlıkların saptanmasını (fraud detection) sağlar.
Örneğin Visa kredi kartı için yapılan CRIS sisteminde bir yapay sinir ağı kredi kartı
hareketlerini takip ederek müşterinin normal davranışına uymayan hareketler için müşterinin
bankası ile temasa geçerek müşteri onayı istenmesini sağlar.
Döküman Madenciliği
“Arşivimde (veya internet üzerinde) bu dokümana benzer hangi dokümanlar var?”
Amaç dokümanlar arasında ayrıca elle bir tasnif gerekmeden benzerlik hesaplayabilmektir
(text mining).
Bu genelde otomatik olarak çıkarılan anahtar sözcüklerin tekrar sayısı sayesinde yapılır.
Veri Madenciliğinin Faydaları
Bir işletme kendi müşterisi iken rakibine giden müşterilerle ilgili analizler yaparak
rakiplerini tercih eden müşterilerinin özelliklerini elde edebilir.
Bundan yola çıkarak gelecek dönemlerde kaybetme olasılığı olan müşterilerin kimler
olabileceği yolunda tahminlerde bulunabilir.
Onları kaybetmemek, kaybettiklerini geri kazanmak için strateji geliştirebilir.
Ürün veya hizmette hangi özelliklerin ne derecede müşteri memnuniyetini etkilediği, hangi
özelliklerinden dolayı müşterini bunları tercih ettiği ortaya çıkarılabilir.
Müşterilerin kredi riskleri hesaplanarak hangi müşterilerin kredi riskinin yüksek olduğu,
hangi müşterilerin geri ödemesini zamanında yapamayabileceği kestirilebilir.
Kredi kartı ödemelerini aksatan, gecikmeli olarak yapan veya hiç yapmayanların
özelliklerinden yola çıkılarak bundan sonra aynı duruma düşebilecek muhtemel kişiler
saptanabilir.
En karlı mevcut müşteriler saptanarak, potansiyel müşteriler arasından en karlı
olabilecekler belirlenebilir.
Karlı müşteriler tesbit edilerek onlara özel kampanyalar uygulanabilir.
En masraflı müşteriler daha masrafsız müşteri haline dönüştürülebilir . Örneğin en çok
bankacılık işlemi yapanlar ortaya çıkarılıp bunlar şube bankacılığı yerine daha masrafsız
Internet bankacılığına yönlendirilebilir.
Bir ürün veya hizmetle ilgili bir kampanya programı oluşturmak için hedef kitlenin
seçiminden başlayarak bunun hedef kitleye hangi kanallardan sunulacağı kararına kadar olan
süreçte veri madenciliği kullanılabilir.
Sonuç olarak saklanan verinin artması etkin veri yönetimi ihtiyacını ve veri
madenciliği kavramını doğurmuştur.
Etkin veri yönetimi sayesinde daha iyi hizmet verebilir iç ve dış müşterilerin
memnuniyetlerini arttırabiliriz.
Organizasyonun gelecek hedeflerinin tutarlı ve erişilebilir olması için
geçmişini doğru bir şekilde farklı açılardan sorgulayabiliyor ve raporlayabiliyor olması
gereklidir.
Veri madenciliğinin geçmişe yönelik bilgilere ulaşmada etkin kullanımı
şirketlerin geleceklerine yönelik karar süreçlerini kısaltarak doğru kararlar almasını
sağlayacaktır.
Bununda günümüz rekabet şartlarında büyük avantajlar getireceği aşikardır.
Bu konuda ulu önderimizin bir söylemini çok yerinde bulduğumdan kullanmak ister.
Bu konuda ulu önderimizin bir söylemini çok yerinde bulduğumdan kullanmak istedim …
“Geçmişini bilmeyen geleceğine yön veremez.”
Atatürk