İş Zekasının Temelleri: Veri Tabanları ve Enformasyon

advertisement
Bölüm 6
İş Zekasının Temelleri:
Veri Tabanları ve
Enformasyon
Yönetimi
6.1
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları
ve Enformasyon Yönetimi
Öğrenme Hedefleri
• Geleneksel dosyalama ortamındaki veri kaynaklarının
yönetim sorunlarının veri tabanlı yönetim sistemiyle nasıl
çözüleceğinin tanımlandırılması
• Veritabanı yönetim sisteminin değerlendirilmesi ve
yeteneklerinin tanımlanması
• Önemli veritabanı tasarımlarına ilişkin uygulamalar
• İşletme performansı ve karar vermeyi geliştirmek için
veritabanından verilerin alınmasında kullanılan araç ve
teknolojilerin değerlendirilmesi
• Firmaların veri kaynaklarının yönetilmesinde enformasyon
politikası, veri yönetimi ve veri kalitesinin güvenli olması
rollerinin değerlendirilmesi
6.2
© 2010 by Prentice Hall
Bölüm 6 İş Zekasının Temelleri: Veri Tabanları
ve Enformasyon Yönetimi
Geleneksel Dosya Ortamında Organize edilmiş Veri
• Dosya Organizasyonu Kavramı
•
•
•
•
•
Bilgisayar sistemi verileri hiyerarşik olarak gruplar
Alan: Karakteri belirten kelime veya rakamlar
Kayıt: Bir nesneyi açıklayan alan grupları
Dosya: Aynı tip grup kayıtları
Veritabanı: İlgili dosya grupları
• Kayıt: Varlığın tanımlandırılması
• Nitelik: Kişi, yer ve unsurlar hakkında kayıt ettiğimiz enformasyonlar
• Özellik: Her karakteristik yada kaliteyi tanımlandırıcı özelliği
• Örneğin, Ders özelliklerine bağlı olarak not yada tarih yüklenmesi
6.3
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
Geleneksel Dosya Ortamında Organize Edilmiş Veri
Data Hierarchy
A computer system organizes data in a
hierarchy that starts with the bit, which
represents either a 0 or a 1. Bits can be
grouped to form a byte to represent one
character, number, or symbol. Bytes can
be grouped to form a field, and related
fields can be grouped to form a record.
Related records can be collected to form
a file, and related files can be organized
into a database.
Figure 6-1
6.4
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri; Veri Tabanları ve Enformasyon Yönetimi
Geleneksel Dosya Alanlarında Organze Edilmiş Veri
• Geleneksel dosya ortamıyla ilgili problemler (Farklı
departmanlar tarafından dosyaların ayrı ayrı tutulması)
• Veri Tekrarı ve Uyumsuzluk
• Veri Tekrarı : Birçok dosyada yenilenen mevcut veriler
• Veri Uyumsuzluğu: Aynı özelliklerin farklı değerlerle ifade edilmesi
• Program veri bağımlılığı:
• Programdaki değişiklikler program tarafından alınan veride değişiklikler
gerektirir
• Esneklikten yoksunluk
• Düşük güvenlik
• Verilerin uygun hale getirilmesinde ve paylaşılmasındaki
eksiklik
6.5
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Geleneksel Dosya Alanlarında Organize Edilmiş Veri
Geleneksel Dosyalama Süreci
The use of a traditional approach to file processing encourages each functional area in a corporation to
develop specialized applications and files. Each application requires a unique data file that is likely to be a
subset of the master file. These subsets of the master file lead to data redundancy and inconsistency,
processing inflexibility, and wasted storage resources.
Figure 6-2
6.6
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Veri Yönetimine Veri Tabanlı Yaklaşım
• Veri Tabanı
• Bir örgütün elde ettiği veri organizasyonlarını bir çok uygulamayla
merkezileştirilmiş verilerle ve kontrollü yedek veriler yardımıyla
sunulmasıdır.
• Verilerin birçok uygulamada kullanılmak üzere merkezi hale
getirilerek ve veri tekrarı kontrol edilerek toplanması
• Veri Tabanı Yönetim Sistemi
• Uygulamalı programları ve fiziksel veri dosyaları arasında arayüz
olması
• Verilerin mantıksal ve fiziksel görünümlerinin ayrılması
• Geleneksel dosya ortamı programlarının çözülmesi
6.7
• Veri tekrarının kontrolü
• Uygun olmayanların elimine edilmesi
• Veri yönetimi ve veri güvenliğinin yönetiminin sağlanması
© 2010 by Prentice Hall
Bölüm 6 İş zekasının temelleri: Veri Tabanları
ve Enformasyon Yönetimi
Çok Boyutlu İnsan Kaynakları Veri Tabanları
A single human resources database provides many different views of data, depending on the information
requirements of the user. Illustrated here are two possible views, one of interest to a benefits specialist and
one of interest to a member of the company’s payroll department.
Figure 6-3
6.8
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İlişkisel Veri Tabanı Yönetim Sistemleri (VTYS)
• İki boyutlu olarak adlandırılan tabloların birbirleriyle olan ilişkilerinin ve
dosyaların veri olarak sunulmasını sağlar.
• Herbir tablo birimler ve özelliklere ilişkin veri içerir
Tablo: Sütun ve satırlardan oluşur
• Veri Grupları-alanlar (Satırlar): Farklı birimlerin kayıtları
• Alanlar (Sütunlar) : Birimlere ilişkin özelliklerin gösterilmesi
• Anahtar Alan: Her kaydın tekil olarak tanımlanmasında kullanılan anahtar
alanlar
• Birincil Anahtar: Dosyaların anahtarı için tablodaki alanların kullanılması
• Yabancıl (İkincil anahtar):
6.9
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İlişkisel Veritabanı Tablosu
A relational database organizes data in the form of two-dimensional tables. Illustrated here are tables for
the entities SUPPLIER and PART showing how they represent each entity and its attributes.
Supplier_Number is a primary key for the SUPPLIER table and a foreign key for the PART table.
Figure 6-4A
6.10
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İlişkisel Veritabanı Tablosu (devamı)
Figure 6-4B
6.11
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
VTYS ile ilişkili yönetimler
• Kullanışlı veri toplulukları geliştirilmesinde kullanılan 3 temel
operasyonlar
• Seçim: Kriterleri karşılayan kayıt altına alınan tüm verilerin
alt kümelere ayrıştırılması
• Birleştirme: Kullanıcılara ulaşılabilir bireysel tablolardan
daha çok enformasyonla birlikte ilgili tabloların kombine
edilerek kullanıcıya sunulmasıdır.
• Proje: Yalnızca özel enformasyonlarla birlikte oluşturulan
tablolarda altküme sütunlarının oluşturulması.
6.12
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İlişkisel VYTS’nin 3 Temel Operasyonları
The select, project, and join operations enable data from two different tables to be combined and only
selected attributes to be displayed.
Figure 6-5
6.13
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
Nesne Yönelimli VYTS
• Nesne olarak işlemlerin ve verilerin kayıt altına alınabilmesi,
• Mültimedya uygulamalarını, grafikleri ve Java uygulamalarını
yönetebilmektedir,
• Nesnel yönelimli VYTS’ler ilişkisel VYTS’lere göre göreceli olarak
çok sayıdaki işlemleri yürütmesi açısından daha yavaştır.
• Hibrit nesne- İlişkisel VYTS: Hem nesnel yönelimli hem de
ilişkisel VYTS’lerin kapasitelerini karşılamak için
kullanılabilmektedir.
6.14
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
• Veri Tabanı Yönetim Sistemlerinin Yetenekleri
• Veri tanımlama yeteneği: Veri tabanı tabloları oluşturmak ve her
tablodaki alanların özelliklerini tanımlamak için kullanılabilmektedir,
• Veri sözlüğü: Veri unsularının tanımların ve özelliklerini depolayan
otomatik veya kullanıcı tarafından girilen bir dosyadır,
• Veri işleme dili: Veriyi eklemek, silmek, değiştirmek ve veriyi
geri almak için kullanılan veri işleme dilidir,
• Yapılandırılmış sorgu dili (SQL)
• Microsoft Access genelleştirmek için kullandığı araçlardır, SQL
• Birçok VYTS rapor üretim imkanını içermektedir. Crystal reports
büyük işletme VYTS’si için gözde bir rapor üreticisidir.
6.15
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Microsoft Access Veri Sözlüğü Özellikleri
Figure 6-6
Microsoft Access has a
rudimentary data dictionary
capability that displays
information about the size,
format, and other
characteristics of each field
in a database. Displayed
here is the information
maintained in the SUPPLIER
table. The small key icon to
the left of Supplier_Number
indicates that it is a key field.
6.16
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
SQL sorgu örneği
Illustrated here are the SQL statements for a query to select suppliers for parts 137 or 150. They produce a
list with the same results as Figure 6-5.
Figure 6-7
6.17
© 2010 by Prentice Hall
Yönetim Bilişim Sistemleri
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Bir Access Sorusu
Illustrated here is how the query in Figure 6-7 would be constructed using query-building tools in the
Access Query Design View. It shows the tables, fields, and selection criteria used for the query.
Figure 6-8
6.18
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
• Veri Tabanlarının Tasarlanması
• Kavramsal (mantıksal) dizaynı: İş perspektifi açısından soyut bir
modeldir,
• Fiziksel Dizayn: Veri tabanının doğrudan erişim saklama aygıtından nasıl
düzenlendiğini göstermektedir.
Tasarım sürecinin tanımlanması
• Veri elemanları arasındaki ilişkileri ve işletmenin enformasyon
ihtiyaçlarını karşılamak için veri elemanlarını bir arada gruplamanın en
etkili yolu
• Normalleştirme
• Verilerin karmaşık gruplarından küçük, değişmez, ancak esnek ve
adapte edilebilir veri yapıları oluşturma işlemine normalleştirme
denmektedir.
6.19
© 2010 by Prentice Hall
Yönetim Bilişim Sistemleri
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Siparişe göre normalleştirilmemiş bir ilişki
An unnormalized relation contains repeating groups. For example, there can be many parts and suppliers
for each order. There is only a one-to-one correspondence between Order_Number and Order_Date.
Figure 6-9
6.20
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Siparişe İlişkin Normalleştirilmiş Bir Tablo
After normalization, the original relation ORDER has been broken down into four smaller relations. The
relation ORDER is left with only two attributes and the relation LINE_ITEM has a combined, or
concatenated, key consisting of Order_Number and Part_Number.
Figure 6-10
6.21
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi
• Varlık – İlişki diyagramı
• Veri tabanları tedarikçi ödeme, siparişleri işleme, müşterileri takip
etme ve çalışanları ödeme gibi temel işlemleri takip etmek için
kullanılır.
• Varlıklar arasındaki ilişkilerin gösterilmesi
6.22
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
Bir Varlık İlişki Diyagramı
This diagram shows the relationships between the entities ORDER, LINE_ITEM, PART, and SUPPLIER that
might be used to model the database in Figure 6-10.
Figure 6-11
6.23
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
• Veri Tabanlarının Dağılımı
• Veri Tabanı Dağılımlarının 2 Temel Metotları
• Bölmeli: Veri tabanlarının farklı bölümlere ayrıştırılması
• Tekrarlanan: Merkezi veritabanının farklı yerlerle ilişkili
olarak yinelenmesi.
• Avantajları
• Daha Az Güvenlik Açığı
• Daha Hızlı Yanıt
Olumsuzluklar
• Standart tanımlamalar kullanılarak açıklanması
• Güvenlik Sorunları
6.24
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi arttırmada veri tabanlarının kullanılması
• Çok geniş veri tabanları ve sistemlerin özel
yeteneklere ve gereksinimlere gereksinimi
• Geniş miktarda vergi analizi
• Birden fazla sistemden gelen veriye erişim
• 3 kilit teknik:
• Veri ambarı
• Döküman (Metin) Madenciliği
• Web Madenciliği
6.25
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi arttırmada kullanılan veri tabanlarının
kullanılması
• Veri ambarı:
• Birçok ana operasyonel geçiş sistemlerinden bugünkü ve
geçmişteki verilerin depolanması,
• Girişimcilik için bilginin toplanır ve standardize edilebilir, fakat veri
değiştirilemez,
• Veri havuzu sistemi sıralama, analiz ve rapor eden araçları
sunacaktır.
• Veri aşamaları:
• Çeşitli veri ambarı
• Özel sayıdaki kullanıcı için firma verisine yüksek düzeyde
odaklanılarak kullanım için özetlenir,
• Tipik olarak bir özne yada belirli bir iş alanı üzerinde odaklanılır,
6.26
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansı ve karar vermede kullanılan veri tabanları
Veri havuzunun parçaları
The data warehouse extracts current and historical data from multiple operational systems inside the
organization. These data are combined with data from external sources and reorganized into a central
database designed for management reporting and analysis. The information directory provides users
with information about the data available in the warehouse.
Figure 6-13
6.27
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
• İş Zekası:
• Kullanıcılara daha iyi iş kararları vermeleri için geniş
miktarda bilgiye erişimlerini sağlayan, analiz eden ve
bunları bir araya getiren araçlar,
• Örneğin, Harranın eğlence merkezinin müşterilerin oyun
profilini geliştirme ve çok karlı müşterileri belirlemek için
yaptırdığı analiz,
• Araçların prensip olarak içerdikleri;
- Raporlama
6.28
Veri madenciliği
Çevrimiçi Çözümlemeli İşleme (OLAP)
Web madenciliği
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş Zekası
Figure 6-14
A series of analytical tools
works with data stored in
databases to find patterns
and insights for helping
managers and employees
make better decisions to
improve organizational
performance.
6.29
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
• Çevrimiçi Çözümlemeli İşleme (OLAP)
• Çok boyutlu veri analizlerinin desteklenmesi
• Çok boyutları kullanarak verileri görüntüleme
• Her açıdan bilginin farklı bölümlendirilmesi (Ürün, fiyat,
maliyet, bölge, zaman periyodu)
• Örneğin; Haziranda doğuda kaç pul satıldığının diğer
bölgelerle karşılaştırılması?
• Online analitiksel işlemler o anda oluşturulan sorulara
hızlı ulaşılabilinir, online cevaplar sağlar.
6.30
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
Çok Boyutlu Veri Modeli
Figure 6-15
The view that is showing is
product versus region. If
you rotate the cube 90
degrees, the face that will
show is product versus
actual and projected sales. If
you rotate the cube 90
degrees again, you will see
region versus actual and
projected sales. Other views
are possible.
6.31
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
• Veri Madenciliği:
• OLAP’dan daha fazla keşif sağlar
• Çok büyük veritabanlarında gizlenmiş yapıları ve ilişkileri
bulur ve gelecekteki davranış tahminine ilişkin kuralları
belirler
• Örneğin: Bire bir pazarlama kampanyaları için müşteri
veritabanındaki ilişkilerin bulunması veya karlı müşterilerin
tanımlanması
• Veri madenciliğinden elde edilen enformasyon türleri:
• İlişkiler
• sıralama
• sınıflandırma
• Kümeleme
• Tahmin
6.32
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
• Öngörülebilir Analizler
• Veri madenciliği teknikleri, tarihsel veri, ve tahmin edilen dış
çevre olaylarının gelecekteki koşullar hakkındaki
varsayımların kullanılması.
• Örneğin, Olası müşteri sunulan tekliflere cevap verir yada
özel ürün zatın alır.
• Metin madenciliği
• Büyük yapılandırılmamış veri kümelerinden anahtar elementlerin
ayrılması (Örn. e-mailler saklanır)
6.33
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
Web madenciliği
• Faydalı kalıp ve bilgilerin internetten keşfedilmesi ve analiz edilmesi,
• Örn. Müşteri davranışlarını anlamak, We sitesinin etkinliğini
değerlendirmek vb.
• Teknikler
• Web içerikli madenciliği
• Bilginin Web sayfalarının içeriğinden seçilip çıkarılması
• Web yapı madenciliği
• Örn, Web sayfasından ve linklerden
• Web kullanım madenciliği
• Web sunucusu tarafından kaydedilen kullanıcı etkileşim verileri
6.34
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
• Veri tabanları ve Web’ler
• Birçok şirket mevcut müşteri ya da ortakları için bazı
içsel veri tabanlarını oluşturabilmek için Web’i
kullanırlar.
• Tipik yapılandırma içerikleri:
• Web sunucusu
• Uygulama sunucusu/katman/CGI betikleri
• Veri tabanı sunucusu (hosting DBM)
• Veri tabanı erişimi için Web kullanılmasının avantajları:
6.35
• Tarayıcı yazılımının kullanım kolaylığı
• Web ara yüzü veri tabanında çok az değişiklik gerektirir yada
hiç değişiklik gerektirmez,
• Sisteme ara yüz eklemek pahalı değildir.
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve
Enformasyon Yönetimi
İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları
Linking Internal Databases to the Web
Users access an organization’s internal database through the
Web using their desktop PCs and Web browser software.
Figure 6-16
6.36
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon
Yönetimi
Veri Kaynaklarının Yönetimi
• Bilgilendirme politikasının oluşturulması
• Firma kuralları, prosedürleri, paylaşılan, yönetilen, standartlaştırılan veri
için roller. Örn. Çalışanların hassas çalışan bilgilerini güncellemesi için
sorumluluğu nedir ?
• Veri Yönetimi: Veri yönetiminde prosedür ve özel politikalar için firma
fonksiyonu sorumluluğu
• Veri yönetimi: özellikle hükümet düzenlemeleriyle ilgili olarak girişimci
verilerin elde edilebilirliği, kullanımı, entegrasyonu ve güvenliği için
politikalar ve işlemler,
• Veri tabanı yönetimi : Veri tabanının Tanımlama, organize etme,
uygulama, muhafaza edilmesi; Veri tabanı dizaynı ve yönetim grupları
tarafından performans gösterilmesi
6.37
© 2010 by Prentice Hall
Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon
Yönetimi
Veri kaynaklarının yönetimi
• Veri kalitesinin sağlanması
• Fortune dergisinde yer alan 1000 şirketin % 25’ten
fazlasının veri tabanları oluşturulmamış ya da
tamamlanmamıştır.
• En çok veri tabanı problemleri yanlış girişten
kaynaklanmaktadır.
6.38
© 2010 by Prentice Hall
Download